据外媒MIT Tech Review报道,谷歌在图像处理方面有望再获突破,可对不含地理信息的图片实现精确地理定位。
报道称,该项目名为PlaNet,由谷歌计算机视觉处理专家托拜斯·韦扬德(Tobias Weyand)主导开发。通过对图片进行像素级分析的基础上,与图片库中的存储数据进行像素比对,以实现二者之间的最佳匹配。
谷歌让计算机模拟了这个推理的过程。工程师们首先挑选了全世界人口密集、或者摄影师常去的地区,排除了人迹罕至的荒郊野岭和海洋,之后将这些区域划分成26000个大小不一的方块。
接下来,工程师从网上找来1.26亿张包含GPS信息的图片当做“食材”,投入到机器学习算法之中,让计算机去认识、学习不同地方的图片有哪些特征。每一张图都会对应一个区域方块,这些信息构成了庞大的数据库,机器人相当于掌握了判断事物的“经验和知识”,可以根据图片里的细节判断地理位置了。
研究团队用 Google街景和Flickr做了测试,结果显示,虽然不能全部判断正确,但这台机器人已经具备了类似人类大脑判别位置的能力。
据统计,PlaNet所使用的图片库包含9000万张地理信息图片。通过对230万张图片进行测试分析,PlaNet对图片时间信息的辨识度为28.4%,对图片地理位置的辨识度为48%。虽然测试水平还有待进一步提高,但相比于人工辨识,该项目的效率显然更高。随着项目进展,PlaNet有望进一步提高辨识成功率。