Google里有远见的领导者已经向其计算机里注入了他们的愿景。
为了支撑其已经引人瞩目的图像和物体识别领域的领导地位,搜索巨头并购了法国创业公司Moodstocks,该公司擅长于智能手机里的基于机器学习的图像识别技术。
“我们的梦想是将摄像头调优成智能传感器来赋予机器眼睛,让它们能够感知周围的环境,” Moodstocks在其声明中这么说。
Google收购Moodstocks是其“人才并购”中的最新手笔,这样的并购涉及基于机器学习的图像识别,这是计算机视觉领域的核心组件。Amazon在今年初收购Orbeus、Twitter几周前收购了Magic Pony Technology,这起收购发生在这之后,这反映出了业界观察家们所描述的科技领导者间的竞争,他们都在尝试加速商业化下一个计算机相关的前沿领域。
“科技公司已经投资了大量时间和金钱来理解互联网文本,”Forrester Research的首席分析师Mike Gualtieri在一封邮件里写到。“他们现在想要理解图像,这十分自然。通过文字和图像的组合意思所能够提供出的AI,不仅仅能够理解文字(语音),而且能够进行图像识别。”
比如,Google已经传闻在开发能够让用户仅仅用图像作为搜索词,直接从照片里进行搜索的功能。Google希望能够利用Moodstocks的人才力量——他们将会加入Google位于巴黎的现有的研究和开发团队,来帮助进一步推进计算视觉领域的研究。
“我们已经在视觉识别方面有了很大的成功,” Vincent Simonet写到,他是Google法国研究和开发中心的老大,“但是该领域还有很多事情需要完成。”
大数据引领图像识别的新纪元
Google Photos——以及Facebook,Flickr和其他处理图像分类和标记的公司,已经在后台采用了先进的图像识别技术,但是“这些方案还能够更快,更高效,并且要求更少的训练资源,” Tomasz Malisiewicz博士也同意这一点,他是Magic Leap Inc.深度学习领域的首席软件工程师,这是一家位于佛罗里达州的致力于增强现实技术的创业公司。
“在图像识别的全新的深度学习时代里,计算视觉团队的整个概念都在被重构,” Malisiewicz说。“当算法开发还依靠人工的时候,拥有强大的博士团队来引导开发是十分重要的。但是随着深度学习软件的商业化,大部分开发人员都能够使用今年最流行的神经网络架构来训练识别模型。”
这个新时代的图像识别领域里至关重要的就是数据——大量数据。
“关注点已经从算法设计本身转移到大规模数据管理上,因为性能最好的模型要求海量的数据,” Malisiewicz说。
重构视觉世界
对于公司而言,除了海量数据之外,这里面还有些什么?分析师指出,基于机器学习的图像识别用例不仅仅是简单的分类,比如找到个人家庭照片或者在购物分类里缩小产品类型。
该技术拥有变革医疗行业的可能性,比如,通过医疗图像帮助医生诊断疾病。另外,增强和虚拟现实的可穿戴设备需要使用摄像头来感知周围的世界,能够受益于图像识别和改进的跟踪功能,Malisiewicz说。
基于机器学习的图像识别能够帮助企业自动化运维功能,比如监控,实地检测以及其他任何涉及持续或者周期性检查的事情,Forrester的Gualtieri说。
计算视觉领域的进步所带来的可操作数据开启了企业盈利的新机遇,Matthew Zeiler这么认为,他是Clarifai的创始人和CEO,这是一家擅长于视觉识别的AI公司。
“他们还能够从之前未标记的信息源里收集信息,这些信息源是没有任何描述,元数据或者标签的图像和视频,”他补充道。
还会带来一些其他的好处。计算视觉仍然是相对新的领域,积极探索很重要,密歇根大学电子工程和计算机科学的副教授Jason Corso博士说。
“很重要的一点是,要注意到这些进步和商业案例很少涉及可能的市场和问题。我们的世界是视觉世界;对于未来的先进技术而言,利用这个世界的丰富性是非常重要的,”他说。
====================================分割线================================
本文转自d1net(转载)