Facebook今天开源了三款人工智能图像分割(Image Segmentation)软件,分别是DeepMask、SharpMask和MultiPathNet,三款工具相互配合完成一个完整的图像识别分割处理流程,DeepMask生成初始对象mask、SharpMask优化这些mask,最后由MultiPathNet来识别这些mask框定的物体。SharpMask目前已遵循BSD授权协议在GitHub上公开源码。
Facebook的人工智能研究实验室(FAIR)此前曾在多篇学术论文中讨论过以上开源的图像分割技术(论文1、论文2、论文3)。图像分割技术不仅能够识别图片和视频中的人物、地点、物体,甚至能够判断它们在图像中的具体位置(精确到像素级别),为了做到这一点,Facebook使用了一种人工智能技术——机器学习,也就是用大量的数据来训练人工神经网络,不断提高其对新数据的处理判断准确性。
Facebook一直是开源人工智能技术的积极推动者,在开源三款图像分割软件工具之前,Facebook还曾在Torch上开源了一些功能强大的深度学习工具。
深度学习是科技巨头竞争激烈的技术阵地,包括苹果、百度、谷歌和微软都投入重金,并在COCO这样的图像识别竞技场上展开激烈角逐。
据Facbook介绍,图像分割技术对于改进社交软件来说意义重大,例如计算机能够自动识别图片中的物体,这能极大提高图片搜索的准确率和效率,即使这些图片没有添加人工标签。对于视力障碍的用户来说,计算机甚至能给他们念出图片中的内容。
Facebook人工智能实验室的科学家Piotr Dollár在博客中指出:图像识别技术的下一个挑战是视频识别,这方面Facebook的计算视觉技术已经取得一些进展,能够在查看视频的同时理解并区 分视频中的物体,例如猫或食物。对视频中物体的实时区分功能将大大提高Facebook视频直播内容的推荐准确性,而且随着技术水平的提升,未来机器将能 根据场景、物体和动作的时空变化给出实时的描述。
文章转载自 开源中国社区[http://www.oschina.net]