今日,Facebook宣布面向盲人和视障用户推出图片内容自动描述功能。这个被叫做“文本自动替代(automatic alternative text)”的功能由Facebook已经成立了5年的易用性团队开发。该团队由Jeff Wieland领导,在负责这支队伍之前,他是Facebook产品团队的用户研究员。
“文本自动替代”功能现已经在iOS上推出,很快,Android平台以及网页版也都会迎来这项功能。这套机器学习技术将利用算法作出预测以实现人工智能的目标。当软件接收到一张图片并识别出里边的对象之后,它会利用iPhone中的VoiceOver告诉目标用户图中的内容。虽然这套技术现处在早期开发阶段,但它却能可靠地识别出分类概念对象,如交通(汽车、船、飞机)、自然(雪、海洋、日落)、体育(篮球场)、食物(寿司)。另外,它还能识别人(婴儿、微笑、胡须)和自拍照。
而Facebook之所以想到利用人工智能技术“阅读”图片则是因为其各个平台上庞大的上传图片量。据统计,用户在Facebook、Instagram、Messenger、WhatsApp每日上传的图片数量达到了20亿张。
显然,Facebook并不是唯一一个在做这件事情的公司。像Google Photos、Flickr,它们的技术团队也有在开发相类似的技术,不过看起来成果并不喜人。去年,谷歌就因为将照片中的两名黑人标示为大猩猩而遭到来自各方的抨击,为此,公司公开道歉。而Facebook只会在80%确定的情况下才会对图片中的对象做标示,并且如果涉及到敏感话题--如上面提到的种族问题--系统对判断结果的确定比例要求就更高了。这并不是说Facebook对自己的技术感到不自信,它只是不打算陷入更加麻烦的境地。“有些情况下,没有数据比坏数据来得更好,”Wieland说道。
虽然图片对象描述技术对于科技公司来说已是陈词滥调,但Facebook这次是真的把它带向了用户。目前,仅支持iOS平台和英语。虽然现在还有许多对象是Facebook还无法达到80%确定的水平,但它已经在大力推广两款新的工具:识别视频中的对象和“视觉问答”--用户可以提出跟图片相关的问题然后从平台上得到反馈。
本文转自d1net(转载)