透过Facebook Moments应用,LeCun带我们瞻望计算机移情能力

编者按:一年前,Facebook发布了照片分享应用Moments,于前不久关闭了iOS版Facebook照片同步功能,力推Moments应用,该应用运用了人脸识别技术。不过,Facebook人工智能实验室负责人Yann Lecun在为我们通俗易懂地介绍Moments的应用原理时表示,除了简单的人脸识别技术,Facebook将利用更卓越的计算机视觉技术和AI技术为用户提供更多便利,如尝试开发计算机的移情能力,当然,这些便利的应用背后需要强大的算法和繁琐的训练过程做支撑。让我们一起期待未来计算机能够更好地理解人类,使我们的工作、生活更为便捷。

Facebook强力推行的照片分享应用Moments通过运用图像识别技术,使用户可以扫描朋友的照片创建私人群体相册。当有六个人在活动现场同时拍照时,Moments使所有参与者相互之间能够更为便捷地分享照片,省去了把快照通过邮件发送给每一个人,然后再创建相册的繁琐过程。当然,这种应用并不像发现治疗癌症的方法一样,称得上是“壮举”,但是,在这种便捷照片分享应用背后有着令人印象深刻的技术,Facebook花了几年的时间才开发出这种技术。

Moments应用的关键点在于有Facebook的算法作为支撑,使得这种应用能够在不同的照片中识别出同一个人的面容,如此一来,Moments能够知道有哪些人在活动现场。这就要求具备计算机视觉专门知识,Google, Microsoft,Baidu及其他公司一直以来都致力于计算机视觉领域的研究,其应用从自动驾驶车辆到傻瓜式网络产品,如微软的“我看起来多大年纪”应用,变化不等。

Moments的发布代表着Facebook正在与全世界分享其在计算机视觉领域研究所取得的成功。Facebook人脸识别精度能够达到98%,识别速度也是非比寻常,能够在不到5秒的时间内,从8亿张照片中识别出你的照片。最后,即使不能获得你的正面镜头(或者你的脸根本没有出现在照片中),Momemts都能够轻松识别出你的照片,这一切都要归功于一种机器学习算法,该算法能够兼顾图片中与照片数据有关的其他元素内容。

Moments的发展源头

Fortune曾经采访过Facebook人工智能实验室负责人Yann LeCun,采访过程中了解到他的团队是如何帮助一台计算机理解“你是谁”,及下一步Facebook在AI研究领域将有何新进展。在LeCun谈论计算机视觉时,也许我们首先要理解:尽管教会软件识别对象的过程与人看外界事物具有相似之处,我们依然不能将计算机视觉简单地等同于人看外界事物。

例如,Facebook的人脸识别技术不能识别出你。只有当两张照片中的人是同一个人时,这种技术才能够识别出被识别对象。人脸识别技术实际上是一个完全分离的步骤。

由于Facebook主要是为了建立人与人之间的密切联系,其计算机视觉技术以识别人脸为侧重点,不用于识别猫,车辆或其他物理实物。为了实现这一目的,Facebook采用一个被称为“Labeled  Faces in the Wild”的数据库,该数据库由名人和政客的照片组成。数据库中含有13000张照片,照片中人们以不同的发型,不同的服装,有时戴眼镜或其他的装饰物出现。Facebook使用该图像集训练其机器学习算法。其他公司也曾使用该数据集,一些大学运用该图像集训练系统,识别精度达到98%。

因此,Facebook究竟是如何通过给一台机器一张Angelina Jolie的照片,然后,在这张照片的帮助下,使这台机器从不同的相册中识别出你姐姐的呢?LeCun可以为我们解答这一难题。大约20年前,当LeCun在贝尔实验室工作时,他偶然想到应该如何教会计算机“看”世界,这种想法直到4年前才在学术界之外得到推广应用。

如何教计算机“看”世界

计算机视觉所用到的技术被称为卷积神经网络,该命名来源于被称为“回旋”的数学操作,并从人类大脑的学习原理获得灵感。人类大脑是通过在神经元之间建立联系实现学习的,一个信号被传送给神经元的频率越高,神经元之间的联系越紧密。同理,当计算机为两张图像建立相似度联系时,它将为这些相似度分配权值。在卷积神经网络中,所设定的目标是训练机器,使之能够识别所建立联系之间权重的变化,以便于计算机能够越来越精确地判断图像与图像之间是否匹配。

这种训练识别过程是相当复杂的,涉及到不同的计算方法,运用这些计算方法能够判断一幅图像中哪些特征对于识别图像信息是重要的。例如,如果你想要训练一台计算机来识别人脸,图像背景的像素就显得并不太重要。令人感到不可思议的是,机器能够自行学习,识别出图像种哪些特征是最相关的,然后对这些重要特征进行归纳总结。不过,还是需要人为地推动计算机识别出合理的方式为相似度赋权值,一旦建模成功,计算机将具备归纳总结重要特征的能力。

将会花费几天的时间在一台配置很好的计算机上完成这一训练过程。

当多伦多大学Geoffery Hinton教授带领其研究团队使用卷积神经网络在图像识别算法竞赛中获胜之后,卷积神经网络几乎成为所有计算机视觉研究的基石。之后,Hinton的研究团队和其建立的新公司被Google收购,Hinton以测试误差为15.3%在比赛中获胜,第二名优胜者的成绩为26.2%。

瞻望计算机移情能力

Facebook的自动人脸识别技术有助于用户保护自己的隐私不受侵犯。例如,当自动人脸识别技术得到广泛应用时,你每上传到Facebook一张照片都会及时获得通知。例如,假如你不经意间出现在一个游客在时代广场拍的照片背景中,你能够及时获得通知,有权选择将照片中自己的脸变得模糊,无法识别。对于小孩子,如果出现这种情况,Facebook将自动开启模糊或删除功能。Lecun表示,Facebook对这类应用工具很感兴趣,但是,他同时也强调,Facebook的对机器学习领域的兴趣远远超过图像识别技术。

Facebook的目标是使计算机具备移情能力。很明显,计算机不能感知到人们的行为,不过,能够训练计算机使其具备识别人的情感及人的反应的能力。当计算机的理解能力能够达到这种水平式时,当你将要上传自己喝得醉醺醺的照片时,Facebook将会发出提示,确认你是否真的想要这样做。

“计算机的移情能力远远超过人脸识别技术”,LeCun表示。“我们不关注谁在照片中,我们将运用其他类型的图像识别技术,通过不同手段训练这些技术, 使计算机能够识别出——这张照片看起来令人尴尬,提示你是否真的要将照片公之于众。”

当然,Facebook现阶段还不具备开发出这种图像识别技术的能力,但是LeCun提出这些概念作为实验构想,指明了Facebook人工智能研究未来的发展方向。当然,这种仅用一种算法便可以达到的图像识别技术着实会给人们带来深深的不安。现在,由于人们对于个人隐私的关注,Facebook尚未在加拿大及欧盟等国家推广这种自动标记应用。要使得一台计算机能够在几秒内猜测出你分享照片的意图,或者使软件尝试着分析你的笑话,并理解你所讲笑话中的笑点,还要考虑一种潜在变化的影响因素。

“我们的目标是使机器变得更加智能化,能够理解文本,图像,视频及邮件,在数字化的世界里,我们想要机器理解事物发生的场景”,LeCun表示。由于每天都能够接收到如此多的数据内容,人们不免感到不知所措。LeCun的研究团队所做出的努力将帮助人们获取与其兴趣密切相关的内容。要实现这一简单目标可能牵涉到复杂的解决方法:保证你在Facebook上看到自己需要的信息。

“使机器理解人类,这是Facebook一直尝试完成的一项重大任务”,LeCun表示。

 本文由雷锋网(公众号:雷锋网)独家编译,未经允许拒绝转载!·

本文作者:高婓

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-01 07:37:15

透过Facebook Moments应用,LeCun带我们瞻望计算机移情能力的相关文章

透过FACEBOOK上市看硅谷逻辑

Facebook是创办于美国的一个社交服务网站,于2004年2月4日上线.主要创始人为美国的扎克伯格.Facebook是世界排名领先的照片分享站点,截至2013年11月每天上传约3.5亿张照片.截至2012年5月,Facebook拥有约9亿用户. Facebook按计划5月18日在纳斯达克上市.Facebook的该次上市活动也成为全球互联网行业里程碑式的事件.我们可以通过Facebook的上市透视硅谷逻辑,主要囊括了人才,资本,文化三大方面. 硅谷成功的关键有三点:人才:资本:文化.硅谷是美国创

透过Facebook上市看硅谷逻辑:人才、资本、文化

http://www.aliyun.com/zixun/aggregation/1560.html">Facebook按计划5月18日在纳斯达克上市.Facebook的上市成为全球互联网行业里程碑式的事件. 硅谷是美国创新的圣地,正如纽约是美国金融的圣地,好莱坞是美国电影的圣地.Facebook无疑是硅谷的一个典型,通过Facebook上市这件事情,可以来剖析硅谷的逻辑,解读硅谷成功的原因. 硅谷成功的关键有三点:人才:资本:文化. 一.人才 硅谷成功的第一个关键是人才.Facebook的

CNN提速23.5倍!Facebook开源DL模块带给我们什么?

Geoffrey Hinton的努力,使得深度学习(Deep Learning,DL)成为实现机器智能的核心技术.然而,深度学习的一些坑,如大型神经网络的计算负载.训练性能,并不那么容易克服.现在,深度学习的爱好者可以通过Facebook的福利消除这一障碍:日前, Facebook人工智能研究院 (FAIR)宣布开源了一组深度学习软件库,是针对Torch机器学习框架的插件,基于NVIDIA的GPU,大大提升了神经网络的性能,可以用于计算机视觉和自然语言处理(NLP)等场景. 那么,具体而言,Fa

透过地震官网被黑 关注网站安全防范能力

中介交易 SEO诊断淘宝客 站长团购 云主机 技术大厅 "5.12"地震以来,在中国大地上发生了太多太多的事情.一句"多难兴邦",让我们看到了四川的希望,中国的希望.可就在这举国哀悼的时刻,却发生了一些令人唾弃的事情.让我们来看看相关媒体报道:5月28日.29日晚间,陕西省地震信息网接连遭到恶意攻击,嫌疑人修改了相关信息,并在网站主页散布"23时30分陕西各地会有强烈地震发生"等谣言,造成了部分群众的心理恐慌;而在5月31日.6月1日.2日期间,

Facebook对深度学习的追求:让机器理解我们

要理解人工智能的历史,我们得先回到1995年. 彼时,一名年轻的法国人Yann Lecun花了10多年时间做一件事:模仿大脑的某些功能来打造人工智能机器.这件事在许多计算机科学家看来是一个坏主意,但Lecun的研究已经表明,这种做法可以造出智能而且真正有用的产品. 在贝尔实验室工作期间,他开发出了一些模拟神经元的软件,通过读取不同的例子来辨识手写文本.而贝尔实验室的母公司--AT&T,也用利用这门技术,开发出了第一台可以读取支票和书写笔迹的机器.对于Lecun和人工神经网络的信徒们来说,这似乎是

Yann LeCun清华演讲:讲述深度学习与人工智能的未来

半个月前,Yann LeCun要来清华演讲的消息在国内AI圈一经传开,各位AI界人士便坐不住了.作为Facebook人工智能研究院院长.纽约大学终身教授.卷积神经网络之父,LeCun已然成为了AI人心目中的男神. 演讲当天(3月22日),雷锋网(公众号:雷锋网)也来到了LeCun的演讲现场.演讲开始前,只见许多想要听演讲,却无奈没有得到票的同学,焦急地坚守在演讲大厅门前,希望能一睹男神风采,或运气爆棚能偶得一票.一个专业性质极强的学术演讲能吸引这么多人来参加,也再一次体现了Yann LeCun的

工程师文化和个人发展: 《打造facebook》读后感

        放假之后就没有写过博客,再过两天就过年了,这应该是春节前最后一篇博客.<打造facebook--亲历facebook爆发的5年>一书,刚出版就在微博上有很多的推荐.当时北京的书店还没有进货,我又要坐车来广西,没法给个确定的快递地址.期间还特地去了广西柳州的五星街那的新华书店看了下,此书在2.1才上架,当时还在仓库里,就一直拖到前些天才买到这本书,得以拜读.         其实想读这本书,一来是作者本身是浙大毕业的,现在回国在国内和薛蛮子,徐小平等人做天使投资,做跟投,二来作者

NIPS 2016精华大盘点丨吴恩达、LeCun等大师的论文、PPT都在这儿,别劳心去找了

2016 NIPS 仍在如火如荼地进行,各位大佬也频繁在会场露面,并时不时的搞个"大新闻".雷锋网时刻关注着 NIPS 的一切动态,并把大家较为关注的论文以及学术大师的PPT整理出来,方便大家学习和参考. 先打个招呼,正文和文末都有彩蛋. Yann LeCun  Yann LeCun 最近可谓是学术界的网红,上周先后录了三段视频为大家普及人工智能知识,现在又飞到西班牙见见粉丝,也不忘随时更新下 Facebook. Yann LeCun 受邀在今年的 NIPS 大会发表演讲.众所周知,深

浅谈Facebook游戏的运营经验

这个时候,也许在地球的某个角落,某个玩家正在通过Facebook玩一款中国开发的游戏,Facebook作为拥有全球10亿用户的社交网站,正在不停地给国内游戏开发商带来收入. 尽管是社交网络巨头,因为国内游戏开发商对网站并不熟悉,特别是中小型的,想要自己在Facebook上推广游戏的开发商来说,会遇到各种各样的问题. 作为在Facebook上的第一大游戏发行商6waves,其中国区总经理唐臣,最近在成都给出了一些建议.6waves在Facebook上拥有1400万的月活跃用户和200万的日活跃用户