将来也许有一天,任何一个手机机主都能识别你的身份。比如某天你坐在一个咖啡馆里,眼角余光瞥见一个陌生人把手机对着你的方向,第二天你就收到了一封邮件,发信人说他在咖啡馆里偶然看到了你,希望和你约会。你想破脑袋也不明白他是怎么知道你的邮箱的,更不用说他是怎么知道你是谁的。
面部识别技术正在高速发展,一系列新的初创公司已经涌入了这个领域,它们常常把“识别大街上陌生人身份”当作一个广告噱头。但在俄罗斯,这已经成为了现实。
两个月前,俄罗斯初创公司FindFace推出的一个应用。你想知道某个路人是谁吗?只要有他的面部照片就行了。FindFace可以把照片和Vkontakte(类似于Facebook的俄罗斯社交网络,简称VK)的个人资料照片进行匹配,从而找到此人的资料。该公司的创始人吹嘘说,这个应用可以帮你“和陌生人建立友谊”。但是很明显,这里面存在巨大的隐私风险。
这个应用推出之后,很多新闻媒体都提出了这样一个问题:类似的应用是否会在美国出现吗?但真正的威胁并不是FindFace这样的应用利用Facebook等社交网络的数据。真正的问题在于,这种应用可能会利用其他数不清的照片库里的数据,比如学校档案、公司员工名单,客户列表等等。
FindFace的杀伤力
FindFace的工作原理如下:首先,你把某个陌生人的照片拍下来,将照片上传到这个应用,然后这个应用就会在VK里搜索图片,把它觉得看起来很相似的照片发回给你。 FindFace的面部识别算法水平是世界一流的,由一个名为NTech实验室的公司提供,它最近还在华盛顿大学参加了一个国际大赛,与谷歌的面部识别算法同台竞技——但这种技术本身并不新鲜。Facebook每天都在进行这样的搜索,尽管它使用的数据集有所不同。FindFace能对隐私构成如此巨大的威胁,真正的创新是在数据库方面。
当你在Facebook上传照片的时候,Facebook只会把照片中的一张张面孔和你朋友的脸进行对比。 但 FindFace就不一样了,它会搜索VK上所有的个人资料照片。VK是俄语世界中人气最高的社交网站,有数以亿计的用户,因此每次有人将照片上传到FindFace的时候,FindFace就会把这张照片和一个包含了VK所有成员的数据库进行匹配。一旦匹配成功,它就会找到对方的VK个人资料,从而找到名字和联系方式。
所有的VK个人资料图片都是公开的,所以,如果你想不让这个数据库找到你,唯一的办法就是删除你的个人资料。这也就是说,俄罗斯人只有两个选择,一是离开VK,改用一个比较冷门的社交网络,问题是这样你就看不到VK上朋友的各种更新、照片和消息了。另外一个选择就是认命,任由别人把你的脸编入索引,进行搜索。
FindFace的数据库极有可能是用爬虫从VK抓取的,或者通过该公司的应用编程接口API逐一下载的。对于Facebook、Twitter和谷歌这样的大型网站来说,这种抓取数据的行为着实令人恼火,所以这些网站会在服务条款中禁止“自动收集数据”,它们还加强了隐私设置,采取了有力的保护措施,如果你加载页面的速度太快,数量太多(这种行为很像是爬虫),这些网站就会自动限制或切断你的访问。
Facebook可以采取的对策
这并不意味着Facebook非常安全。在Facebook上,你无法向陌生人隐藏自己个人资料,而这本来应该是抵挡FindFace抓取资料的一道基本防线。最起码,Facebook用户应该可以向朋友显示一张照片,向陌生人显示另外一张照片。如果有需要,Facebook用户还应该可以把这幅照片的分辨率降低到一定程度,给FindFace的面部识别算法制造障碍。此外,Facebook甚至应该提供降低照片灰度、进行模糊处理的功能,进一步阻断面部识别技术所需要的信息。
Facebook还有能力提供另外一个强大的隐私功能。它可以使用自己的面部识别功能,看看其他人的个人资料照片是否和你的很相似(你是否在Facebook上有一个“双胞胎”)。如果是这样,FindFace的算法就比较难以精确识别你了。如果你的长相确实独一无二,Facebook就需要把你的照片进行模糊处理,降低你照片的分辨率。
Facebook之所以有能力提供这样一些隐私保护措施,根源在于它不是一个开放的网站,而是一个有围墙的花园。它能够控制个人资料图片这样的内容,获得这些内容的唯一办法就是必须遵守Facebook的规则,接受它在速率等方面的限制。不幸的是,互联网上有大量的图片不在任何人的控制之下。
谷歌还会按兵不动吗?
在谷歌上搜一下自己的名字试试,说不定会看到熟悉的面孔。谷歌并没有悄悄地从Facebook抓取这些图片,它的爬虫大军在数以百万计的公共网站上收集图片,把它们链接到页面的关键字上,其中也包括你的名字在内。由于这些爬虫从很多不同的地方抓取信息,每个地方都只抓一点点,所以没有任何一个网站有必要像Facebook限制爬虫访问那样限制谷歌。事实上,大多数网站都对谷歌的爬虫青眼有加,因为这样一来,自己的内容才能在谷歌上被搜到。
目前,你搜索图片的主要方法是使用描述图片的关键字。在谷歌上,你确实可以用图片来搜索图片,但这个过程并不涉及面部识别技术——在谷歌上,你无法像在FindFace上那样搜索相似的面孔。事实上,谷歌执行董事长埃里克·施密特提到面部识别技术时说过,这是“唯一一个谷歌已经实现,但是在考虑了一阵之后,我们决定停止开发的技术。”
但是抓取网页、建立一个照片数据库,这并不是谷歌大型搜索引擎独享的领地。虽然从目前来看,要在全网级别上模仿FindFace仍然缺乏技术上的可行性,但很可能在不久的将来,这就会成为现实。NIST的专家说,面部识别技术正在突飞猛进,存储和处理的成本也在日益下降。如果一家创业公司的道德感没那么强,写一个网络爬虫,建立一个数据库,推出一个互联网级别的面部识别搜索引擎(谷歌至今不愿这么做)并不是难如登天的事情。如果这个功能成为了未来社交媒体的必备功能,那么像谷歌这样的公司还会继续按兵不动吗?
无所遁形的世界
互联网不会在一夜之间变成一个巨大的面部识别数据库,但是这种技术已经有人在小范围内使用了。 2011年,卡内基·梅隆大学的教授亚历山德罗·艾奎斯提(Alessandro Acquisti)下载了该校在Facebook上的每个成员的个人资料照片,然后用志愿者的网络摄像头照片来进行匹配。他发现,采用这种方式,可以识别出几乎三分之一的志愿者的身份,找到他们的Facebook个人主页。那已经是五年之前的事了,如今这种技术的成功率肯定会比当时高得多。 (当然这几年来Facebook也加强了保护措施。)
在公司、大学或城市这样的级别上,FindFace之类的应用确实可以让你无可遁形。这些在线目录和数据库的条目数量在十万以内,可能不会触发反爬虫措施,眼下它们就是面部识别技术可以利用的宝库。
这听起来似乎有点遥远,但俄罗斯VK用户现在面对的两难困境有可能降临在每个人头上。直接删除网上的个人资料并不是小事一桩。而且网上有很多照片是别人在我们不知情的情况下上传的。比如你参加了社区的游泳赛,主办方没有知会你们就直接把比赛照片贴在了网上……
也许有一天,匿名时代将会终结。你不再是人群中一张无法辨认的面孔,网络世界中永远不会再有你的藏身之所。
本文转自d1net(转载)