Facebook图谱搜索争议 大数据存碎片化缺陷

搜索一直是互联网行业中盈利能力最强的业务。近年来,Facebook流量已超过谷歌,但是谷歌的利润却超过Facebook近十倍。如何在海量用户和数据中掘金,一直是Facebook的一道难题。

本月中,Facebook推出了站内社交搜索工具“图谱搜索”(Graph Search),公司CEO扎克伯格在发布会上介绍,Graph Search现在将是Facebook产品重要的组成部分,继动态推送(News feed)和时间轴(Time line)之后成为该公司的第三大支柱。

扎克伯格和图谱搜索项目负责人还在发布会上称,该产品的服务几乎包罗万象,相当于LinkedIn(职业社交网站)、Yelp(点评网站)、Foursquare(签到网站)、Match(交友/婚恋网站)甚至谷歌能提供的所有服务。

虽然Facebook拥有海量数据,并改变了人们使用互联网的习惯,但是,希望通过站内搜索实现这样无所不能的服务,并挑战谷歌,目前从数据丰富性和用户需求上来看,还比较遥远。

图谱搜索注重社交信息

谷歌去年5月推出了“知识图谱”(Knowledge Graph)的搜索功能,只要在谷歌搜索引擎里键入单词或短语,在传统搜索结果的右侧就会多出一个栏目直接显示该词条的相关信息,这些信息来自维基百科与其他提供信息服务的网站。与之前的浏览方式相比,用户免去了自己访问信息出处网站这一过程,谷歌直接把信息呈现在搜索页面中。

谷歌的知识图谱功能和Facebook图谱搜索都有“图谱”二字。在移动互联网时代,图片的采集和呈现都出现了空前的增长,所以图片搜索变得越来越重要。谷歌只是图谱在推出时就已收录5亿词条和30亿条信息。而在Facebook图谱搜索中,也从维基百科中导入了很多词条。

如果在谷歌中搜索“中国”,右侧会出现中国的国旗图片和基本信息,左侧显示中国相关的新闻和旅行信息。在Facebook图谱搜索上,同样会显示中国的基本信息,同时,还会显示中国被“赞”次数最多的地点,有关中国的书籍,身处中国的好友和好友在中国拍摄的照片。

由此可见,图谱搜索重点体现的是社交和地点,而不是资讯。由于Facebook上所产生的信息大多数是比较个人化和碎片化的信息,所以,外界对图谱搜索的的质疑都集中在信息的有效性上。例如,在搜索“SUV”或“智能手机”时,只能搜索到一些相关的帐号,而没有有效的信息。

大而不专

在Facebook图谱搜索推出的当日,社交点评网站Yelp股价大跌6%。实际上,虽然Facebook有类似点评和签到的功能,但其信息量还远远比不上专业的点评网站。点评网站对消费地点有详细的分类,如餐馆类型,评分,区域,平均消费额,特色菜品。点评网站的信息,不仅靠用户提供,而且要通过网站大力拓展、维护和有效的用户激励机制取得。而Facebook能提供信息都是靠用户自发创造,仅仅是简单的“赞”,而且不能保障在每张照片上都贴上正确的标签,成为有效信息。

正如搜索专家丹尼·沙利文(Danny Sullivan)撰文指出的,Facebook上的大多数人可能没有严谨地为他们的电工、管道工或牙医点击“赞”按钮,他们甚至可能不知道那些人是否在Facebook上——如果那些人有账号的话。因此,在提供广泛推荐方面,难以威胁专门的点评网站。

Facebook工程和Graph Search团队的负责人拉尔斯·拉斯姆森(Lars Rasmussen)提到,图谱搜索在社交招聘和婚恋交友上可以大有作为,但目前看来,这两个服务也并不乐观。

在社交招聘领域,LinkedIn为招聘者和求职者提供了专业的工具和分享场所,而在Facebook上,一般只能知道一个人工作的公司,没有有效的工具,没有完整的履历、收入、职位和技能,甚至很多人不会填写自己的工作单位和毕业院校。因为很少人希望和自己的好友分享工作经历和感想,更不会有人希望自己的同事和上司知道自己正准备跳槽。

职业信息和婚恋信息都是比较敏感的隐私,希望把这些信息广而告之的人并不多,求职者和寻求伴侣的人更希望自己的意愿能通过较为专业和保密的渠道传递给有意愿的对象,而不是传递给身边的朋友、同事和家人。

商业化逻辑不完整

搜索引擎之所以被视为摇钱树是因为用户搜索中隐含了购买意向。麦格理证券(Macquarie Securities)的分析师本·沙克特(Ben Schachter)指出,基本上,图谱搜索让Facebook用户每天50多亿次活动变得更加结构化和易于搜索。沙克特在写给投资者的一份备忘录中提到:“这应该让用户,更重要的是广告商——找到Facebook数据的更多用处。”

但前提是大量用户能养成在Facebook上进行搜索的习惯。目前Facebook上的有效信息量和用户体验还达不到这一要求。例如,在Facebook上搜索“智能手机”,页面上的自动填充功能就会把你带到三星智能手机或沃尔玛的帐号中。显然,这些广告主会很高兴,但是用户期待的是智能手机相关的新闻、评测或报价,而不是一些毫不相关的图片和活动宣传。

以Facebook为首的社交媒体让“用户创造内容”空前繁荣,使信息传播的速度和范围大大加快。图谱搜索对谷歌搜索的挑战其实是“用户创造内容”对“专业内容提供者”的一次挑战。但与单一类型的“用户创造内容”网站,如维基百科、LinkedIn、Yelp等相比,图谱搜索的逻辑并不清晰。单一类型的网站的内容进行了大量定向拓展和维护,并且有完整的激励制度,所以数据结构明晰,而Facebook用户创造的内容过于自发性和碎片化。

图谱搜索面对的困难除了数据结构化以外还有用户隐私的问题。Facebook创建之初的意愿就是建立一个现实中朋友关系的延伸,图谱搜索所推广的目的性极强服务显然违背了Facebook应用的本意,假如操作不当,用户极可能由于担忧隐私被挖掘而流失。

(责任编辑:蒙遗善)

时间: 2024-09-19 09:25:23

Facebook图谱搜索争议 大数据存碎片化缺陷的相关文章

Facebook图谱搜索成败系于能否保护用户隐私

腾讯科技讯(晁晖)北京时间1月20日消息,据国外媒体报道,一直以来,Facebook最成功之处是说服全球七分之一的人口在网上披露他们的个人信息. 正值人们对在网上分享个人信息日趋谨慎,甚至偶尔删除已经分享在网上的信息之际,Facebook推出了图谱搜索--挖掘个人信息,向谷歌(微博)发起挑战. Facebook的逾10亿用户是否继续在网上披露更多个人信息,将决定所谓的社交搜索是否是搜索的未来方向,还将决定Facebook是否找到了能带来滚滚财源的商业模式. 匹兹堡大学营销学教授安德鲁·史蒂芬(A

阿里助政府办案引争议 大数据未来在哪?

文章讲的是阿里助政府办案引争议 大数据未来在哪,政府大数据.金融大数据.教育大数据等热词虽一次次被提起,大数据的价值也十分被认可,但其实际的应用的典型案例并未被曝光多少,很多人对大数据的实际应用形式并不了解.然而近日,浙江省高级人民法院与阿里巴巴在大数据方面达成了合作协议,聚焦阿里旗下淘宝.阿里云和蚂蚁金服在云计算.大数据和用户方面的资源优势,帮助浙江高院构建司法领域的大数据服务体系. 双方合作的方式是,利用浙江省各级法院丰富的案例资源,结合互联网大数据的优势和阿里巴巴的多维度分析.数据可视化.

Facebook图谱搜索将增网帖与评论搜索功能

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 Facebook图谱搜索 新浪科技讯 北京时间3月15日早间消息,Facebook今天宣布,除了搜索好友.页面和照片外,Facebook图谱搜索(Graph Search)不久还可以让用户查找网帖和评论等内容. Facebook搜索基础架构团队工程主管斯利拉姆·桑卡尔(Sriram Sankar)在一篇博文中写道,Facebook的下一步工作

大数据:70多个网站让你免费获取大数据存储库

你是否需要大量的数据来检验你的APP性能?最简单的方法是从网上免费数据存储库下载数据样本.但这种方法最大的缺点是数据很少有独特的内容并且不一定能达到预期的结果.以下是70多家可以获得免费大数据存储库的网站. Wikipedia:Database :向感兴趣的用户提供所有可用的内容的免费副本.可以得到多种语言的数据.内容连同图片可以下载. Common crawl 建立并维护一个所有人都可以访问的开放的网络.这个数据保存在亚马逊s3bucket中,请求者可能花费一些钱来访问它. Common cr

Facebook前主管谈大数据技术趋势和演变

本文讲的是Facebook前主管谈大数据技术趋势和演变,全球系统架构师大会于8月10-12日在深圳万科国际会议中心隆重举行.首先给大家带来分享的是前Facebook数据基础设施团队主管,Qubole创始人,CEO Ashish Thusoo,他主要介绍了大数据架构以及怎么样不断的演进,与其说演进,不如说革命.其中主要包括三个方面的主题: ▲全球系统架构师大会现场报道 第一,大数据的需求.当今世界需要大数据,有哪些驱动因素促使我们不同方式考虑大数据?以不同方式处理数据. 第二,技术给我们带来哪些架

Facebook图谱搜索可蚕食谷歌本地搜索

1月16日消息,Facebook今天推出了图谱搜索服务(Graph Search).<福布斯>网站随后发表资深IT记者埃丽卡·莫菲(Erika Morphy)的文章称,如今大量的搜素涉及个人需求,医疗保健.餐馆等的搜索量呈显著增长,因此,凭借社交图谱优势,Facebook图谱搜索能够蚕食谷歌的本地搜索市场份额. 以下为文章主要内容: Facebook今天宣布将为其社交网络推出名为"图谱搜索"的搜索引擎.这出乎了人们的预料,因为在其神秘新闻发布会召开之前,外界普遍猜测它会推出

70多个网站让你免费获取大数据存储库

你是否需要大量的数据来检验你的APP性能?最简单的方法是从网上免费数据存储库下载数据样本.但这种方法最大的缺点是数据很少有独特的内容并且不一定能达到预期的结果.以下是70多家可以获得免费大数据存储库的网站. Wikipedia:Database :向感兴趣的用户提供所有可用的内容的免费副本.可以得到多种语言的数据.内容连同图片可以下载. Common crawl 建立并维护一个所有人都可以访问的开放的网络.这个数据保存在亚马逊s3bucket中,请求者可能花费一些钱来访问它. Common cr

消除数据信息碎片化 打通大数据应用“最后一公里”

大数据.人工智能和人类智慧,成为智能数据时代的三大要素.数据的积累,可以为人类提供更多更细的洞察分析,人类经验得以增强,人类智慧得以增长. 消除数据信息碎片化 打通大数据应用"最后一公里" 刚刚过去的2016年,是大数据从概念到务实落地的一年.在过去的一年内,互联网行业.电信行业.金融行业.房地产行业.汽车行业.娱乐行业.教育行业.零售行业.能源行业.医药行业.政府机关等都在不同程度的接触和实施大数据. 大数据产业发展了两年后,从探索阶段进入了应用阶段.数据被定义成重要的资源,正在得到

大数据时代结构化存储云HBase技术架构及最佳实践

在10年,阿里研究HBase,是为了解决阿里容量及并发的实际问题,按照数据库要求,阿里深入HBase技术,并致力于保障稳定性和性能,目前已经有10000台规模,数百个集群,大约1亿的QPS,服务整个集团的业务.17年,把这部分能力也开放给公有云客户.本文中,阿里云高级专家封神带来了主题演讲<大数据时代结构化存储云HBase技术架构及最佳实践>,介绍HBase的应用选择.实战案例.技术平台解读以及后续的规划. 为什么应用HBase 一般而言,传统关系型数据库面临着成本.容量.QPS.分析等多方面