《小时代3》背后:百度知识图谱前夜

  这几天百度不断出新,让人目不暇接。在极简首页之后,《小时代3》的百度知识图谱也悄然在搜索页上线。《小时代3》大热之际,其错综复杂的人物关系并不是每个观众都能理清,百度通过掌握的知识图谱数据直接给出了清晰的网状关系,可视化、支持互动。笔者注意到这个产品的网址前缀是tupu.baidu.com,看来接下来百度必然会推出各种独立的“图谱”页面,知识图谱产品狂想曲已然奏响。

  我们已从信息时代进入知识时代

  如果要对互联网进行分层,它大概可以分为四层。

  最底层是将实体世界比特化的“数据”。二进制存储技术、文件结构以及数据库解决的便是“数据”的问题,今天则已进入“大数据”时代。搜索引擎此时比拼的是数据索引量和搜索结果集的大小。

  数据上一层则是信息,数据是更底层是给机器的,信息则是给人读的,有逻辑有决策参考价值,数据处理之后便成为信息,信息革命的说法正是印证了互联网的核心是信息。这时候搜索引擎核心是精准地连接人与信息。

  信息上一层就是知识,信息中有价值的部分沉淀下来与人类积累的知识体系融合在一起,就成为互联网的知识。WIKI百科、百度知道和知乎这些产品本质上都是围绕知识在转。信息过载成为人类负担,知识沉淀则成为人类的财富。互联网知识图谱远超图书馆等传统的知识沉淀方式,价值十分可观。搜索引擎在知识时代的价值则是帮助人们找到准确的答案。

  知识再往上是智慧。人类基于知识,根据物理世界规律找到的解决实际问题的能力被归纳为智慧。知识是“我知道什么”还不足以解决“做什么、如何做”这样的问题,不乏有人满腹经纶但在生活和滚工作中缺乏智慧。但智慧与知识相辅相成,智慧让知识更加丰满,知识则是智慧的前提。

  我们已经从信息时代进入到知识时代。在信息过载的大背景之下,在互联网侵蚀实体世界的趋势下,解决现实世界的实际问题更加重要。搜索引擎的使命转变为连接人与服务,而不再只是连接信息,它需要准确地回答人们的实际问题,给人们提供完备的服务。知识图谱成为智慧搜索的基石。

  百度知识图谱进入普及前夜

  知识图谱(Knowledge Graph)被称为科学知识图谱,“它显示知识发展进程与结构关系的一系列不同图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系”。

  简单说,知识图谱是搜索结果体系化、关联化和可视化,任何一个搜索请求都能得到一个知识体系,不再只是线性的网址列表,而是网状知识结点,譬如搜索“小时代”便可看到角色关系图,搜索地名则可以看到地图、天气、旅游景点等关联信息。

  知识图谱带来几个改变。一是结果更加准确。用户搜索关键词可能有多重意思,知识图谱可以展示最全面的信息,更有机会命中用户需求;二是结果包括全面的摘要,《小时代3》图谱便可看到关联的演员、作者介绍甚至微博相关话题;三是搜索更广更深,通过知识图谱建立的关系让用户可以通过互动、点击拓展搜索的深度和广度。

  更准、更广、更深的搜索是百度一直在追求的目标。尤其是在大力发展移动搜索的当下,更是需要让搜索做到精准无比,以降低用户输入和选择成本。当百度极简首页上线,无需用户选择频道时,它的结果必然要足够精准和全面,击中用户需求才行,知识图谱的能力正在于此。

  百度一直都十分重视知识图谱并且有先天优势,去年便陆陆续续出现百度知识图谱的消息,能回答“第三个字是风的成语”、“谢霆锋的前妻的儿子的爸爸的年龄”这样的推理问题就是知识图谱的应用。结果页右侧的关联结果,也是知识图谱的应用。本次知识图谱的可视化展现,是通过百度内部前端开源产品Echarts实现的。

  《小时代3》知识图谱上线、tupu.baidu.com域名出现以及百度极简首页上线这几个迹象则表明,百度知识图谱产品狂想曲已然奏响。

  与Google、Bing和Facebook知识图谱的不同思路

  在技术上Google和Bing一直与百度分庭抗礼,在知识图谱上,三家都有着很强的积累。去年社交巨头Facebook也推出Graph Search进入社交图谱搜索。

  Google在2012年推出知识图谱产品,不管用户搜索的关键词是代表了地标、名人、城市、球队名、电影、专业词语还是一种菜的做法,Google 的“知识图谱”都可以将搜索结果的知识体系完整的呈现出来。此外,Google有Search Plus Your World这一结合Google+的社交搜索产品。

  Bing在中国推出了人立方社交人际关系搜索引擎,你可以查看一个人名的热度,TA的关系网络图,TA最亲密的好友,这款产品基于全网WEB数据以及新浪微博的开放数据。由于只能搜索人际关系,与其他知识分离了,因此人立方并没有什么起色。

  随着Facebook GraphSearch的推出,Bing将知识图谱与社交网络结合起来的定位显然是尴尬的。因为Bing并没有自己的社交数据——在Space和MSN均宣告失败的情况下。

  Facebook Graph Search是基于社交图谱的搜索,可以搜索“洛杉矶XX街道最近一年接待我的朋友最多的餐厅”这样的问题。GraphSearch没有大获成功,因为Facebook只有封闭的社交数据,基于这些数据能够组织的知识,能够给出的结果,能够满足的搜索场景都十分有限,它只是一款过得去的站内搜索。

  Bing和Facebook的在图谱搜索上的失利说明了社交既非必要条件亦非充分条件。Google和百度完全从搜索出发基于十多年沉淀的知识图谱、用户数据,利用擅长的大数据和深度学习算法,反而可以把知识图谱做得更加全面、精准和完备。

  Google和百度在知识图谱探索上还是会有所不同。Google知识核心来自WIKIPEDIA、Freebase等网站,百度05年左右开始的UGC知识产品战略,使之拥有强大的自有知识图谱,分别来自百科、知道和贴吧这些产品的数亿条数据和关系。目前百度的知识图谱已经涵盖十几大领域,数十个类别,拥有上亿实体量。通过构建宏大的知识网络,整合碎片化信息,再以图文并茂的方式展现出来,人们便可以在轻点鼠标的片刻,迅速获取知识、找到所求。

  值得一提的是,自今年以来,百度在搜索结果页上频出新产品,除了人物关系图谱外,在有焦点事件如汤唯订婚等新闻发生时,搜索结果右侧便会呈现出相关人物关系的智能推荐;每逢世界杯等重大赛事活动举办时,即时更新的时间脉络图谱也会清晰展现在右侧;而用户搜索“故宫”、“颐和园”等景区,可直接得到景点地图、人群分布图、周边交通信息、景点推荐等信息……

  众所周知,知识图谱对“语义识别”技术门槛极高,对社会化开源内容有很强的支撑需求,且是依赖大量用户的行为数据库的产品形态。百度搜索本身就是一个大数据来源,同时百度还拥有来自像百度百科、百度知道、百度文库等产品的多方面数据支持,这些共同将百度打造成一个数据航母战斗群,促使百度能够在一年时间里完成了近百亿实体知识图谱的构建并且实现了平台化,这样百度知识图谱就能够快速切换支撑多个产品的发展。

  知识图谱可以让用户得到全新的搜索体验,让用户更快速接近答案和服务。笔者思考的一个问题是:继阿拉丁之后,知识图谱是更强大的用户需求满足方式吗?

时间: 2024-10-18 09:16:57

《小时代3》背后:百度知识图谱前夜的相关文章

百度知识图谱 - 悄然上线的百度下一代搜索引擎雏形

class="post_content" itemprop="articleBody"> 8月22日消息,昨日有网友爆料破解"疯狂猜成语"的最新攻略,搜索"第三个字是风的成语",竟然在百度中有一种"另类"展现.经过验证,发现对比多家搜索引擎,谷歌.搜狗.搜索和360均不能实现-- 有业内专家称,在2013年百度世界大会召开之际,百度知识图谱悄然上线,这正是下一代搜索引擎的雏形.过去,百度已经有框计算,

小时代3关系混乱? 百度动态知识图谱揭秘

中介交易 SEO诊断 淘宝客 云主机 技术大厅 最近郭敬明导演的<小时代3>在全国各大院线热映,网上流传各种复杂的人物关系图,更不乏洋洋洒洒数千言的分析文章.但对于网友来说,如今想要全面了解这些信息并不用如此"烧脑",百度知识图谱(http://tupu.baidu.com/ )基于庞大的知识库以及语义分析,让纵使千般纠结的网友也能一张图洞察所有秘密. 小时代3人物关系图谱 网友搜索"小时代3",点击结果页右侧"知识图谱"即可进入这张

小时代3关系混乱?百度动态知识图谱揭秘

最近郭敬明导演的<小时代3>在全国各大院线热映,网上流传各种复杂的人物关系图,更不乏洋洋洒洒数千言的分析文章.但对于 网友来说,如今想要全面了解这些信息并不用如此"烧脑",百度知识图谱(http://tupu.baidu.com/ )基于庞大的知识库以及语义分析,让纵使千般纠结的网友也能一张图洞察所有秘密.小时代3人物关系图谱网友搜索"小时代3",点击结果页右侧"知识图谱"即可进入这张信息量极大的可视化动态图谱.通过"小时代

中文知识图谱研讨会的学习总结 (上) 图谱引入、百度知心、搜狗知立方

        知识图谱(Knowledge Graph)是当前学术界和企业界的研究热点.中文知识图谱的构建对中文信息处理和中文信息检索具有重要的价值.中国中文信息学会(CIPS)邀请了有约10家从事知识图谱研究和实践的著名高校.研究机构和企业的专家及学者有意参与并发表演讲,下面就是第一届全国中文知识图谱研讨会的学习笔记.         会议介绍地址和PPT下载链接:http://www.cipsc.org.cn/kg1/         第一篇以现有百度知心和搜狗知立方为主,其中文章目录如下

百度引领下一代搜索引擎知识图谱成网络版“十万个为什么”

文/张书乐 昨天,一则小学生在公交车上争抢作业的微视频在各大视频网站上流传,而其模仿着哆啦A梦风格的人物配属和情节上的逆转,很鲜明的是以"演绎"的形式进行教育的反思,而结合8月底的另一条新闻<教育部拟取消小学生家庭作业>(新快报8月24日),亦可以看出,民间对教育部就学生减负出台<小学生减负十条规定>(http://www.aliyun.com/zixun/aggregation/5493.html">征求意见稿)的正面回应. 然则,小学生减负,

百度下一代搜索引擎雏形曝光 应用知识图谱技术

中介交易 SEO诊断 淘宝客 云主机 技术大厅 8月22日消息,昨日有网友爆料破解"疯狂猜成语"的最新攻略,搜索"第三个字是风的成语",竟然在百度中有一种"另类"展现.经过验证,发现对比多家搜索引擎,谷歌(微博).搜狗.搜索和360均不能实现. 有业内专家称,在2013年百度世界大会召开之际,百度知识图谱悄然上线,这正是下一代搜索引擎的雏形.过去,百度已经有框计算,这次又新推知识图谱,在搜索技术创新上更上一层楼.这是一种基于长尾的搜索,暗含技术壁

百度疑似推出“知识图谱”功能 搜索结果百科全书化

    近日有网友爆料,在百度搜索某些人物的关键词时,会出现该人物相关的资料,搜索结果以"百科全书"式的方式显示.比如搜索"周鸿祎"时,会在搜索的结果中呈现"周鸿祎"的简介.百度百科词条.新浪微博地址.相关新闻以及人物图片(如上图).如果搜索演艺人员的话,会出现其相关作品,如搜索"周杰伦"时,会直接给出"周杰伦"的音乐.电影作品.不过并不是适用于每一个人物搜索,经测试,李彦宏.张朝阳.丁磊等的搜索结果还是传

解密搜索引擎背后的大技术:知识图谱,大数据语义链接的基石

知识图谱,也称为科学知识图谱,它通过将应用数学.图形学.信息可视化技术.信息科学等学科的理论与方法与计量学引文分析.共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构.发展历史.前沿领域以及整体知识架构达到多学科融合目的的现代理论.为学科研究提供切实的.有价值的参考. - 百度百科 实体及其之间的关系图.规模:5亿个对象,35亿个事实和关系-维基百科 知识图谱实现对客观世界从字符串描述到结构化语义描述,是对客观世界的知识映射(mapping world knowledge) 本体可以

百度权重的“小时代”

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 近期,由非著名导演作家郭小四导演的一部"小时代"的上映,其票房的每况愈上让不少人心中想去一睹为快,笔者自然也随大流般去某D版论坛下载观看,因为笔者只是个做SEO的苦主,在看完此片之后,笔者突然极其痛恨郭小四,因为他的作品总是以一种灰色调调去描述一件阳关灿烂的事情,完事之后还要带上些许奢侈的病态班浮夸去修饰这件美好事物中某一