百度框计算中的需求分析概述

  框计算的目标是为用户提供基于搜索框的一站式搜索服务。举例来说,当用户在搜索框中输入“非诚勿扰”时,系统就能明确该query有寻求电视节目视频、电影视频、查找影评、参与讨论及查看相关新闻等需求,然后将这些不同的需求分配给最优的内容资源或应用进行处理,最终精准高效地将满足这些需求的结果展现给用户。图1展示了“框”对query“非诚勿扰”的满足情况。从上面的分析中,我们不难看出,框计算的第一步,就是识别出一个query具有哪些需求,而这正是需求分析要完成的任务。

  

 

  图1 “非诚勿扰”的框计算结果

  需求分析是框计算的入口,因为只有分析出query的需求,才能更好地展现出相应的结果来满足用户的需求。因此对query的需求分析得越准确、覆盖的query准多,用户的满意度则越大。需求分析是框计算中最重要也是难度最大的地方之一。

  识别query的需求,最容易想到的方法是查词表。比如将所有的电影、电视剧名都事先收集起来,放到词表中,只要用户输入该词表中的词,就能识别出一个query是否有寻找视频的需求。这种方法的优点是快,但缺点非常明显:首先,这种方法只能将query划分为2个维度,要么有视频需求,要么没有视频需求。但很多视频的名字,具有多方面的含义,在视频上面只是其中一个微弱的含义,如果直接出视频需求,则会极大地伤害用户。比如,有一个广告片的名字叫“百度一下”,这个广告片可能60%以上的用户都不熟悉,如果这60%以上的用户输入“百度一下”,直接给出一个名为“百度一下”的视频观看结果,则这60%以上的用户会感觉非常困惑。其次,这种方法不能很好地满足大部分用户的需求。用户在寻找视频时,表述方法是多种多样的,比如:士兵突击全集、士兵突击 高清、士兵突击全集在线观看等,这3个query都具有强烈的寻找视频需求,但通过查表的方法,却无法识别出该需求。再次,这种方法对电影、电视剧外的视频需求无法满足。有视频需求的往往不止电影、电视剧,流行或新闻时效性的很多东西,都具有强烈的视频需求。比如:西单女孩、中关村男孩、钓鱼岛撞船、朝韩炮击等,多数用户往往都有查看相关视频的需求。最后,这种方法缺乏预测性,识别出的query数量有限。即对于词表中的词条,能够识别出视频需求,但词表外词条,无法识别出视频需求。因此,如果词表的规模为N,则最多只能识别出N个query具有视频需求。

  从上面的分析中,我们可以总结出,一个好的需求分析方法,至少要满足如下需求:1)具有很高的准确率以及召回率,即能在识别出90%以上query需求的同时,又能保证识别出来的需求,95%以上都是正确无误的;2)具有良好的预测能力,即能够准确地预测出未知query的需求;3)具有识别需求与解析字段功能,即在识别出query需求的同时,还能高效地从中解析出所需信息。

  下面是几个典型的例子。通过这些例子,大家就能对需求分析要完成的任务有一些大体的了解了。

  在图2中,需求分析需要完成的任务就是解析出query具有汇率转换的需求,并解析出数额56.7,以及源货币为美元,目标货币为人民币。

  

 

  图2 直接展现汇率结果

  在图3中,需求分析需要识别出该query具有查找火车时刻表的需求,并解析出起点站为北京,终点站为上海。进而直接为用户展现出从北京到上海的火车时刻表,极大地方便了用户获取相关信息。

  

 

  图3 直接展现火车车次相关信息

  图4、图5分别展示了需求分析如何通过识别出query具有查找生僻字以及单位换算的需求,并直接给出答案的过程。这个过程对用户而言是不可见的,但是对系统而言,却需要进行一系列复杂的识别、解析与展现。

  

云计算需求分析">

 

  图4 满足生僻字查询需求

  

 

  图5 满足单位换算需求

  图6显示了需求分析识别出了用户的query具有寻求招聘职位信息的需求,并解析出公司名,职位2个字段,而后系统直接从相关数据源中检索出所需职位展示给用户的示例。

  

 

  图6 满足用户搜索招聘职位需求

  从上述分析与示例中可以知道,query需求分析的目标是识别出query的意图或感兴趣的领域,并从中抽取出所需字段。要完成这项任务,是一件非常有挑战性的工作。首先,用户query表述方式的多样性给需求分析带来了不少困难。比如,关于寻找天气这一种需求,用户就有上百种不同的表达方式。其次,相近query可能具有截然不同的需求。比如:“从北京到上海车距”与“从北京到上海车票”,前者具有较强的自驾需求,而后者具有较强的火车时刻查询需求。而同样为明星,王菲、张学友,都具有强烈的视频、图片等需求,而李开复、张亚勤等科技明星,从用户的需求来看,最强烈的需求是寻找百科信息,而非视频、图片。最后,用户输入的query往往使用自然语言进行表述,有时还包含缩略与拼写错误,比如:5新加坡元=?美元、5人名币等于多少美元等。这些客观存在的问题,都加大了需求分析的难度。

  为更好地满足用户各式各样的需求,强大的需求分析是必须具有的。百度框计算的需求分析,是通过对query的语义分析,结合用户行为分析以及海量计算技术实现的。通过各种手段评估,目前已经达到了很好的效果。举例来说,通过对一天几百亿次用户检索query的分析,使用机器学习的方法,我们就能自动从中学习出用户的各种惯用或冷僻的表述方式,再结合语义分析、信息抽取等技术,就能准确高效地实时识别出query的需求并解析出所需信息,为广大网民提供最便捷的搜索服务以及搜索体验。

时间: 2024-10-15 21:20:23

百度框计算中的需求分析概述的相关文章

需求分析设计:框计算中的需求分析实例

文章描述:框计算中的需求分析概述. 框计算的目标是为用户提供基于搜索框的一站式搜索服务.举例来说,当用户在搜索框中输入"非诚勿扰"时,系统就能明确该query有寻求电视节目视频.电影视频.查找影评.参与讨论及查看相关新闻等需求,然后将这些不同的需求分配给最优的内容资源或应用进行处理,最终精准高效地将满足这些需求的结果展现给用户.图1展示了"框"对query"非诚勿扰"的满足情况.从上面的分析中,我们不难看出,框计算的第一步,就是识别出一个quer

对百度框计算实际效用的三点质疑

中介交易 SEO诊断 淘宝客 云主机 技术大厅 世界上有需求和欲望的时候,基于这样目标的"创新"产品于是便会浮现在眼前,只不过在互联网领域,大多互联网公司则是用"需求"粉饰"欲望",这样除了具有"名正言顺"的理由之外,还可以以期得到更多不名真相的群众的追捧.百度在一年前推出框计算的时候,我曾写过质疑框计算实际应用的博文,一周年的时光成为历史的时候,百度框计算确实也给中文互联网确实带来了一定的创新,但相应地,框计算也带来了百度并

围观百度框计算:互联网多元化的公敌

中介交易 SEO诊断 淘宝客 云主机 技术大厅 百度框计算开放平台的推出,似乎给搜索引擎带来了空前新奇的信息应用前景.业界人士对这百度框计算应用开放平台寄予了空前的关注.然而,站长心头始终存在疑虑:百度将秉承一个什么样的标准选择合作伙伴,并拉入"框"中?在面对自己的投资公司与合作伙伴时,百度将会"框"住谁? 在上周五结束的2010百度世界大会上,李彦宏针对这些疑虑做了解答,百度最重要的标准是满足用户的需求,不会因为照顾跟自己有利益关系的合作伙伴而改变搜索规则.根据百

Google wave&百度框计算web3.0?

中介交易 SEO诊断 淘宝客 云主机 技术大厅 晚上看到一篇名为:<google wave:入口的争夺>的文章,让我联想到了百度前阶段推出的框计算应用,并产生了一点浅薄的想法. Google wave被称作一款网络交流服务,它最大的特色将现有的很多通讯方式与应用整合于一身,并且开放API,允许开发者在google wave上开发更多的应用.本人虽然并未使用过google wave,但从一些文章中可以得知,简单说来,google wave就是一个整合多种网络应用,包括社交网站(facebook)

浅谈百度框计算和SEO的关系

百度今年提出了所谓的框计算,对于我们从事SEO的人员来说,多少会有冲击,对各种网站站长来说更是充满挑战,同时也有很多机会.首先我们要了解什么是框计算.所谓的框计算就是指用户在显示的框内输入关键词,百度的系统就会通过请求识别匹配最佳内容提供者,然后将结果展示给用户.如图:     目前百度框计算运用的领域主要有: 1.公共生活信息类如:天气预报,北京时间,列车航班,彩票开奖 2.娱乐休闲信息如:电视,电影,漫画,综艺,星座 3.体育赛事信息如:奥运会,世界杯,全球五大足球赛事,亚运会 4.重大时事

百度“框计算” 只是一场商业阴谋

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 2009年百度世界技术创新大会,百度推出了其"框计算"的概念,一石惊起千层浪.框计算,对任何人来说都是个抽象的概念,尤其让李彦宏中英文夹杂着解释,听着更高深莫测.大概的意思好像是以后只要用户有任何需求的时候,只要在百度的框计算中搜索就行,百度框计算的目标就是用户输入任何信息都能返回满足用户需求的信息.这听起来是个挺美好的愿

百度“框计算”是否有卖点?

度世界大会开的前一天,谷歌也开了一个主题为"互联网-未来"的会,请来了互联网之父做讲演,无形中"盖冒"了百度,至少从地图或搜索产品创新展示角度,让百度 所谓的技术创新"黯然失色",到底站在哪个巨人肩膀上 成了业界悬案. 而从百度自身来看,此次大会虽然延续了往届世界大会的风格,但仍旧重点突出了"技术创新",并且李彦宏提出了所谓的"框计算",直指微软.Google等提出的"云计算"或&quo

百度“框计算”改变生活的3个瞬间

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 2009年8月18日,百度创始人李彦宏向世人展示了"框计算"的美好愿景未来,打开电脑或其他任何终端,界面上只有一个简单的框,只需要向其中输入我们的需求,框便可以自动对其进行识别,并在互联网可选范围内自动匹配满足我们相关需求的上佳应用和服务,反馈给我们想要的结果. 一年过去了,这个听上去像是"天方夜谭"的

百度框计算:铸就赢家通吃 还是终结草根站长

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 百度董事长兼首席执行官李彦宏在2009年8月18日"百度技术创新大会"上提出"框计算"全新技术概念,时至今日,对百度而言,"框计算"的概念也从理想图景变为了现实.9月2 日,百度在中国大饭店举办了2010百度技术创新大会,百度创始人李彦宏宣布推出开放数据及应用平台,追寻中文互联网未来