用户需求满足和需求满足要解决的核心问题

文章描述:Image需求满足方向才刚刚起步,未来要向智能化,自动化,多样化方向持续的发展。我们最终的目标是把需求满足这个方向做没了,需求挖掘,资源满足全部自动化,做到“手中无剑 心中有剑”。

一、什么是需求满足

1.1 什么是需求满足

用户来搜索“章鱼 保罗”,就文本相关性而言,搜索引擎只要返回和“章鱼 保罗”内容相关的结果就可以了,这样用户是否满意呢?

用户甲:听说章鱼帝挂了,来看看最新结果,怎么全是8月份的,往后翻页中…

用户乙:今天同事们在讨论章鱼哥挂了,章鱼哥是啥?我又out了,来搜索一下章鱼帝生平事迹是啥,怎么全是最新的结果,没有章鱼哥的介绍啊,变换个query看看

用户丙:我是铁杆球迷,看完章鱼哥,再看看足球相关的吧,鲁尼,杰拉德是否又进球了,怎么连个相关推荐都没有,还得我亲自输入。

用户丁:找个章鱼哥的头像用一下吧,一定很拉风,怎么全是结果没有方图呢,这么扁的图怎么用啊

用户戊:换个章鱼哥的壁纸,也许下次买彩票能发大财,咦,怎么全是小尺寸的图…

(以上信息通过分析2010-10-27用户session得出。)

笼统的说,用户向搜索引擎表达他的需求,搜索引擎理解用户需求,提供各不同的需求下的资源,这整个过程可统称为需求满足。简单说,就是除了基础文字相关性之外的rank工作,都属于需求满足的范畴,也就是说,提供给用户的检索结果,不仅仅要求在字面上是和用户输入的文字相关的,还要满足用户的各种不同需求。

需求满足在rank体系中所处的位置:


1.2 为什么需要需求满足

用户通过query表达了自己的需求,而对于大部分query来说,尤其是具有隐含需求的query,仅仅字面匹配的查询结果未必能够满足其需求。目前我们的排序系统是主要是基于文本相关性这个维度的,权值体现了query中的term与obj的相关程度,在这个体系下,相关的结果未必能够满足用户需求。

例如前面提到的“章鱼 保罗”的例子,显然,这些需求在文本相关性这个维度下很难解决,尤其涉及到突发时效性需求,泛需求等。

1.3 需求满足包含哪些工作

从上面的例子中,可以看出,需求满足需要解决时效性需求问题,多需求问题,相关推荐,size需求,素材类需求,浏览引导等问题。除了基础文本相关性以外的rank策略以及为了这些所做的query分析工作可认为属于需求满足的工作,另外还包括前端结果展现与用户引导浏览的工作。

Image需求满足,按照不同的维度,可以划分为如下几个方面:

  1. 需求识别
  2. 资源建设
  3. 需求调权
  4. 结果组织与推荐
  5. 用户引导交互

二、需求满足如何做

需求满足要解决的核心问题

需求识别

资源建设

需求调权

2.1 需求的识别

2.1.1 需求的类型

识别query有哪些需求,以及需求的强弱,是最基础的工作。首先要有需求的体系,能完备的描述各种需求,其次是如何识别这些需求,把每个query的需求对应到这个体系中去。

通过query分类识别需求

现在线上query分类体系,是按照话题属性为依据来建立的。包括风景类,地名类,人物类,汽车类等等,对于每个类别,在一些维度上的需求是不一样的,比如风景类需要尺寸比较大,比较清晰,不包含人的图片,而聊天类则需要尺寸较小,最好是动态的gif图。

这个策略下的项目有:size调权,格式调权,人脸需求,人与非人等。

基于统计的需求识别

通过对大量的数据统计分析,可以识别出query有哪些方面的共性。可供分析的数据很多,比如用户行为数据,点击反馈,检索结果等。

比如:对query的检索结果,按照某一feature进行聚类,如果某个类别所包含的图片数很多,超过设定阈值时,则认为这个类别内的图片,在这个feature上,代表了这个query的需求。线上人脸需求识别就是这样来做的。

统计用户反馈来获取需求是最能反映用户需求的方式,用户的反馈包括用户点击,query变换等,在这方面我们做的工作不多,经验也不多,是我们后续工作的重点。

专名&需求词

判断query中包含专名或者需求词等关键词,是最直接的方式。比如“红色宝马”,显示的表达了颜色方面的需求。

时效性需求

时效性需求包括三部分,突发时效性、周期时效性和泛时效性需求,目前线上做的是突发时效性需求。需求的识别,主要是通过检索量的突发,资源数突发和实效性事件来判断的。

检索量的突发,是指累积每个小时的用户检索频率,用连续15天的用户检索频率,计算突发的斜率,根据斜率的大小,来判断时效性需求的强弱。

上述方法只适合热门query,对于长尾query,检索频率很低,无法通过这种方式识别出来,一般这种query是多term的query,可以通过是否命中关键词来判断:

通过事件判断:这种方式,主要是想看关键term命中时效性事件的比例。当然这些事件是通过主动挖掘的时效性query,通过聚类后,对每个类别训练出来的关键词。

2.1.2 需求的强弱

要做好需求满足,不仅要识别query有哪一类型的需求,而且要识别该类型需求的强弱,他直接指导了后续需求调权的力度。

每个维度的需求,必须要有需求的强度,在各维度调权合并时,需求的强度决定了该维度的权值。比如时效性需求,需求的强度很高,要求满足时效性的资源,一定要排在前面。又比如清晰度 饱和度调权,对大部分query而言,需求不是很强烈,调权时的力度就不能太大。

需求强弱的计算,和后面rank model的要求相关,理想的状态是每个query,可以动态的计算在每个维度上的需求强弱,我们在这方面经验不多,如果暂时不能做到准确的计算的话,暂时可以考虑人工指定的方式,比如针对不同的query分类,人工设定需求维度的强度。目前可以想到的一些方式:

显式的需求为强需求

用户通过在query中包含需求词的方式,表达自己的需求,这样的为强需求。

比如,最新刘德华图片,红色宝马

基于统计的方式挖掘需求时,判定值超出阈值的比例大小,决定需求的强弱

在用统计挖掘用户需求的方法时,一般会选取某个维度的属性,量化后计算它的统计特性,可以根据统计后该数值的分布情况,判断需求的强弱。比如,时效性需求,某段时间内,该query检索量突发特别大,是昨天检索量的100倍,如果我们设定的阈值是2倍的话,那么这个query就可认为时效性需求特别强。

又比如通过用户点击数据挖掘size需求,对于头像类的query,大部分用户点击的是100*100的方图,但是所占总点击中的比例不是很高,比如只到60%,那么对这个query而言,size需求是一般强度的需求。

2.2 需求的满足

识别出query有哪些需求,下一步的工作就是提供相应的资源。

2.2.1 资源的挖掘

如何获得满足需求的资源,是需求满足的另一个核心问题。在资源上,通过某一个或者几个特征组合,能够把满足要求的资源和不满足要求的资源区分开,找到用户需求需要的资源,去掉不满足要求的资源,是主要的工作。

内容属性特征

对内容属性维度来说,可以分为底层的物理特征,中层的物体识别和高层的语义特征;对于底层的物理特征,相对比较简单,我们现在可以利用的,包括尺寸,颜色,格式,清晰度饱和度等,中层特征,我们目前用到的不多,有人与非人的,色情图片的,整车的识别,手机图片的识别等;对于高层的语义特征,包括场景的识别,图片风格的识别,是我们未来发展的方向。

话题属性维度

类似的query分类的体系,也可以对资源进行相似的话题属性分类,我们目前只做了站点级别的分类,效果不是很理想,主要原因一是站点粒度太粗了,二是站点分类的召回存在很大的问题。

我们希望能做到obj级别粒度的分类,至少是页面级别的分类。如果有了话题属性的分类,和query需求的分类相配合,可以达到事半功倍的效果。

时效性资源的收录

我们目前时效性资源主要是挖掘的ps的时效性库,和news的资源,和非时效性资源的区分是比较容易的。

2.2.2 需求调权

明确了query的需求,挖掘了满足需求的资源,那么如何把满足需求的资源rank到前端呢?

对于各种不同的需求维度,都有自己的调权的策略。比如格式调权,假设query有gif图需求,对于gif的动态图,权值乘了1.2,对于静态图要降权,权值乘了0.1。又比如时效性需求,直接在前三页插入的时效性库的结果,这是因为时效性需求是一个强需求维度,简单的加权,不能保证结果调整到前三页。从这些例子中可以看出,目前需求调权的策略就是2种类型:在总权值上调权,在最后排序结果上调序。

目前这种策略直接叠加的调权方式,优点是简单,直接,缺点也比较多,最大的是不可控,一个维度上的调权,会对最后结果造成多大的影响,在多个调权维度上,他说的话,分量有多大,不知道。

未来的需求调权,首先应该把资源满足需求的情况,做出细化的分档,做到有直观的物理含义,其次,根据该维度需求的强弱,把这个维度的打分反映到最终结果中去,究竟是跨档调权还是档内微调,比如:

强需求:符合要求的结果直接调到最高档,比如时效性需求

一般需求:符合要求的结果,可以根据一定规则,提高自身档位

弱需求:不能提升档位,在同一档内,做权值调整

2.3 需求满足的效果

前面已经完成了query需求识别,资源识别已经需求调权的工作,那么用户是否满足了呢?搜索引擎最终是给用户服务的,用户觉得爽,才是最重要的目标。那么如何知道用户是否满意呢?

用户接收到搜索引擎的提供的信息后,会对这些信息做出反馈。这些反馈包括了用户对搜索结果的点击、对query的主动变换,以及这些行为之后的相关行为。通过对这些数据的分析,可以知道用户的满意度。

比如对需求识别的修正,通过用户点击反馈,可以知道query需求识别的是否正确,该需求是否该退场。比如时效性需求,被误判的query或者应该退场的query,都可以通过用户的反馈,来判定是否应该退场。

当然,这种方式是否合理还有待调研,毕竟用户不点击一张图的原因有很多可能,有可能是需求识别的问题,有可能是该维度强弱识别的问题,也有可能是rank的问题。目前用户反馈应用只有点击调权,是否用户的反馈可以在单独的维度上有效,还需要详细的调研分析。

另外,随着时间的推移,query的需求是在不断变化的,通过用户的反馈,可以做出及时的调整。

三、需求满足的展望

3.1 需求满足体系框架的建立

之前做了很多需求满足的工作,颜色,格式,尺寸,人脸,表情,头像等等,分别是case by case来做的,其实他们之间存在着很多相似的地方。从调研过程来看,可以分为需求识别、资源满足和需求调权三大部分。

这样分散的各个点去做,有很多弊端,一是调研重复,效率低;二是前端调权系统像打补丁一样,越来越乱,没有形成清晰的体系框架。三是容易造成调权重复。

目前比较好的思路是建立需求满足的体系框架,包括前端的需求分析和后端需求调权。前端分析清楚query包含哪些需求,以及每个需求的强弱,把这些信息传递给后端;后端首先要有各个需求所对应的资源,然后结合上面提到的需求调权,给每个obj一个合适的档位和权值。

以后再做需求满足类项目时,只需要调整前端的需求识别即可,如果没有新增的需求维度,后端的资源和需求调权,都可以不用改动。

3.2 更智能的需求识别

1. 分析用户行为数据挖掘需求

   用户在搜索过程中,能够被我们记录下来的一切行为,比如点击,翻页,query变换,停留时间,去向,来源等等,利用好这些数据,就能更好地理解用户的意图。目前在这方面的应用还只有点击调权,需要挖掘方面的应用还很少,是我们未来工作的重点方向。

2. 个性化需求挖掘

   通过分析session,可以获取个性化的用户个体需求。目前我们结果的展示的好坏,主要是通过分析session,来判断用户的需求,而对于高频query,展示的结果是大规模用户的行为统计,得出的一个普适的模型,这个模型由于是统计出的,因此具有客观性,可能会伤害一部分个性用户。

3. 需求强度的识别

每个维度的需求,必须要有需求的强烈度,在各维度调权合并时,需求的强度决定了该维度的权值,比如时效性需求,需求的强度很高,要求满足时效性的资源,一定要排在前面。又比如清晰度 饱和度调权,对大部分query而言,需求不是很强烈,调权时的力度就不能太大。

3.3 资源建设

目前我们在query分类,query需求识别,query分析方面做了大量的工作,相比较而言,资源方面的建设,我们做的工作比较少,接下来希望推动obj级别的资源分类,内容属性上的几个资源分类:图标资源识别,地图资源识别,卡通动漫图的识别,以及一些截图的识别。

3.4 需求引导

Image是浏览型为主的产品,如何引导用户更加方便的浏览,是未来工作的重点之一。

我们已经尝试了明星结果页的query分类展示,未来我们希望能对更多类别的query,做主动引导。引用pm对主题式query的定义:“主题式”Query是指:Query指代的人、事、物中包含有多方面内容,具体表现为Query对应目前的检索结果中存在明显的多方面内容的混杂情况。其实就是指泛需求、多需求的query。

对于这种泛需求query的结果的展示样式,这种分tab多结果页的形式也未必是最优的,如何更好的发挥作用,需要更加深入的调研和创新的思路。

另外,还包括对rs展示优化,动态摘要的显示和套图展现等方面的持续升级。

四、结语

Image需求满足方向才刚刚起步,未来要向智能化,自动化,多样化方向持续的发展。我们最终的目标是把需求满足这个方向做没了,需求挖掘,资源满足全部自动化,做到“手中无剑 心中有剑”。

时间: 2024-09-09 06:26:49

用户需求满足和需求满足要解决的核心问题的相关文章

需求-求一解决数据字典问题的思路

问题描述 求一解决数据字典问题的思路 现有一业务需求如下:一订单流转平台,想要把不同商家的订单都通过该平台进行流转,而每个商家所用软件都不一样 有用ERP 有用金蝶的等(也就是说通过订单流转平台给每个企业下单 而每个企业的商品数据字典都不一样 那么订单平台如何实现数据字典的匹配 ) 比如说: 同一个商品 在ERP中叫 A 而在金蝶中 叫 B 而下单的时候叫 C 问题是:如何在订单流转平台来匹配到 ERP中的A 或者是 金蝶中的B?

百度推广根据用户需求满足个性化需求

百度推广所具有的覆盖面广.针对性强的特点,让不同类型的企业都能有效覆盖和锁定自己的目标客户,实现最佳的营销效果.对于专业性很强的行业,因为客户数量少.聚集度低,往往不适宜用电视报纸等传统推广手段开展营销.而http://www.aliyun.com/zixun/aggregation/11238.html">百度推广不仅能够有效覆盖4亿网民,更能根据网民进行搜索的关键词,准确判断他们的需求,帮助企业找到这些专业客户,并面向他们精准展现产品和服务信息. 其次,百度推广是按效果付费的,发布推广

CCAI 2017 | 专访德国语言技术领军者 Hans Uszkoreit:深度学习还不足以解决 NLP 核心问题

会前,我们采访到了大会 Keynote 嘉宾.德国人工智能研究中心科技总监 Hans Uszkoreit 博士. Uszkoreit 博士是中德两国人工智能合作的核心人物,负责德国人工智能研究中心在中国的所有合作项目,今年 3 月,他刚被任命为在北京新成立的人工智能技术中心(AITC)总监兼首席科学家.在访谈中,Uszkoreit 博士谈到了人工智能在工业 4.0 和商业智能上的应用,以及中.美.欧在人工智能领域的差异. 对于他的老本行,Uszkoreit 博士认为,语言技术是人工智能的核心部分

搜索引擎实现图片检索的用户需求

文章描述:搜索引擎如何实现用户图片检索的需求满足. 一.什么是需求满足 1.1 什么是需求满足 用户来搜索"章鱼 保罗",就文本相关性而言,搜索引擎只要返回和"章鱼 保罗"内容相关的结果就可以了,这样用户是否满意呢? 用户甲:听说章鱼帝挂了,来看看最新结果,怎么全是8月份的,往后翻页中- 用户乙:今天同事们在讨论章鱼哥挂了,章鱼哥是啥?我又out了,来搜索一下章鱼帝生平事迹是啥,怎么全是最新的结果,没有章鱼哥的介绍啊,变换个query看看 用户丙:我是铁杆球迷,看完

如何进行需求的挖掘

需求满足综述 一.什么是需求满足 1.1 什么是需求满足 用户来搜索"章鱼 保罗",就文本相关性而言,搜索引擎只要返回和"章鱼 保罗"内容相关的结果就可以了,这样用户是否满意呢?用户甲:听说章鱼帝挂了,来看看最新结果,怎么全是8月份的,往后翻页中-用户乙:今天同事们在讨论章鱼哥挂了,章鱼哥是啥?我又out了,来搜索一下章鱼帝生平事迹是啥,怎么全是最新的结果,没有章鱼哥的介绍啊,变换个query看看用户丙:我是铁杆球迷,看完章鱼哥,再看看足球相关的吧,鲁尼,杰拉德是否

需求满足综述

一.什么是需求满足1.1 什么是需求满足 用户来搜索"章鱼 保罗",就文本相关性而言,搜索引擎只要返回和"章鱼 保罗"内容相关的结果就可以了,这样用户是否满意呢? 用户甲:听说章鱼帝挂了,来看看最新结果,怎么全是8月份的,往后翻页中- 用户乙:今天同事们在讨论章鱼哥挂了,章鱼哥是啥?我又out了,来搜索一下章鱼帝生平事迹是啥,怎么全是最新的结果,没有章鱼哥的介绍啊,变换个query看看 用户丙:我是铁杆球迷,看完章鱼哥,再看看足球相关的吧,鲁尼,杰拉德是否又进球了,

搜索引擎中用户图片检索的需求满足怎么实现?

一.什么是需求满足 1.1 什么是需求满足 用户来搜索"章鱼 保罗",就文本相关性而言,搜索引擎只要返回和"章鱼 保罗"内容相关的结果就可以了,这样用户是否满意呢? 用户甲:听说章鱼帝挂了,来看看最新结果,怎么全是8月份的,往后翻页中- 用户乙:今天同事们在讨论章鱼哥挂了,章鱼哥是啥?我又out了,来搜索一下章鱼帝生平事迹是啥,怎么全是最新的结果,没有章鱼哥的介绍啊,变换个query看看 用户丙:我是铁杆球迷,看完章鱼哥,再看看足球相关的吧,鲁尼,杰拉德是否又进球了

互联网产品经理实现产品需求而不是用户需求

文章描述:产品经理的四点思考:不该简单满足用户需求. 文档"> 本文根据自己做产品的经验,提炼出4点思考分享给大家 淘宝鬼脚七 一淘搜索.淘宝搜索产品负责人(文德) 产品经理是个很奇怪的岗位,好像大多数人都能做,因为每个人对某个产品都有自己的看法,都能提出一些意见和想法,甚至能设计实现原理:也好像大多数人都做不好产品经理,因为互联网上成千上万个产品,大部分是垃圾,没几个产品是用户真心觉得很不错的. 我做产品经理,还不到两年,以前十来年一直在做技术.之前做技术的时候,我很看不上产品经理.当时

详谈SEO中如理解决用户隐性需求

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 根据最近搜索引擎算法的微调,可以看出今年搜素引擎仍然会像去年一样,慢慢的像用户为主的方向靠近.那么我们从事SEO这个行业的广大站长们如何才能与搜索引擎保持一致,做到以用户为主的优化呢?其实很简单,解决隐性需求就可以达到我们的目的. 那么到底什么是隐性需求 一般来说的话,隐性需求就是各位用户在使用搜索引擎的时候所想到的一些需要的物品和服务.这种