用户研究:互联网产品的个性化推荐系统

文章描述:个性化推荐系统的研究进展.

上个月写过一篇产品推荐的文章,详情请见《我所了解的产品推荐》,内容很泛,多为工作心得。本周读了几篇相关的论文,收获颇多,分享点干货。
以下内容摘自《个性化推荐系统的研究进展》,该文发表于2009年1月的《自然科学进展》专题评述,作者是刘建国、周涛、汪秉宏。
我略去了具体的算法和许多公式,重点看原理、思路和比较。
互联网技术的迅速发展使得大量的信息同时呈现在我们面前,传统的搜索算法只能呈现给所有的用户一样的排序结果,无法针对不同用户的兴趣爱好提供相应的服务。信息的爆炸使得信息的利用率反而降低,这种现象被称之为信息超载。个性化推荐,包括个性化搜索,被认为是当前解决这个问题最有效的工具之一。推荐问题从根本上说是代替用户评估它从未看过的产品,这些产品包括书、电影、CD、网页、甚至可以是饭店、音乐、绘画等等。
个性化推荐系统通过建立用户与信息产品之间的二元关系,利用已有的选择过程或相似性关系挖掘每个用户潜在感兴趣的对象,进而进行个性化推荐。高效的推荐系统可以挖掘用户潜在的消费倾向,为众多的用户提供个性化服务。 一个完整的推荐系统由3个部分组成:
收集用户信息的行为记录模块
分析用户喜好的模型分析模块
推荐算法模块
推荐算法模块是最核心的部分。根据推荐算法的不同,推荐系统可以分为如下几类:
协同过滤(collaborative filtering)系统
基于内容(content-based)的推荐系统
基于用户-产品二部图网络结构(network-based)的推荐系统
混合(hybrid)推荐系统
其他
1. 协同过滤系统
第一代被提出并得到广泛应用的推荐系统。如amazon的书籍推荐,Jester的笑话推荐,等等。
1)核心思想:利用用户的历史信息计算用户之间的相似性——>利用与目标用户相似性较高的用户对其他产品的评价来预测目标用户对特定产品的喜好程度——>根据喜好程度来对目标用户进行推荐。
在计算用户之间相似度时,大部分都是基于用户对共同喜好产品的打分。最常用的方法是Pearson相关性和夹角余弦。
协同过滤推荐系统的算法可以分为两类,基于记忆(memory-based)&基于模型(model-based)。前者是根据系统中所有被打过分的产品信息进行预测,注重于预测用户的相对偏好而不是评分绝对值;后者是收集打分数据进行学习并推断用户行为模型,再对某个产品进行预测打分。
2)优点:
发现用户潜在的兴趣偏好,推荐新信息
能推荐难以进行内容分析的产品
3)缺点:
由于是基于用户对产品的评分,所以对新用户进行推荐或者是对用户推荐新产品,精度不高
随着用户量的增多,计算量呈线性增加,影响系统的性能
2. 基于内容的推荐系统
是协同过滤技术的延续与发展。
1)核心思想:分别对用户和产品建立配置文件——>比较用户与产品配置文件的相似度——>推荐与其配置文件最相似的产品。
例如,在电影推荐中,基于内容的系统首先分析用户已经看过的打分较高的电影的共性(演员、导演、风格等),再推荐与这些用户感兴趣的电影内容相似度很高的其他电影。基于内容的推荐算法根本在于信息获取和信息过滤。因为在文本信息获取与过滤方面的研究较为成熟,现有很多基于内容的推荐系统都是通过分析产品的文本信息进行推荐。 在信息获取中,最常用的是TF-IDF方法。
2)优点:
能处理新用户、新产品的问题(冷启动)
实际系统中用户对产品的打分信息非常少,基于内容的推荐系统可以不受打分稀疏性问题的约束
能推荐新出现的产品和非流行的产品,发现隐藏信息
通过列出推荐内容的特征,可以解释为什么推荐这些产品,使用户在使用时具有更好的用户体验
3)缺点:
受到信息获取技术的约束,例如自动提取多媒体数据(图形、视频流、声音流等)的内容特征具有技术上的困难
如果两个不同的产品恰好用相同的特征词表示,这两个产品就无法区分
如果一个系统只推荐与用户的配置文件高度相关的产品,那么推荐的只能是与用户之前购买过的产品非常相似的产品,无法保证推荐的多样性
3. 基于网络结构的推荐算法
仅仅把用户和产品的内容特征看成抽象的节点,所有算法利用的信息都藏在用户和产品的选择关系中。
1)核心思想:建立用户—产品二部图关联网络
对于任意目标用户i,假设i选择过所有的产品,每种产品都具有向i推荐其他产品的能力,把所有i没有选择过的产品按照他喜欢的程度进行排序,把排名靠前的推荐给i。
在同样的用户喜好程度下,推荐冷门的产品要比推荐热门的产品意义更大。在同样精确度下,推荐的产品数量越少越好。
提高精确度的方法还有:
去除重复性
通过引入耦合阈值(即只考虑相似性大于或等于给定阈值的用户以及和这些用户连接的产品)
2)优点:开辟了推荐算法研究的新方向
3)缺点:
同样面临着新用户新产品的问题。新用户或新产品刚进入系统时没有任何选择或被选信息,系统无法与其他用户或产品建立关联网络
受到用户选择关系建立时间的影响,如果把用户与产品的所有关联关系都考虑在内,无法区分出长期兴趣和短期兴趣点,过多地考虑长期兴趣点会使系统无法给出满足用户短期兴趣的产品,大大降低推荐准确度
4. 混合推荐
将上述几种推荐方法有机结合,实际的推荐系统中最常见的是基于协同过滤和基于内容的。
1)独立系统相互结合
独立的应用协同过滤,基于内容和基于网络结构的算法进行推荐,然后将两种或多种系统的推荐结果结合,利用预测打分的线性组合进行推荐。或者,只推荐某一时刻在某一评价指标下表现更好的算法的结果。
2)在协同过滤系统中加入基于内容的算法
利用用户的配置文件进行传统的协同过滤计算,用户的相似度通过基于内容的配置文件计算得出,而非共同打过分的产品的信息。这样可以克服协同过滤系统中的稀疏性问题,另外,不仅仅是当产品被配置文件相似的用户打了分才能被推荐,如果产品与用户的配置文件很相似也会被直接推荐。
5. 其他方法
1)关联规则分析:关注用户行为的关联模式。如买了香烟的人大多会购买打火机,因此可以在香烟和打火机间建立关联关系,通过这种关系推荐其他产品。
2)基于社会网络分析的推荐算法:如利用用户的购买行为建立他对产品的偏好相似性,依此向用户推荐产品并预测产品的销售情况,从而加强用户黏性。

时间: 2024-09-16 21:21:51

用户研究:互联网产品的个性化推荐系统的相关文章

色欲永远会伴随着每一个有“人类用户”的互联网产品

摘要: [核心提示] 色欲既是人类发展繁殖的基础和动力,也是人性永恒的弱点.在互联网时代,色欲永远会伴随着每一个有人类用户的互联网产品. yixieshi.com 三年前,极客公园有一个利用人 [核心提示] 色欲既是人类发展繁殖的基础和动力,也是人性永恒的弱点.在互联网时代,色欲永远会伴随着每一个有"人类用户"的互联网产品. yixieshi.com 三年前,极客公园有一个利用人性弱点的互联网系列观察文章,依次从"贪婪"."色欲"."虚

用户研究:互联网用户使用产品的习惯

写在前面:       "观察"将是一个我会长期更新的话题.在这个话题里,主要分享我所遇见的和听到的用户使用产品的习惯,以及如何使用等现象.        强调,我只客观的讲述现象,不会做任何评论,当然,我也没有资格做什么评论.登录",点击第一条结果进入google帐户登录界面.Google.com in English",在右上角登录. 1.某女性论坛用户这么去她喜欢的淘宝店铺      小A,女,24岁,非互联网公司职员,上网主要是购物.看娱乐新闻,经常出没与某

游戏设计机制研究 互联网产品设计的12个理念

中介交易 SEO诊断 淘宝客 云主机 技术大厅 我们中的许多人做事难以集中精神,但在游戏的时候却聚精会神,我们中的大部分人做事缺乏毅力,但这些人却可以坚持玩一个游戏直到天昏地暗.研究游戏设计机制以及游戏中所蕴含的心理特征有助于我们设计出更好的游戏,产品,甚至在日常生活中也能根据相应的原则激励自己,顺利达到预期目标.下面我们就分几方面来研究游戏设计机制,以及引申出来的产品设计原则. 1. 推搡效应. 推搡效应 (Pushing effect) ,是指把商品放在目标买主够得着的地方.原本商场企图通过

用户研究:如何面对产品的定性和定量分析

因为工作需要,经常做风险性分析与效能评估,对于用户研究同学可能更专业的知道定性分析与定量分析,同样的,产品经理.交互设计.用户研究三个同学对这个话题也都应该敏感.但是他们是在产品不同阶段有所侧重点的关注和关心对产品的定性与定量分析. 我们的产品经理,交互设计还是用户研究等同学经常对一个问题争论不休,究其缘由无非我们审视产品的视觉角度不同,其实,说实在话,没有绝对的对错,难道不是吗?尤其是作为产品经理,在项目当中不应该是辩解者的姿态,而应该是事务推动型的控制平衡者. 今天简单聊聊如何面对产品的定性

《互联网产品设计》一2.4 创造界面和交互来塑造用户行为

2.4 创造界面和交互来塑造用户行为 互联网产品设计接下来我们谈谈UI,由视觉设计师和交互设计师设计的用户界面.在这个领域,设计师通过设计界面和交互模式来塑造用户的使用行为. 在我看来,UI的代名词是视觉设计.它就是你看到的产品外观.按钮如何设计?按钮上放什么样式的文字?矩形输入框采用方角还是圆角?顶部导航栏是采用有色背景以使其和当前品牌相得益彰,还是采用中性背景,这样看起来更像原生操作系统? 交互设计则更关心这些界面元素所表现出的行为.点击按钮后会发生什么?点击一个相似的按钮,它是否能产生相似

下一代个性化推荐系统

下一代个性化推荐系统 文/王守崑 本文结合技术及社会需求发展的大背景,讲述了当前推荐系统的价值及所面临的挑战,并指出了下一代个性化推荐系统的设计思路及需要注意的问题. 作为个性化推荐系统核心的协同过滤(Collabora-tive Filtering)算法,是Goldberg等人在1992年的一篇学术论文中最早提出的.他们在这篇文章中提出一种方法,在一个新闻组中,根据 用户下载的新闻计算他们之间在口味上的相似程度,并利用这种相似程度为他们进一步推荐相关的新闻.这也是最早期的个性化推荐系统的雏形.

用户体验简单总结:成功开展用户研究

文章描述:解构用户研究. 随着十几年前"用户体验"这一概念的提出,"用户研究"也逐渐发展成为一个新兴的行业.那么,"用户研究"究竟包括哪些工作内容,在企业中如何开展,实施过程中要注意什么呢? 本文结合个人经验,做一个简单的分析与总结. 用户研究能做什么? 目前,业界更多的是结合产品设计和开发流程来描述用户研究的,如下图所示: 用户研究随着产品开发周期不断迭代进行. 以上这种解释,很好地描述了用户研究在产品设计和开发过程中的持续性和阶段性.然而,基

用户体验:简单的用户研究的分析和总结

随着十几年前"用户体验"这一概念的提出,"用户研究"也逐渐发展成为一个新兴的行业.那么,"用户研究"究竟包括哪些工作内容,在企业中如何开展,实施过程中要注意什么呢? 本文结合个人经验,做一个简单的分析与总结. 用户研究能做什么? 目前,业界更多的是结合产品设计和开发流程来描述用户研究的,如下图所示: 用户研究随着产品开发周期不断迭代进行. 以上这种解释,很好地描述了用户研究在产品设计和开发过程中的持续性和阶段性.然而,基于产品设计和开发的用户研究

用户研究的元思考:获取、提炼、转化

文章描述:用户研究三部曲:有关用户研究的战略思考. 用户研究的"元思考" 钻研任何一个领域,都离不开"元思考",或者称为"战略级思考":思考它要解决的基本问题是什么,思考它的核心的方法路径是什么,以及思考它面临的最大挑战是什么.用户研究如是. 用户研究面临的最大挑战是研究与设计之间的鸿沟,也就是说,研究的结果常常难以落地,难以为产品的设计和创新发挥直接可见的作用.因此,一种"用户研究无用论"的观点在业界颇有市场,最被人广泛提及