《推荐系统:技术、评估及高效算法》一第3章Recommender Systems Handbook基于内容的推荐系统:前沿和趋势

第3章Recommender Systems Handbook基于内容的推荐系统:前沿和趋势

Pasquale Lops、Marco de Gemmis和Giovanni Semeraro Pasquale Lops,Department of Computer Science,University of Bari“Aldo Moro”,Via E.Orabona,4,Bari(Italy) e-mail:lops@di.uniba.it
Marco de Gemmis,Department of Computer Science,University of Bari“Aldo Moro”,Via E.Orabona,4,Bari(Italy) e-mail:degemmis@di.uniba.it
Giovanni Semeraro,Department of Computer Science,University of Bari “Aldo Moro”,Via E.Orabona,4,Bari(Italy) e-mail:semeraro@di.uniba.it
翻译:吴涛,吉林大学丁彬钊,徐世超 审核:胡聪(胡户主),北京大学王雪丽,郑州大学吴宾

摘要 推荐系统以个性化的方式指引用户在众多选择中找到感兴趣的东西。基于内容的推荐系统会发掘用户曾经喜欢的产品,从而尝试去推荐类似的产品使其满意。事实上,基于内容的推荐系统主要的处理方式在于利用用户已知的偏好、兴趣等属性和物品内容的属性相匹配,以此为用户推荐新的感兴趣的物品。本章概述了各种基于内容的推荐系统,目的是在其各种设计原理和实现方法中理出头绪。本章第一部分介绍了基于内容推荐的基本概念、专业术语、高层次的体系结构和主要的优缺点。第二部分通过详尽描述能够表示物品和用户信息的经典先进技术,给出了几个应用领域内使用的最先进技术的概述。同时,也阐述了一些被广泛使用的学习用户兴趣的技术。最后一部分讨论了推荐系统的趋势和下一代推荐系统的研究方向,其中描述了考虑到在词汇表不断演变情况下用户产生内容(UGC)的作用,以及为用户提供一些偶然性的推荐的挑战,即推荐出乎意料地能够让用户感兴趣,而又无法通过其他方法发现的物品。

时间: 2024-09-11 09:14:50

《推荐系统:技术、评估及高效算法》一第3章Recommender Systems Handbook基于内容的推荐系统:前沿和趋势的相关文章

《推荐系统:技术、评估及高效算法》一第2章Recommender Systems Handbook推荐系统中的数据挖掘方法

第2章Recommender Systems Handbook推荐系统中的数据挖掘方法 Xavier Amatriain.Alejandro Jaimes.Nuria Oliver和Josep M.Pujol Xavier Amatriain,Telefonica Research,Via Augusta,122,Barcelona 08021,Spain e-mail:xar@tid.esAlejandro Jaimes,Yahoo!Research,Av.Diagonal,177,Barce

《推荐系统:技术、评估及高效算法》一3.1 简介

3.1 简介 网络上和数字图书馆中,存在着大量而丰富的信息,由于它们的动态性和多样性,很难快速找出我们想要的或最能满足我们需求的东西. 因此,用户建模和个人资料访问的作用变得越来越重要:根据喜好和品位,用户需要个性化的支持来从大量信息中筛选出可用信息. 大量的信息来源显示,推荐系统是能够满足用户个性化需求的一种方式[73].推荐系统在巨大的可能选择范围内引导用户发现感兴趣的或有用的个性化推荐结果[17].推荐算法把用户的兴趣作为输入来产生一个推荐列表.亚马逊的推荐算法用于为每个用户定制一个网上商

《推荐系统:技术、评估及高效算法》一2.3 分类

2.3 分类 分类器是从特征空间到标签空间的映射,其中特征代表需要分类的元素的属性,标签代表类别.例如,餐厅推荐系统能够通过分类器来实现,其分类器基于许多特征描述把餐厅分成两类中的一类(好的,不好的). 有许多种类型的分类器,但是一般情况下我们谈的有监督分类器和无监督分类器.在有监督分类器中,我们预先知道一组标签或是类别,并且我们有一组带有标签的数据,用来组成训练集.在无监督分类中,类别都是提前未知的,其任务是恰当地组织好我们手中的元素(按照一些规则).在本节中我们描述几个算法来学习有监督分类,

《推荐系统:技术、评估及高效算法》一3.4 趋势和未来研究

3.4 趋势和未来研究 3.4.1 推荐过程中用户产生内容的作用 Web 2.0是一个描述万维网技术趋势的术语,万维网的目标是促进用户之间的信息共享和协作.按照Tim O'Reilly http://radar.oreilly.com/archives/2006/12/web-20-compact.html,Accessed on March 18,2009说法,术语Web2.0的意思是以用户为中心,设计用户产生内容的软件,因为其内容是由成千上万用户所贡献的,如Flickr,Wikipedi

《推荐系统:技术、评估及高效算法》一3.3 基于内容的推荐系统的现状

3.3 基于内容的推荐系统的现状 顾名思义,基于内容的推荐是利用物品的内容数据来预测它和用户个人信息的相关性.基于内容的推荐系统的研究涉及计算机科学的许多方面,尤其是在信息检索[6]和人工智能领域. 在信息检索领域,推荐技术研究的想象力来自将用户搜索推荐结果看作一个信息检索的过程.在信息检索系统中,用户需要给出一次性查询信息(经常是一个关键词列表),而在信息过滤系统,用户的信息需求被表示成他的个人信息.由于用来描述物品的属性在数量和类型上的差异,待推荐物品也会有较大差异.每个物品当然可以用一组已

《推荐系统:技术、评估及高效算法》一导读

前 言 推荐系统是为用户推荐所需物品的软件工具和技术.提供的推荐旨在通过各种决策过程来支持用户,例如,买什么物品.听什么歌或者读什么新闻.推荐系统对于在线用户处理信息过载是一个非常有价值的方法,并成为电子商务领域最强大和流行的工具.因此,人们提出了各种各样的推荐技术,并在过去的10年中将其中很多方法成功地运用在商务领域. 推荐系统的发展需要多学科的支持,涉及来自各个领域的专家知识,如人工智能.人机交互.信息检索.数据挖掘.数据统计.自适应用户界面.决策支持系统.市场营销或消费者行为等.本书旨在基

《推荐系统:技术、评估及高效算法》一2.4 聚类分析

2.4 聚类分析 扩展CF分类器的最大问题是计算距离时的操作量,如发现最好的K近邻.如我们在2.2.3节中所看到那样,一种可能的解决方法是降维.但是,即使降低了特征维度,仍有许多对象要计算距离,这就是聚类算法的用武之地.基于内容的推荐系统也是这样,检索相似对象也需要计算距离.由于操作量的减少,聚类可以提高效率.但是,不像降维方法,它不太可能提高精确度.因此,在设计推荐系统时必须谨慎使用聚类,必须小心地衡量提高效率和降低精度之间的平衡. 聚类[41],也称为无监督的学习,分配物品到一个组中使得在同

《推荐系统:技术、评估及高效算法》一2.6 总结

2.6 总结 本章介绍了在设计推荐系统中可能用到的主要的数据挖掘方法和技术.我们也总结了在文献中提到的用法,提供了如何以及在哪用到它们一些粗略指导. 我们从综述在预处理步骤可能用到的技术开始.首先,2.2.1节回顾了如何选择合适的距离衡量指标.在后面的步骤中大部分的方法需要它.余弦相似度和皮尔逊相关度是一般可接受最好的选择.尽管付出了许多的努力来提高这些距离指标,但是最近的工作似乎表明距离函数的选择不是这么重要.然后,在2.2.2节回顾了最基础的抽样,其应用是为了选择原始大数据集的子集,或者是划

《推荐系统:技术、评估及高效算法》一3.2 基于内容的推荐系统的基础

3.2 基于内容的推荐系统的基础 基于内容的推荐系统通过分析一系列用户之前已评分物品的文档和(或)描述,从而基于用户已评分对象的特征建立模型或个人信息[63].个人信息是用户兴趣的结构化描述,并且被应用在推荐新的感兴趣的物品中.推荐的主要处理过程是将用户个人信息的特征和内容对象的特征相匹配,结果就是用户对某个对象感兴趣程度的评价.如果这份个人信息准确地反映了用户的偏好,信息访问处理过程则能带来巨大的优势.例如,通过判断这个用户是否对指定网页感兴趣,以及在不感兴趣的情况下阻止显示,从而达到有效过滤