《推荐系统:技术、评估及高效算法》一第2章Recommender Systems Handbook推荐系统中的数据挖掘方法

第2章Recommender Systems Handbook推荐系统中的数据挖掘方法

Xavier Amatriain、Alejandro Jaimes、Nuria Oliver和Josep M.Pujol Xavier Amatriain,Telefonica Research,Via Augusta,122,Barcelona 08021,Spain e-mail:xar@tid.es
Alejandro Jaimes,Yahoo!Research,Av.Diagonal,177,Barcelona 08018,Spain.Work on the chapter was performed while the author was at Telefonica Research.e-mail:ajaimes@yahoo-inc.com
Nuria Oliver,Telefonica Research,Via Augusta,122,Barcelona 08021,Spain e-mail:nuriao@tid.es
Josep M.Pujol,Telefonica Research,Via Augusta,122,Barcelona 08021,Spain e-mail:jmps@tid.es
翻译:吉林大学丁彬钊 审核:刘湘勇,胡聪(胡户主),郑州大学吴宾

摘要 本章概述了推荐系统中用到的一些重要的数据挖掘技术。首先描述的是常见的数据预处理方法,如抽样和降维。其次,回顾推荐系统中最重要的分类技术,包括贝叶斯网络和支持向量机。我们对K-means聚类算法进行描述并讨论其几个替代算法。我们也会介绍有效训练过程中的关联规则和相关算法。除了介绍这些技术,我们也会考察它们在推荐系统中的使用情况,同时介绍它们成功应用的案例。

时间: 2024-11-27 01:50:46

《推荐系统:技术、评估及高效算法》一第2章Recommender Systems Handbook推荐系统中的数据挖掘方法的相关文章

《推荐系统:技术、评估及高效算法》一第3章Recommender Systems Handbook基于内容的推荐系统:前沿和趋势

第3章Recommender Systems Handbook基于内容的推荐系统:前沿和趋势 Pasquale Lops.Marco de Gemmis和Giovanni Semeraro Pasquale Lops,Department of Computer Science,University of Bari"Aldo Moro",Via E.Orabona,4,Bari(Italy) e-mail:lops@di.uniba.itMarco de Gemmis,Departme

《推荐系统:技术、评估及高效算法》一导读

前 言 推荐系统是为用户推荐所需物品的软件工具和技术.提供的推荐旨在通过各种决策过程来支持用户,例如,买什么物品.听什么歌或者读什么新闻.推荐系统对于在线用户处理信息过载是一个非常有价值的方法,并成为电子商务领域最强大和流行的工具.因此,人们提出了各种各样的推荐技术,并在过去的10年中将其中很多方法成功地运用在商务领域. 推荐系统的发展需要多学科的支持,涉及来自各个领域的专家知识,如人工智能.人机交互.信息检索.数据挖掘.数据统计.自适应用户界面.决策支持系统.市场营销或消费者行为等.本书旨在基

《推荐系统:技术、评估及高效算法》一2.3 分类

2.3 分类 分类器是从特征空间到标签空间的映射,其中特征代表需要分类的元素的属性,标签代表类别.例如,餐厅推荐系统能够通过分类器来实现,其分类器基于许多特征描述把餐厅分成两类中的一类(好的,不好的). 有许多种类型的分类器,但是一般情况下我们谈的有监督分类器和无监督分类器.在有监督分类器中,我们预先知道一组标签或是类别,并且我们有一组带有标签的数据,用来组成训练集.在无监督分类中,类别都是提前未知的,其任务是恰当地组织好我们手中的元素(按照一些规则).在本节中我们描述几个算法来学习有监督分类,

《推荐系统:技术、评估及高效算法》一1.5 应用与评价

1.5 应用与评价 推荐系统的研究着重放在实践和商业应用上.因为除了理论方面的贡献,这方面的研究一般旨在切实促进商业推荐系统的发展.因此,推荐系统的研究包括实现这些系统的实践方面.这些方面与推荐系统生命周期的不同阶段都相关,即系统设计.实现以及系统运行过程中的维护和改善. 系统设计阶段所需考虑的影响因素或许会影响算法的选择.第一个要考虑的因素--应用的领域是算法选择的主要影响因素.[72]提供了推荐系统的分类,并且对特定应用领域的推荐系统应用做了分类.基于这些特定的应用领域,我们为最普遍的推荐系

《推荐系统:技术、评估及高效算法》一1.8 出现的问题和挑战

1.8 出现的问题和挑战 1.8.1 本书对出现的问题的讨论 从前面的讨论可以很明显地看出,推荐系统的研究正在向众多不同的方向发展,同时新的主题不断出现,或者正成为更重要的研究课题.读者也可以参考最近的ACM RecSys会议资料,参考其他优秀的论文,将其作为额外的研究素材[7,3].本手册中涵盖许多这种话题.实际上,很多已经介绍过了,例如,上下文感知推荐(第7章):新的可视化技术(第17章):基于社区的个性化搜索(第18章):基于信任的推荐系统(第20章).其他一些重要的话题在手册最后两部分,

《推荐系统:技术、评估及高效算法》一1.1 简介

1.1 简介 推荐系统(RS)是一种软件工具和技术方法,它可以向用户建议有用的物品[60,85,25],这种建议适用于多种决策过程,如购买什么物品.听什么音乐.在网上浏览什么新闻等."物品"是用来表示系统向用户推荐内容的总称.一个推荐系统通常专注于一个特定类型的物品(如CD或新闻),因此它的设计.图形用户界面以及用于生成建议的核心的推荐技术都是为特定类型的物品提供有用和有效的建议而定制的. 推荐系统主要针对的是那些缺乏足够的个人经验和能力的人,他们无法评估潜在的大量可供选择的物品,比如

《推荐系统:技术、评估及高效算法》一1.6 推荐系统与人机交互

1.6 推荐系统与人机交互 正如前面阐明的那样,研究人员主要关注一系列技术解决方案的设计,以及利用各种知识库更好地预测目标用户喜欢什么和喜欢的程度.这种研究活动背后的基本假设是仅能展示正确的推荐(也就是最好的选项)就足够了.换句话说,系统给用户推荐,如果是正确的,用户应该明确地接受推荐.很明显,这极度简化了推荐问题,其实把推荐结果传递给用户并不简单. 实际上,因为用户没有足够的知识库做明确的决定,所以才需要推荐.让用户评价系统提供推荐并不是件容易的事情.因此,很多研究人员试图了解让指定用户接受推

《推荐系统:技术、评估及高效算法》一2.6 总结

2.6 总结 本章介绍了在设计推荐系统中可能用到的主要的数据挖掘方法和技术.我们也总结了在文献中提到的用法,提供了如何以及在哪用到它们一些粗略指导. 我们从综述在预处理步骤可能用到的技术开始.首先,2.2.1节回顾了如何选择合适的距离衡量指标.在后面的步骤中大部分的方法需要它.余弦相似度和皮尔逊相关度是一般可接受最好的选择.尽管付出了许多的努力来提高这些距离指标,但是最近的工作似乎表明距离函数的选择不是这么重要.然后,在2.2.2节回顾了最基础的抽样,其应用是为了选择原始大数据集的子集,或者是划

《推荐系统:技术、评估及高效算法》一2.1 简介

2.1 简介 推荐系统典型地运用了其他相邻领域的技术和方法,如人机交互和信息检索.但是,大多数系统的核心算法都可以理解成数据挖掘技术的一个特例.数据挖掘的过程一般由三个连续执行的步骤组成:数据预处理[59].数据分析和结果解释(见图2.1).我们将在2.2节中分析一些最重要的数据预处理方法.鉴于数据抽样.数据降维.距离函数在推荐系统中的意义及所担任的重要角色,我们将特别关注这些内容.从2.3节到2.5节,将总体介绍在推荐系统中最常使用的数据挖掘方法:分类.聚类.关联规则发现(图2.1详细显示了本