中国人工智能学会通讯——深度学习与推荐系统 1.1 协同过滤 (Collaborative Filtering)

1.1 协同过滤 (Collaborative Filtering)

简单来说,协同过滤是指在预测一个用户对物品的喜好程度时,不仅仅依赖于该用户的历史记录,同时也要考虑其他用户的历史记录。其基本假设是兴趣相投、拥有共同经验的群体未来会喜欢相似的物品。协同过滤建模主要使用用户对物品的历史交互数据,也称为反馈数据。根据交互行为是否反映用户对物品的喜好程度可以把反馈数据分为两类:①显式反馈(explicit feedback),通常是指评分,直接反映用户对物品的喜好程度,例如豆瓣网提供用户对电影1~5的评分;②隐式反馈(implicit feedback),例如点击、购买、看视频、听音乐等行为,其不能直接揭示用户是否喜欢一个物品,但能侧面反映出用户对物品的兴趣。

●显式反馈


Netflix大赛1将基于显式反馈的评分预测任务的研究和探索推向了高潮。解决评分预测的通常做法是针对Y矩阵中的观察数据进行建模,以达到最小化模型预测打分和实际打分的错误率:


对于隐式反馈,观测数据(observed data)仅携带正样本信息,而未观测数据(矩阵中的0元素,也称为缺失数据)中含有丰富的负样本信息。因此,考虑缺失数据对基于隐反馈的推荐算法异常重要,在机器学习框架下,根据优化目标函数的不同可以将隐反馈推荐算法分为两大类。(1) 单值学习排序(Point-wise Learning to Rank)拟合模型预测值和Y中的实际值相近。常用的目标函数有两种,基于回归的平方差损失(square loss)时间复杂度,并在预测未知评分任务上可以取得较低的错误率,但在以排序为主的Top-K物品推荐(item recommendation)任务上表现较差[7], 甚至弱于非个性化的基于物品流行度的排序[8]。其主要原因是观察数据中有较强的选择偏差(selection bias),而且缺失数据中含有丰富的负样本信息[9]。因此,在构造实际的Top-K物品推荐系统时,传统评分预测模型完全忽略缺失数据的做法并不可取,考虑对缺失数据的建模异常重要。缺失数据的建模在基于隐式反馈的推荐方法中得到了广泛的研究和使用。

●隐式反馈

相比于显式反馈,互联网内容提供商更容易获得隐式反馈,例如电商/视频网站可以从服务器日志中直接获得用户的点击/观看历史。由于不需要用户显式提供打分,隐式反馈中的选择偏差较小,而且其规模相对较大。因此近三年对推荐系统算法的研究更集中在隐式反馈[6,10-17]。

与显式反馈类似,可以将隐式反馈数据描述为一个二维矩阵Y;不同的是这里Y中的每一个元素不是一个具体的打分,而是代表用户是否选择了某一物品2:1代表选择,0代表没有选择。因此,建模隐式反馈更像是一个二分类问题——预测用户选择一个物品的概率。在推荐系统相关的文献中,隐式反馈推荐算法的评测方式通常以物品推荐为主,也就是对每个用户生成一个物品排序,根据用户未来对商品的选择行为来评测排序列表的质量。图2简述了显示反馈和隐式反馈数据上的区别。

对于隐式反馈,观测数据(observed data)仅携带正样本信息,而未观测数据(矩阵中的0元素,也称为缺失数据)中含有丰富的负样本信息。因此,考虑缺失数据对基于隐反馈的推荐算法异常重要,在机器学习框架下,根据优化目标函数的不同可以将隐反馈推荐算法分为两大类。

(1) 单值学习排序(Point-wise Learning to Rank)拟合模型预测值和Y中的实际值相近。常用的目标函数有两种,基于回归的平方差损失(square loss)

和基于分类的对数损失


还有少量工作探索了列表学习排序(list-wise Learning to Rank)优化推荐模型,例如文献[24]。由于其目标函数通常可以转化为比较对学习排序的形式,这里暂不展开讨论。对于单值学习排序,通常从缺失数据中采样越多的负样本会有较好的结果[6],与此同时需要更长的训练时间。对于基于回归的平方差损失,近期文献[13]提出了一个通用的基于坐标下降(Coordinate Descent)的算法,针对满足k-separable特性的线性模型(如矩阵分解和分解机[25]等),可以在不提高实际计算复杂度的情况下,训练所有缺失数据。该算法不仅适用于文章描述的所有缺失数据统一权重的情况,而且适用于基于物品的非统一权重的情况(见文献[16])。

值得一提的是,许多基于显式反馈的预测模型(如SVD++[1]、timeSVD[4]等)对于隐式反馈同样适用,前提是一定要调整其优化目标函数,以适当的方式将缺失数据考虑进来。

时间: 2024-09-17 16:54:46

中国人工智能学会通讯——深度学习与推荐系统 1.1 协同过滤 (Collaborative Filtering)的相关文章

中国人工智能学会通讯——深度学习与推荐系统 2 深度学习在推荐系统的应用

2 深度学习在推荐系统的应用 深度学习指代多层级的人工神经网络,近年来在语音识别.计算机视觉和自然语言处理等领域取得了巨大成功[32].根据深度学习技术在推荐系统中的应用方式,将相关工作大体分为两类:①作为一种基于数据的表征学习的方法,深度学习技术可以从语义较为丰富的输入数据(如语音.图片.文本等)中抽取出有效的特征表示,以方便下游应用,如检索和推荐等[11,14,17,33-40 ]:②作为一种通用的数据建模方法,深度学习对数据进行多层非线性变换,可以拟合出较为复杂的预测函数.推荐系统中的核心

中国人工智能学会通讯——深度学习与推荐系统 3 总结与展望

3 总结与展望 本文中简要介绍了推荐系统的核心技术,以及关于深度学习在推荐系统上的最新进展.可以看到,目前深度模型在推荐系统上的应用还处于比较初级的阶段[28],尤其是技术上的发展较慢于计算机视觉和自然语言处理领域.关于未来工作有如下三点展望. (1)在线学习与增量学习.在实际产品中,用户数据实时到达,为了更好地提供服务,推荐系统模型需要能够实时.有效地刷新推荐列表,这对模型的在线学习和增量学习带来挑战.现有的工作主要考虑矩阵分解等浅层模型的在线学习[13,16],对于深度模型的研究较为稀疏.

中国人工智能学会通讯——深度学习与推荐系统 2.2 深度交互函数学习 (Learning Interaction Function with Deep Learning)

2.2 深度交互函数学习 (Learning Interaction Function with Deep Learning) 作为早期使用神经网络进行评分建模的代表性工作,文献[42]使用限制玻尔兹曼机(RBM)学习交互函数,但该方法的近似优化算法较为费时[28],且不易扩展到有辅助信息的情况.近期,我们在WWW2017上[6]提出了一个简单通用的基于神经网络的协同过滤框架(Neural Collaborative Filtering,NCF).其基本思想是将用户和物品表示为隐空间的低维向量后

中国人工智能学会通讯——深度学习与推荐系统 2.1 深度特征抽取(Extracting Side Features with Deep Learning)

2.1 深度特征抽取(Extracting Side Features with Deep Learning) 图4总结了一系列工作使用深度学习进行特征抽取,并用于协同过滤的基本框架.介于深度学习技术抽取出的特征通常是相对较短.稠密的向量(也称为嵌入式表示,embedding),可以和基于隐向量的矩阵分解方法无缝结合,因此这类工作大都采用矩阵分解模型进行协同过滤.例如,文献[33]在音乐推荐任务中,采用卷积神经网络(CNN)从音乐的原始特征中抽取出音乐表示,优化目标函数式(2)获得用户的隐向量:

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——深度学习在自然语言处理领域的最新进展

下面我来介绍一下深度学习在自然语言处理(NLP)的最新进展.我主要想针对机器翻译.聊天机器人和阅读理解这三个最活跃的方向来探讨深度学习在NLP领域的发展到了什么水平,还存在什么问题,然后再引申出未来的研究方向. 上图是自然语言处理主要技术的一览图.从左开始,第一列是自然语言的基本技术,包括词汇级.短语级.句子级和篇章级的表示,比如词的多维向量表示(word embedding).句子的多维向量表示,还有就是分词.词性标记.句法分析和篇章分析.第二列和第三列是自然语言的核心技术,包括机器翻译.提问

中国人工智能学会通讯——深度学习与视觉计算 1.1 视觉大数据

摘要:首先阐述什么是视觉大数据,以及视觉大数据分析需要解决的关键问题:然后介绍 了深度学习的发展背景,并简要回顾了深度学习在计算机视觉领域的发展历史:最后介绍 了深度学习在视觉计算中的一些工作,并讨论了未来潜在的研究方向. 1.1 视觉大数据 人类感知外部世界的时候,约有 70% 以上的外界信息是由视觉系统所接收和处 理的.因此,对于视觉信息的有效处理与 理解是非常重要的. 我们知道,从第一台光学成像设备产生 的那一刻开始,人们就在不断地改进成像 系统,希望能够更加真实地记录客观世界, 留下往日

中国人工智能学会通讯——深度学习的迁移模型 三、三种不同的迁移方法

三.三种不同的迁移方法 将这些概念加起来,就可以总结出三个不同的迁移方法 1.基于差异的方法 在哪里做迁移的转换.自适应.可以在某个层次来做,也可以在多个层次来做,如何来衡量两个领域之间的距离,可以用先验的这种概率.模型,也可以用联合概率.模型:另外还可以将源领域的信息加进来,建立一个更准确的Loss.这都是图像领域获得的知识,那自然语言会不会有类似的方式? 下面一篇描述NLP的文章也证明了这一点,假设我们把自然语言的深度处理分成三个层次,即E.H.O,如果我们锁定不变,而其他的层次有可能变化,

中国人工智能学会通讯——深度学习与视觉计算 1.2 深度学习在计算机视觉领域的应用

1.2 深度学习在计算机视觉领域的应用 深度学习近几年成为国际上非常流行 的重要的数据分析工具,在我们视觉计算 领域也得到了广泛应用.对于传统的视觉 信息处理而言,一般首先要做特征提取: 然后利用特征进行模型学习,比如分类等. 在这个过程中,涉及到模式识别研究中两 个经典的问题,即特征的提取与表示和模 型的学习. 传统算法通常利用经验知识来手工设 置视觉特征,缺少与环境的信息交互以及知 识库的决策支持.举个例子,给定一幅图 像,我们希望知道这幅图像的目标类别(比 如斑马).按照传统的视觉模式分析