港科大KDD 2017录用论文作者详解：基于异构信息网络元结构融合的推荐系统

在KDD 2017上，香港科技大学计算机系博士生赵欢作为第一作者的论文 Meta-Graph Based Recommendation Fusion over Heterogeneous Information Networks 被 research track接收并做口头报告。经雷锋网 AI 科技评论邀请，赵欢为雷锋网独家供稿，分享了团队此项研究的核心思想、算法框架及实验结果。

作者介绍

本文主要介绍 KDD 2017 的一篇有关推荐系统的论文：「Meta-Graph Based Recommendation Fusion over Heterogeneous Information Networks」这篇论文被KDD 2017的research track接收并做口头报告(录取率8.6%)。作者包括：

第一作者赵欢，香港科技大学计算机系博士生，研究方向为「异构网络与推荐系统」；

第二作者姚权铭，香港科技大学计算机博士生，研究方向为「机器学习优化算法研究」，2016 Google Fellowship 获得者；

第三作者李健达，香港科技大学硕士毕业生，本科毕业于上海交通大学。

第四作者宋阳秋，香港科技大学助理教授，研究方向为「知识图谱、文本数据挖掘和自然语言处理」；

第五作者李迪麟，香港科技大学正教授，研究方向为「信息检索，推荐系统，移动数据管理」。

核心思想

在这个信息爆炸的时代，推荐系统不仅能帮助用户更快地获取感兴趣的信息，同时也能创造巨大的商业价值，目前全球主要的互联网公司都会有专门的推荐团队来从事推荐算法的研究，旨在提升自己的业务效果。

传统的推荐系统中，最常见的方法就是「协同过滤」，典型的例子就是我们在电商网站见到的「购买该商品的用户也购买了/也在看」。协同过滤方法一般包括两种方式，即基于用户和基于商品的协同过滤，以及矩阵分解 (Matrix Factorization)。自从 2007 年 Netflix 百万大奖的推荐系统比赛以来，矩阵分解的方法开始变得流行。尽管矩阵分解可以获得不错的推荐效果，但也有明显的问题：

1）稀疏性(Sparsity)。现实生活里的评分矩阵往往非常稀疏，因为单个用户评分的商品是非常少的；
2）冷启动(Cold Start)。新产生的用户和商品往往都没有评分。

上述两种情况都会严重影响矩阵分解的预测准确性。

除了这两个基本的问题以外，矩阵分解还有一个更严重的问题：它很难适应现在的推荐系统。因为当下的推荐系统需要处理的特征并非只有评分信息，而是各种各样的信息（称作 Side Information），比如商品的描述，图片，用户的好友关系等。我们可以看图 1 的例子，这是 Yelp 上一个餐馆的详情页。

图 1：Yelp 上的一个详情页，Royal House

从图中，我们可以看到，除了评分信息之外，还有餐馆的地理位置，用户上传的图片，评论等信息。显然，在给用户推荐餐馆的过程中，这些信息都非常重要，但它们又很难融入到现有的矩阵分解的模型中。因此，我们需要一个全新的框架来解决这样的问题。这是我们此次 KDD 工作的核心思想：「我们用 HIN 来对 side information 进行建模，同时设计了一套有效的算法框架，从而获得更好的推荐效果」。

算法框架

预备知识

异构信息网络 (Hetegeneous Information Network 以下简称 HIN），是由 UIUC 的 Han Jiawei 和 UCLA 的 Sun Yizhou 在 2011 年的 VLDB 论文中首次提出 [1]。

简单地理解，HIN 就是一个有向图，图中的节点和边都可以有不同的类型，如下图，是一个从上面 Yelp 详情页抽取出来的 HIN。节点可以代表不同类型的实体，比如 user, review, restaurant 等, 边代表不同类型的关系，比如 Check-in, Write, Mention 等。

利用 HIN，我们就可以将各种各样的 side information 统一起来，接下来我们将介绍如何在 HIN 这个框架下完成我们的推荐过程。

从meta-path到meta-graph

在Sun Yizhou的VLDB2011的论文中，除了提出HIN，同时也提出了meta-path，用来计算两个节点之间的相似度。meta-path就是一个节点的sequence，节点与节点之间由不同类型的边连接，也就是不同的关系。

比如从上图中的HIN，我们可以设计meta-path：

它表示的意义就是两个用户在同一个餐馆签到。

我们可以提取一条meta-path的实例：

那我们可以衡量和 Bar Louie 之间的相似度，当有越多的meta-path实例来连接和 Bar Louie，它们之间的相似度就越大，我们也会可以给推荐 Bar Louie。我们可以发现，这条 meta-path 正好对应我们熟悉的「基于用户的协同过滤」，即经常去 Royal House 的人也会去 Bar Louie。

从这个例子我们可以看出，对于推荐系统来说，HIN和meta-path有两个好处：

1) 非常完美地将各种side information融入到一个统一的模型；
2）利用meta-path，可以设计出各种各样的推荐策略，除了推荐准确性提升之外，还能提供「可解释性」。

当然，在计算节点相似度这个任务上，meta-path也有自己的问题：「无法处理复杂的关系」。比如两个用户之间有如下连接性。

对应到图上的实例，和分别给 Royal House 写了一个评论，不仅给了五星好评，还在评论里同时提到了这里的「Seafood」，可以说这两个用户对餐馆的偏好非常相似。但是这样一种相似性，meta-path 无法对其进行建模。为了解决这个问题，有两篇论文 ( KDD 16 [2] 和 ICDE 16 [3]) 提出了一种更为通用通用的结构: meta-graph（也叫 meta-Structure）。相比 meta-path 要求必须是 sequence 的结构，meta-graph 只要求「一个起点和一个终点，中间结构并不限制」，这样大大提升了灵活性。因此，在我们的 KDD 论文中，我们采用了 meta-graph 这样一种结构，来计算用户和商品之间的相似度。在实践中，我们可以设计条 meta-graph，从而得到多种商品和用户之间的相似度，也就是个相似度矩阵。

推荐过程: 矩阵分解(MF) + 分解因子机(Factorization Machine)

通过HIN和mega-graph，我们完美地将各种各样的side information统一到一个框架中。接下来的问题就是「如何设计更好的推荐算法」。在这个论文里，我们用到了「MF + FM」的框架，简单来说: 分别对个相似度矩阵进行矩阵分解，得到组用户和商品的隐式特征，然后将所有的特征拼起来，使用分解因子机进行训练和评分预测。

对于一个样本，即用户-商品对，我们分别可以得到组特征，每组的维度为（在矩阵分解的时候，我们设定秩为）。那么我们就可以拼出下图中所以的一个维度为的特征向量。

Factorization Machine (FM) [4] 是 2010 年在 ICDM 上提出一种模型，由于可以对特征之间的高阶关系进行建模，以及对二阶参数进行低秩分解，因而在评分预测这个推荐任务上取得了非常好的效果。在实践中，我们一般使用二阶关系：

其中，是一阶参数，是二阶参数。为了学出和，我们使用了 Least Squared loss：

特征选择: Group Lasso

一般在 FM 的训练过程中，往往也会加上和的正则项来防止过拟合，用的最多的就是。但是，在我们的工作中，由于我们会设计多条 meta-graph，并不是每条 meta-graph 都有用，为了自动选择出有用的 meta-graph，我们放弃了，而选择，也称作 group lasso。在我们的算法框架中，我们是以 meta-graph 为单位来构造用户和商品的隐式特征的，因此，每条 meta-graph 对应一组用户和商品的隐式特征。一旦某条 meta-graph 没有用，那么它对应的一组特征都应该被去掉，这就是我们采用 group lasso 来做正则项的动机。

使用 group lasso 正则项之后，目标函数优化就变成了一个非凸非光滑（non-convex, non-smooth）的问题，我们使用了邻近梯度算法（proximal gradient）算法来求解它。

以上就是我们的算法框架，接下来，我们将通过部分实验结果，来证明我们算法的优势。

实验结果

数据集和评估标准

我们使用了 Yelp 和 Amazon 这两个数据集，这两个都是非常经典的推荐系统数据集，同时也包含了丰富的 side information。数据的具体统计数据，可以参看我们的论文，这里只展示我们用到的 meta-graph，如下图。在 Yelp 上，我们设计了 9 条 meta-graph，在 amazon 上，我们设计了 6 种 meta-graph。

在推荐系统中，我们一般用来评估评分预测的好坏，越小意味着推荐效果越好。

其中，是实际评分，是预测评分，是 test set 的个数。

总结

最后，给我们的论文做一个简单的总结。近些年，由于移动互联网和大数据的发展，现在的推荐系统面临丰富side information场景，传统的基于矩阵分解的方法已经很难再发挥作用，而基于人工设计的特征工程又极其费劲。通过HIN和meta-graph，我们提供了一种简单有效的框架，既能够非常灵活地利用side information来提升推荐效果，同时，还能利用人工设计的meta-graph来保留必要的语义信息，从而对推荐结果提供一定的「可解释性」。通过实验，我们也证明了这个框架的有效性。

本文作者：奕欣

本文转自雷锋网禁止二次转载，原文链接

时间： 2024-08-11 17:23:11

港科大KDD 2017录用论文作者详解：基于异构信息网络元结构融合的推荐系统

作者介绍

核心思想

算法框架

预备知识

从meta-path到meta-graph

推荐过程: 矩阵分解(MF) + 分解因子机(Factorization Machine)

特征选择: Group Lasso

实验结果

数据集和评估标准

推荐效果

总结

港科大KDD 2017录用论文作者详解：基于异构信息网络元结构融合的推荐系统的相关文章

阿里iDST ICCV 2017录用论文详解：基于层次化多模态LSTM的视觉语义联合嵌入

从 20 篇ICCV 2017录用论文，看商汤科技四大攻坚领域

《嵌入式Linux软硬件开发详解——基于S5PV210处理器》——导读

CVPR 2017最佳论文作者解读：DenseNet 的“what”、“why”和“how”｜CVPR 2017

详解基于javascript实现的苹果系统底部菜单_javascript技巧

《滚雪球》作者详解巴菲特：他的成功在于专注

支付宝前端团队详解基于Node.jsWeb框架Chair

详解基于朴素贝叶斯的情感分析及 Python 实现

详解基于CentOS 6.2下DNS主从复制搭建与部署