基于受限玻尔兹曼机(RBM)的协同过滤

受限玻尔兹曼机是一种生成式随机神经网络(generative stochastic neural network), 详细介绍可见我的博文《受限玻尔兹曼机(RBM)简介》, 本文主要介绍RBM在协同过滤的应用。

1. 受限玻尔兹曼机简单介绍

传统的受限玻尔兹曼机是一种如下图所示, 其由一些可见单元(visible unit，对应可见变量，亦即数据样本)和一些隐藏单元(hidden unit，对应隐藏变量)构成，可见变量和隐藏变量都是二元变量，亦即其状态取{0,1}。整个网络是一个二部图，只有可见单元和隐藏单元之间才会存在边，可见单元之间以及隐藏单元之间都不会有边连接。

将该模型应用到协同过滤需要解决以下两个问题:

鉴于RBM中的单元都是二元变量, 如果用这些二元变量来对整数值的评分建模?
用户的打分是非常稀疏的, 亦即用户只会对很少的物品(比如电影)打分, 如何处理这些缺失的评分?

2. 基于RBM的协同过滤

R. R. Salakhutdinov等人提出了一种使用RBM来进行协同过滤的方法:

假设有m个电影, 则使用m个softmax单元来作为可见单元来构造RBM. 对于每个用户使用不同的RBM, 这些不同的RBM仅仅是可见单元不同, 因为不同的用户会对不同的电影打分, 所有的这些RBM的可见单元共用相同的偏置以及和隐藏单元的连接权重W. 该方法很好的解决了之前提到的问题:

使用softmax来对用户的评分进行建模, softmax是一种组合可见单元, 包含k个二元单元, 第i个二元单元当且只当用户对该电影打分为i时才会置为1.
如果一个用户没有对第j个电影评分, 则该用户的RBM中不存在第j个softmax单元.

该模型如下图所示:

可是单元V和隐藏单元h的条件概率为:

模型参数的学习过程非常类似于RBM的DC算法:

训练完模型后, 计算用户对未评价物品的预测评分的算法为:

3. 条件RBM(Conditional Restricted Boltzmann Machine)

以上的RBM只用到了用户对电影的评分, 忽视了另外一种非常重要的信息: 用户浏览过哪些电影(但是没打分, 或者打分未知), 条件RBM把这种信息也进行了建模:

其中的r是一个m维的向量, r_i为1代表用户对浏览过第i个电影, 加入r后的模型的条件概率为:

权重D的学习过程为:

参考文献:

[1]. Ruslan Salakhutdinov, Andriy Mnih, Geoffrey Hinton. Restricted Boltzmann Machines for Collaborative Filtering. 2007, ICML.

[2]. Gilles Louppe, Pierre Geurts. Collaborative filtering: Scalable approaches using restricted Boltzmann machines.

[3]. 受限玻尔兹曼机(RBM)简介

时间： 2024-08-22 14:31:45

基于受限玻尔兹曼机(RBM)的协同过滤的相关文章

谁有基于用户的推荐系统或者协同过滤的算法和代码分析啊

问题描述求个大数据的大神给个基于用户的推荐系统或者协同过滤的算法和代码分析啊我有部分代码但是不知道怎么在Eclipse上实现求解答啊1.publicclassAggregateAndRecommendReducerextendsReducer<VarLongWritable,VectorWritable,VarLongWritable,RecommendedItemsWritable>{...publicviodreduce(VarLongWritablekey,Iterable<Ve

推荐系统中基于深度学习的混合协同过滤模型

近些年,深度学习在语音识别.图像处理.自然语言处理等领域都取得了很大的突破与成就.相对来说,深度学习在推荐系统领域的研究与应用还处于早期阶段. 携程在深度学习与推荐系统结合的领域也进行了相关的研究与应用,并在国际人工智能顶级会议AAAI 2017上发表了相应的研究成果<A Hybrid Collaborative Filtering Model with Deep Structure for Recommender Systems>,本文将分享深度学习在推荐系统上的应用,同时介绍携程基础BI团

基于协同过滤的个性化Web推荐

下面这是论文笔记,其实主要是摘抄,这片博士论文很有逻辑性,层层深入,所以笔者保留的比较多. 看到第二章,我发现其实这片文章对我来说更多是科普,科普吧-- 一.论文来源 Personalized Web Recommendation via Collaborative Filtering(很奇怪via为什么小写,先记住吧) (Candidate)博士研究生:孙慧峰 (Advisor)导师:陈俊亮(院士) (Academic Degree Applied for)

受限玻尔兹曼机(Restricted Boltzmann Machine, RBM) 简介

受限玻尔兹曼机(Restricted Boltzmann Machine,简称RBM)是由Hinton和Sejnowski于1986年提出的一种生成式随机神经网络(generative stochastic neural network),该网络由一些可见单元(visible unit,对应可见变量,亦即数据样本)和一些隐藏单元(hidden unit,对应隐藏变量)构成,可见变量和隐藏变量都是二元变量,亦即其状态取{0,1}.整个网络是一个二部图,只有可见单元和隐藏单元之间才会存在边,可见

基于协同过滤的推荐方法

协同过滤(Collaborative Filtering, CF)是推荐系统广泛使用的一种技术,它主要通过考虑用户(User)与用户之间.物品(Item)与物品之间的相似度(Similarity),来向用户推荐物品,常被用在电商网站中.其中,在推荐系统中最常使用的协同过滤方法,有如下4种: 基于用户的协同过滤推荐基于物品的协同过滤推荐基于模型的协同过滤推荐混合协同过滤推荐上面4种方法中,基于用户的协同过滤推荐.基于物品的协同过滤推荐都是基于内存的协同过滤推荐,一般在数据量较小的应用场景下

基于用户的协同过滤推荐算法原理和实现

在推荐系统众多方法中,基于用户的协同过滤推荐算法是最早诞生的,原理也较为简单.该算法1992年提出并用于邮件过滤系统,两年后1994年被 GroupLens 用于新闻过滤.一直到2000年,该算法都是推荐系统领域最著名的算法. 本文简单介绍基于用户的协同过滤算法思想以及原理,最后基于该算法实现园友的推荐,即根据你关注的人,为你推荐博客园中其他你有可能感兴趣的人. 基本思想俗话说"物以类聚.人以群分",拿看电影这个例子来说,如果你喜欢<蝙蝠侠&

有关基于项目的协同过滤算法的预测值计算问题

问题描述有关基于项目的协同过滤算法的预测值计算问题有个疑问,比如项目有100个最近邻居,但是目标用户对这100个邻居中的极少部分有评分,比如只对5个项目有评分,但是大部分论文中计算预测值时是这么计算的:,我将未评分值先简单置为0,那么分母就是所有相似度之和,分子却只是那5个目标用户有评分项的加权和,结果通常很小,与实际值相差很大,我想那个分母是不是只用包括最近邻居中用户已评分项的相似度? 解决方案我刚计算预测值时分母只累加了已评分项的相似度,邻居300左右时MAE值达到最优值为0.75,正

基于物品的协同过滤算法(ItemCF)

最近在学习使用阿里云的推荐引擎时,在使用的过程中用到很多推荐算法,所以就研究了一下,这里主要介绍一种推荐算法-基于物品的协同过滤算法. ItemCF算法不是根据物品内容的属性计算物品之间的相似度,而是通过分析用户的行为记录来计算用户的相似度.该算法认为物品A和物品B相似的依据是因为喜欢物品A的用户也喜欢物品B. 基于物品的协同过滤算法实现步骤: 1.计算物品之间的相似度 2.根据物品的相似度和用户的历史行为记录给用户生成推荐列表下面我们一起来看一下这两部是如何实现的: 一.计算物品之间的相似度

基于云计算的受限玻尔兹曼机推荐算法研究

基于云计算的受限玻尔兹曼机推荐算法研究郑志蕴李步源李伦李钝数据的指数级增长及算法本身的复杂性使受限玻尔兹曼机面临着计算效率的问题.在详细分析受限玻尔兹曼机的基础上,将受限玻尔兹曼机与Hadoop平台的并行计算架构相结合,提出基于云平台的受限玻尔兹曼机推荐算法.该算法通过复制机制解决数据相关性问题,并将传统的受限玻尔兹曼机过程分解为若干个Hadoop任务的循环,实现并行计算.实验结果表明,与在传统平台上的实现相比,基于Hadoop并行架构的受限玻尔兹曼机推荐算法在大体量数据集的条件

猜你喜欢

C语言图形函数编程

图形函数 Turbo C提供了非常丰富的图形函数, 所有图形函数的原型均在graphics. h 中, 本节主要介绍图形模式的初始化.独立图形程序的建立.基本图形功能.图形窗口以及图形模式下的文本输 ...

c++-用C++读取文件中特定行的某几列数据并输出到另一个文件

问题描述用C++读取文件中特定行的某几列数据并输出到另一个文件 AR ZIMM 2014 06 30 00 00 0.000000 2 2.175456910513e-08 1.9291400195 ...

XML轻松学习手册（2）

xml 五. XML和HTML的区别 <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office& ...

在Excel中Choose函数具体如何使用?

CHOOSE函数用于根据索引号从最多 254 个数值中选择一个.特别适合从固定参数中选择其中之一的情况,这有点类似于枚举类型的数据类型,那么那么在Excel中Choose函数具体如何使用?下面小编 ...

如何查看Win8无线网络密码

随着Windows的升级,使用Win8系统的用户也越来越多.但是新的系统都有所改变,毕竟是新的系统,各个功能都不一样,所以我们需要做的就是慢慢学习.但是,很多用户在无线网络连接久了之后,往往会把密码给 ...

如何为IE浏览器添加加速器

IE浏览器下有个加速器,可能大家接触的很少,不会知道这是个什么东西.IE加速器是实时网络优化加速工具,可使IE在浏览网页和下载文件的速度得到一定的提升.与别的修改注册表参数达到优化目的的软件不同的 ...

160wifi打开失败怎么办

问题步骤一:部分用户无线网络无法共享成功是因为无线网络硬件开关没有打开, 如果您的无线网卡开关发现没有开启,可以按以下操作步骤操作.目前笔记本电脑开启的方法类似: 1.笔记本键盘正面,或者侧面有一 ...

Spark本地模式运行

Spark的安装分为几种模式,其中一种是本地运行模式,只需要在单节点上解压即可运行,这种模式不需要依赖Hadoop 环境.在本地运行模式中,master和worker都运行在一个jvm进程中,通过该模 ...

什么是“点击愉悦感”(tappiness)?

摘要: 随着平板电脑市场的迅猛增长,你可曾考虑到网站在平板上的用户体验?本文给出了6个提升网站平板体验的简易技巧,让你花小气力,出大成果,可谓事半功倍.要不你试试看. 在这篇随着平板电脑市场的迅猛增 ...

并发网2014.7月阅读量Top10

也许每天大家都在匆忙的工作,学习的时间非常短暂,也许网站的内容太多,不知道应该看哪一篇.所以从本月开始会向各位推送并发网每月Top10的阅读量的文章,希望各位能喜欢!有任何意见和建议,欢迎告诉我们,小 ...

c++-递归～问一个幼稚的问题，有哪个大神能讲一下递归，结合代码，老是理解不了。先谢过了

问题描述递归-问一个幼稚的问题,有哪个大神能讲一下递归,结合代码,老是理解不了.先谢过了谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢谢解决方案递归就是自己调用自己,如一般要有一个 ...

【原创】RabbitMQ 之 Queue Length Limit（翻译）

Queue Length Limit The maximum length of a queue can be limited to a set number of messages by suppl ...

activity-关于两个应用之间Activity的跳转

问题描述关于两个应用之间Activity的跳转当应用没有启动的时候,点击桌面图标,进入应用,这个过程可以以正常的方式启动,找到程序的入入口跳转即可! 但是如果当应用启动过并在后台运行,点击桌面启动 ...

Win8.1 Preview支持简体中文

6月26日的BUILD大会上,微软将发布Windows 8.1预览版(Preview),你可以通过Windows Store升级,也可以下线Win8.1预览版ISO镜像全新安装. Window ...

《Storm分布式实时计算模式》——2.1　Storm集群的框架

第2章配置Storm集群在本章中你将深入理解Storm的技术栈,它的软件依赖,以及搭建和部署Storm集群的过程.我们首先会在伪分布式模式下安装Storm,所有的组件都安装在同一台机器上,而不是在 ...

大屏触控Windows Phone 7旗舰 LG Optimus 7真机赏

此前,LG公司相关618.html">负责人曾透露称,微软公司全新的http://www.aliyun.com/zixun/aggregation/13466.html"&g ...

问题描述求救求救如下问题如何解决解决方案解决方案二:别干巴巴一张图就来寻找答案,这张图说明不了多少问题.解决方案三:这张图叫我们怎么解决?并且手机上都看不清楚-解决方案四:没有生成exe文件,所 ...

来自苹果的神奇iPad

iPad的故事,要从2010开始说起.2010年1月27日,苹果公司已故前首席执行官史蒂夫·乔布斯(Steve Jobs)在发布会上为大家描述了他所想象的未来生活,而他的演讲再一次在消费电子产品的历史 ...

winapi-C# winfrom项目，怎么样实现通过WINAPI 关闭对象的句柄窗口后，还能再次获取该句柄窗口

问题描述 C# winfrom项目,怎么样实现通过WINAPI 关闭对象的句柄窗口后,还能再次获取该句柄窗口在C# Winfrom项目中,from窗体中,有一个Panel控件. 目前已经实现将对象的 ...

任何时候都适用的20个C++技巧

这些小技巧之所以特别,是因为这些信息通常吧不能在C++书籍或者网站上找到.比如说,成员指针,即使对于高级程序员也是比较棘手,和易于产生bugs的,是应该尽量避免的问题之一. ...

手工管理模式是阳光采购“拦路虎”

"通过阳光采购为公司节约成本超过千万元,有效地杜绝了"暗箱操作"和腐败行为,提升了公司经济效益.社会效益." "节约资金2244万元,比去年同期增加8 ...

论“安全部门雇黑客”之利弊

本文讲的是 : 论"安全部门雇黑客"之利弊 , [IT168资讯]每季度,我总是拨部分预算给安全评估,这是预算中至关重要的一环.我的安全评估重点常为主体设施,关键应用评估,或 ...

《深入实践Spring Boot》一第3章 Spring Boot界面设计3.1　模型设计

本节书摘来自华章出版社<深入实践Spring Boot>一书中的第3章,第3.1节,作者陈韶健,更多章节内容可以访问"华章计算机"公众号查看. 第3章 Spring B ...

如何使用CAS实现domino和J2EE的SSO

问题描述如何使用CAS实现domino和J2EE的SSO?通过domino的LDAP可以实现J2EE系统的登录,现在怎么去完成domino的登录? 解决方案解决方案二:没有人知道么?或者能否提供其 ...

小区门口弹古筝保安哥十足文艺范儿

前日,成都元华一巷某小区的一位保安,独自坐在小区门口弹古筝的照片被网友"乖乖喵宝宝"上传至微博,引来数万网友围观,并被冠以"文艺保安哥"的头衔.一夜间,他在网络 ...

中国国家知识产权局副局在贵州督查软件正版化工作时表示

按照国务院的要求,全国各地要在今年10月底前完成省.市.县三级国家机关软件正版化的检查整改工作,企业软件正版化特别是中小企业方面也要取得进一步突破.业界普遍认为,此举将对国内软件企业,特别是上市企业带 ...

怎样用sql语句查询出来已%号开头的呢？

问题描述用模糊查询select * from tbl_teach_stuff t where t.is_deleted=0 and t.stuff_name like '%';这样查不出来呀? 解决 ...

android-Android动态壁纸怎么跳过预览界面而直接通过代码来应用壁纸

问题描述 Android动态壁纸怎么跳过预览界面而直接通过代码来应用壁纸 Android动态壁纸怎么跳过预览界面而直接通过代码来应用壁纸解决方案 http://www.cnblogs.com/fly ...

求助asp.net用户名密码验证码-验证修改

问题描述 Default.aspx<%@PageLanguage="C#"AutoEventWireup="true"CodeFile="Def ...

jjjjjjj-关于网络链接的错误求大神指点

问题描述关于网络链接的错误求大神指点 package com.example.urlget; import java.io.BufferedReader; import java.io.IOExce ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.023 s.