推荐系统应用研究:音乐电台

推荐系统很少有单独的产品形态,多是和其他产品相结合,起到辅助的使用效果。如个人平时使用较多的推荐系统有输入法的字词联想、购书网站中书籍推荐、音乐电台的猜用户喜欢的音乐和谷歌阅读器的推荐条目。

对于豆瓣音乐频道使用较少,虽然对音乐没什么研究,也不会买什么专辑或者听演唱会,但是很喜欢听音乐,有边工作边听音乐的习惯。豆瓣电台迄今累计收听13670首、喜欢136首和不喜欢666首,算是电台的重度用户吧,个人操作行为有:

作为工作时间的背景音乐,处于后台运行状态。有时候工作入神,只要不是特别讨厌或者特别喜欢的歌曲一般不会去访问电台网页。离开工位的时候,拿下耳机不关闭音乐,1万多首歌里起码有30%没有真正听。听到广告和“哈狗帮”之类吵闹的音乐会找到电台的网页,选择不喜欢,无法停止的广告直接点击关闭电台,因为很容易导致走神影响工作。听到喜欢的音乐60%的概率会找到电台网页点击“喜欢”。发现特别喜欢或者寄希望能推荐相关歌曲时会去点击“喜欢”。听到不怎么喜欢的音乐也会选择点击“下一首”。

豆瓣电台推荐新歌力度比虾米网强,操作也更方便,不需要像虾米网的初始化时选择喜欢的歌手和选择喜欢音乐之后要选择标签,更加智能化,减少操作步骤。虾米的歌库好像不够全,多是推荐大众化的歌曲,但推荐的形式比豆瓣更丰富和取巧。

豆瓣不支持按歌手和专辑听歌,如果连续点击三次“不喜欢”没有听到喜欢的音乐或者经常播放讨厌怨女情歌,可能会选择听虾米网歌手专辑。如果能选择只听自己已经选择喜欢的100多首歌曲,或许不会切换到其他产品。

豆瓣电台通常作为浏览器的书签单独存在,通常直接访问豆瓣电台而不会从豆瓣主页再访问豆瓣电台,从电台返回到豆瓣主页只能手动修改网址或者点击专辑的链接查看专辑再返回主页。把喜欢歌曲的红心去掉,是不是意味着用户不再喜欢这首歌并要跳到下一首歌。

豆瓣电台在开始做之前,已经有了比较完善的初始化的数据,大部分专辑都有标签和评分,如专辑《我们是五月天》的相关元数据为:

9592人平均评分为9.3。标签有:五月天(2450),台湾(701) , MAYDAY(644),我们是五月天(374),摇滚(338),我们是:),五月天(264),rock(201),pop(160)。每首歌收藏的人数。

从以上的标签可以看出,歌手、地区和音乐风格是用户的常用标签,可以假设这三个标签是影响用户选择的最主要元数据。英文MAYDAY、五月天、我们是五月天和我们是:),五月天是等价的标签,摇滚和rock是等价的标签,不存在像谷歌挑歌那样的互斥性标签(如节奏的舒缓和强烈)。从这个例子也可以看出用户语言具有模糊性,有必要使用受控词表来控制同义标签的不同语言表达方式。

豆瓣的用户群比较小众化,添加的标签质量比较高,使用标签可以简单地组织歌曲之间的联系,利用评分、收藏人数和标签数目可以确定推荐的优先级。

如用户在电台中选择喜欢专辑《我们是五月天》中的歌曲《拥抱》,那可能依照歌手推荐会更可靠,用户选择多首五月天的歌曲,那可以认定是五月天的粉丝了,歌库中添加了五月天的新歌,自当第一时间推荐。

与风格相比,地区的影响程度更低,但是不排除部分用户有这方面的偏好,比如只听华语的歌曲,这需要经过决策树之类方法多次推荐才能论证。选择风格“摇滚”,可以推荐标签为摇滚并且评分比较高的歌手,逐步确认用户的音乐喜好模型。在大力推荐歌曲之前,可以先完成对用户喜欢歌曲的收集。在不确定的情况下,可以多播放已喜欢的音乐或者喜欢歌手的热门歌曲。

用户喜欢的歌手有很多,但是喜欢的风格不会很多,同一风格下有很多歌手,用户喜欢的风格比歌手更复杂和模糊。歌手之间是并列的标签,而风格会形成明显的偏向。随着时间的改变,风格也会发生改变。

另外,标签要和歌曲更吻合,听到电台推荐杂音多的五月天演唱会歌曲,会选择不喜欢或者跳到下一首。系统或许会依此误以为用户不喜欢这首歌,低质量的歌曲会影响系统推荐的准确性。

来源:http://daichuanqing.com/index.php/archives/1880

时间: 2024-09-08 07:55:48

推荐系统应用研究:音乐电台的相关文章

推荐系统应用研究:网上书店

除了分类查找和主动搜索,推荐系统也是用户浏览商品的重要途径,能帮助用户发现类似并感兴趣的产品,增加商品的访问量,将访问者转化为购买者,引导用户购买.最终产生的价值是提升用户购物体验和用户粘度,提高订单量,如Amazon30%的订单来自推荐系统. 相比于精准营销广告,推荐系统产生的信息更为自然,同样能起到推销商品的目的.但是如果推荐系统的信息过于密集或者不精准,也会有成为垃圾信息之嫌.如在当当网已登录情况下查看<Web信息架构:设计大型网站>,边栏和底部有以下几种形式的推荐系统: 购买本商品的顾

探析数字音乐个性化推荐系统

互联网已逐渐成为数字多媒体资产(数字音乐,数字电影--)的存储和分发中心.虽然互联网的结构能使用户方便的获得内容,但这些内容资源需要有强有力的管理.检索和呈现工具的支持,数字音乐内容当然也不例外.基于用户音乐口味的个性化音乐内容推荐是当前最热门的应用方法.而同时音乐作为与朋友交流关于个性.历史.文化等重要的媒介,所以很多音乐服务中往往会融入SNS的应用. 用户特征描述 音乐内容本身有一定的文字信息(专辑的简介.音乐人的生平--等),但这些信息很难直接与音乐文件相关联.一般的音乐社区会要求用户建立

《中国人工智能学会通讯》——11.55 面向移动商务的数据挖掘方法及应用研究

11.55 面向移动商务的数据挖掘方法及应用研究 近年来,移动互联网.无线传感器网络相关技术的快速发展,以及智能移动设备的全面普及,极大地加快了移动信息产业向社会经济各个层面.大众日常生活的渗透.事实上,基于移动设备的应用服务已经成为用户获取信息.休闲娱乐的主要方式.种类繁多的移动应用和服务覆盖了诸如生活娱乐.在线社交.导航定位等各个功能层面,从而满足了移动用户在日常生活中各式各样的需求.这些移动应用和服务也产生了海量的商务历史数据,为研究者深入探索移动商务环境下的潜在价值.开发全新的移动商务应

你不能错过的“推荐系统”资料合集

杂志: 架构师特刊 ① <架构师特刊:推荐系统(理论篇)> 内容目录: 第1章 推荐算法简介 第2章 协同过滤推荐算法 第3章 基于内容的过滤算法 第4章 混合推荐算法 第5章 如何选择推荐算法 第6章 推荐系统和搜索引擎的关系 ② <架构师特刊:推荐系统(实践篇)> 内容目录: 第1章 微博推荐架构的演进 第2章 Netflix的推荐系统和架构 第3章 博客推荐系统 第4章 Spotify每周歌曲推荐算法解析 第5章 达观个性化推荐系统实践 书籍 ① <推荐系统实践>

推荐系统的作用和问题

推荐系统的作用 推荐系统(recommender systems)是利用信息过滤技术向用户推荐其可能感兴趣的信息.http://www.aliyun.com/zixun/aggregation/8086.html">推荐系统是有别于信息分类和信息搜索的信息处理方式. 信息分类是有序的按照时间/主题/类别/用户/任务等方式组织结构化信息,浏览分类信息可以帮助用户理解信息之间的组织方式,但是这种信息的呈现方式是基于用户已知目标信息的所属类别,用户认知事物偏向于模糊无序,难以从有序的信息中发现未

恭迎万亿级营销(圈人)潇洒的迈入毫秒时代 - 万亿user_tags级实时推荐系统数据库设计

标签 PostgreSQL , 标签 , 推荐系统 , 实时圈人 , 数组 , gin , gist , 索引 , rum , tsvector , tsquery , 万亿 , user , tag , 淘宝 背景 我们仅用了PostgreSQL的两个小特性,却解决了业务困扰已久的大问题. 推荐系统是广告营销平台的奶牛,其核心是精准.实时.高效. 这么多广告平台,到底谁家强?谁的核心牛逼? 1. 精准,指对用户的描述精准,通常需要基于大量的用户行为数据,经历深度学习后形成的用户画像,或称之为标

推荐系统笔记

1.产生原因 信息过载 无明确需求 2.什么是推荐? 在信息过载又没有明确需求的情况下,找到用户感兴趣的东西. <Mahout实战>上的定义是:推荐就是通过对喜好的这些模式进行预测,借以发现你尚未知晓,却合乎心意的新事物. 3.推荐和搜索区别: 相同点:快速发现有用信息的工具 不同点:搜索引擎是用户找信息:推荐系统是信息找用户 为了解决信息过载的问题,代表性的解决方案是分类目录和搜索引擎.和搜索引擎一样,推荐系统也是一种帮助用户快速发现有用信息的工具.和搜索引擎不同的是,推荐系统不需要用户提供

[推荐系统]Mahout中相似度计算方法介绍

Mahout中相似度计算方法介绍      在现实中广泛使用的推荐系统一般都是基于协同过滤算法的,这类算法通常都需要计算用户与用户或者项目与项目之间的相似度,对于数据量以及数据类型不同的数据源,需要不同的相似度计算方法来提高推荐性能,在mahout提供了大量用于计算相似度的组件,这些组件分别实现了不同的相似度计算方法.下图用于实现相似度计算的组件之间的关系: 图1.项目相似度计算组件 图2.用户相似度计算组件 下面就几个重点相似度计算方法做介绍: 皮尔森相关度 类名:PearsonCorrela

[推荐系统]互联网推荐系统比较研究

互联网规模和覆盖面的迅速增长带来了信息超载(information overload)的问题:过量信息同时呈现使得用户无法从中获取对自己有用的部分,信息使用效率反而降低.现有的很多网络应用,比如门户网站.搜索引擎和专业数据索引本质上都是帮助用户过滤信息的手段.然而这些工具只满足主流需求,没有个性化的考虑,仍然无法很好地解决信息超载的问题.推荐系统(recommender system)作为一种信息过滤的重要手段,是当前解决信息超载问题的非常有潜力的方法.推荐系统与以搜索引擎为代表的信息检索(in