推荐的套路

做推荐是有套路的。本文根据在国际短视频业务的经验，总结一些个人的思考。本文不涉及具体算法。

1. 推荐的本质是什么？

是内容和数据。

内容就是你要提供给用户的东西，例如你的视频库，UGC、PGC什么的。用户最根本的目的还是消费优质内容。没有好的内容库，是推不出东西的。

数据指的是用户的行为数据。没米是做不了饭的，没有数据任何算法都是走不通的。很多高大上的词，用户画像什么的，本质上都是对用户行为数据的抽象而已。另外，给内容打标签、打质量系数分也可以用用户行为数据。

推荐的本质，就是根据用户行为数据，提供更满足用户的内容。

2. 一个怎样的产品才能做推荐？

在我看来，至少包括两个要素：

1）足够大量的内容和数据

内容不够多的话，做榜单就行了，做个毛线推荐。

数据不够大的话，再好的算法训练出来都一坨翔。

做推荐准入门槛很高，是个贵族游戏。

2）产品形态有推荐的原动力

什么意思呢？一言难尽。

产品经理喜欢拷问一些诸如“为什么要做推荐？做推荐对产品有啥用？是不是有些用户不喜欢推荐”之类的问题，在我看来这是蛋疼问题，推得好数据一定会更好，问题就是你的产品未必能推得好啊。

推荐应该是个研发主导的事情，首先要拷问的是这个产品的数据流是否能否支撑某种推荐模型，要拿什么、怎么训练、出些啥、可以干啥。如果数据流最多做做协同，那硬要做feed流一定会死很惨。

满足有推荐的原动力的产品，这里举几个例子：

1）用户帮你打标签，例如知乎、网易云音乐。形成这样的产品形态不容易。

2）搜索渗透高的产品很适合做推荐，搜索是挖掘推荐数据的大金矿。

3）外部数据（如爬虫）能起很大作用的产品，例如各种图文信息流产品。

一个产品纯靠推荐来运作是很难的，往往是搜索、分类、榜单、用户、外部数据等所有加起来给推荐提供训练数据。大中台战略，倒是让许多本来不好做推荐的产品也能给你推了。

3. 推荐的大套路

1）收集数据

收集数据永远是第一步。需要了解手中的数据是怎么来的，到底是用户干了啥产生的。并且最好建立感性的认知，这样对后续的ETL、算法选择、调参、模型解释等各个环节都有很大帮助。

2）建立指标

一定要先建指标，否则是没办法验证推荐效果的。常见的有CTR、PV、UV、人均等，结合自己产品形态来设计。

3）实现推荐流程

到这里才是算法选择和工程实现。一般来说，能做推荐的产品规模都不会太小，所以会遇到各种高并发、分布式存储与计算等工程问题。推荐算法只是推荐整个流程的一个小块，做推荐的往往需要算法、大数据、数据分析、产品思维等多种能力，非常苛刻。

4）不断地优化

就是不停地ABTest、调参、更新策略、更新算法，一步一步提高指标。

4. 推荐的小套路

@海洪传授的秘诀是四个字，热推多补。

热指的是榜单内容，多用于冷启动。

推指根据短期、实时反馈的数据进行的即时推荐，效果最显著。

多指多样性，不能老是推用户爱看的，这样会收敛。你永远需要补充一些用户没看过的来让用户发现新的大陆。

补指补充，指的是根据长期数据、近线计算的用户画像推荐的内容，可以起到良好的补充作用。

以热推多补作为指导思想，建立推荐模型、推荐策略。

时间： 2024-11-03 07:10:04

张相於：当当推荐数据系统架构实践

文章讲的是张相於:当当推荐数据系统架构实践,本文根据[2016 第七届中国数据库技术大会](微信搜索DTCC2014,关注关注中国数据库技术大会公众号)现场演讲嘉宾张相於老师分享内容整理而成.录音整理及文字编辑IT168@ZYY@老鱼讲师简介 ▲张相於现任58集团转转算法架构师,前当当网推荐&NLP开发经理.本科.硕士毕业于中国人民大学,曾任当当网个性化推荐&NLP算法开发经理.负责当当推荐系统以及NLP算法的相关工作,现任转转算法架构师,负责转转的推荐系统相关工作.具有多年推荐系统.

循环递归RNN，序列建模套路深（深度学习入门系列之十三）

系列文章一入侯门"深"似海,深度学习深几许(入门系列之一)人工"碳"索意犹尽,智能"硅"来未可知(深度学习入门系列之二)神经网络不胜语, M-P模型似可寻(深度学习入门系列之三)"机器学习"三重门,"中庸之道"趋若人(深度学习入门系列之四)Hello World感知机,懂你我心才安息(深度学习入门系列之五)损失函数减肥用,神经网络调权重(深度学习入门系列之六)山重水复疑无路,最快下降问梯度(深度学习入门系列

文章个性化推荐靠不靠谱？万字长文详解AI内容分发的真实现状

在AI时代,我们需要重新理解和认知内容C2M(单用户沟通)的机制和规律,去检讨传统传播理论的不足以及公共危机的管理方法,进而思考如何赢得沟通--要站在单个用户的角度来进行个体化沟通,而不是千人一面的宣灌或传播. 自从互联网商业化发展以来,不论是新闻客户端.视频网站或是电商平台--所有的平台,都是把自己默认为一个优秀的饲养员,它按照自己的想法,把内容(饲料)Push(喂)给用户. 这些饲养员都是受过训练的专业人士,行话叫做---由网站编辑为用户设置议程,按照大多数用户的口味挑选内容. 后来编辑实在

以讹传讹，社交网络的欺诈套路太深

本文讲的是以讹传讹,社交网络的欺诈套路太深, 上个周末,你的社交网络肯定被一则消息刷屏了,这则消息声称主要的航空公司正在免费提供机票.来自世界各地的用户都对该消息进行了转发,消息中涉及到的航空公司有阿联酋航空,法航,俄罗斯国际航空,S7航空公司,伊娃航空,土耳其航空,亚洲航空,印度航空等. 攻击者号称如果你订阅他们的移动付费服务,那么就会获得两张免费的机票.为了这两张机票,用户就会在购买该服务时泄露个人数据并安装恶意软件,而安装的恶意软件又会弹出广告和假的航空公司的网站诱惑你进行登录.为此,欺诈

扫雷实用帖：HBase读延迟的12种优化套路

任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题.HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了解太少.总结起来,大家遇到的主要问题无非是Full GC异常导致宕机问题.RIT问题.写吞吐量太低以及读延迟较大. Full GC问题的解决方案目前主要有两方面需要注意,一方面需要查看GC日志确认是哪种Full GC,根据Full GC类型对JVM参数进行调优,另一方面需要确认是否开启了BucketCach

DNF红眼80级版本装备选择推荐 CC套依然强势

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; [科技讯]12月31日消息,DNF开放80级后,曾经大热的职业红眼依旧热度不减.红眼的输出在众多职业中依然十分出色,愈挫愈勇,越打越强,是众多玩家对红眼钟爱的主要原因之一,另外,霸气的外表,帅气的招式,也是真男人不能抵御的诱惑. 那么在新版本中,红眼的装备选择上有哪些变化,曾经的出装套路是否已经过时了呢?下面就来看看资深DNF玩家对于红眼在80级版本中装备选择的

聊聊数据挖掘竞赛中的套路与深度学习的局限

前言刚好在暑假通过参加 kaggle 的 Zillow Prize 比赛来让我在数据挖掘和机器学习中完成了菜逼到 Level 1 的转变,借知乎的平台总结一下比赛的经验,先声明本文绝不是只列出名词的文章,每一点背后都会有相应的文字解说,各位客官可以安心吃用和讨论. 其次要强调的是这篇文章不承诺带你上 kaggle top1%,不承诺你看完后就懂数据挖掘,就懂机器学习,这次的总结分享只针对下列有如下问题的人群. 网上其他的攻略文章看得不少,为啥自己还是一波操作猛如虎,一看比分 0-5? 为啥深度

DNF黑暗武士加点装备推荐 85级仍适用

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; [科技讯]3月15日消息,DNF80级版本最新角色黑暗武士由于帅气的外形和极具特色的玩法,深受玩家们的喜爱,然而也正是由于人物角色的特殊性,无论是在加点方面还是在装备选择上,都与之前的所有角色有着很大的区别. 目前网上流传的各种装备选择和加点,无一不是玩家们在游戏实践不断摸索出来的,或许每一种都有各自的优点和不足,玩家们在参考的时候,一定要细致分析,结合自己的黑

推荐炉石传说冲天梯的必备术士牌组

炉石传说中,新赛季玩家们登顶天梯构筑的战火是愈演愈烈.而在每个赛季结束时都处于天梯前十六名的杰出玩家,将能够参加暴雪锦标赛的预选,并且奖金业也已升至250000美元.2014第三赛季的战火也是在一开始就空前激烈,而在几天的构筑角逐中,其中有个共通现象,同样也是玩家们本赛季排位赛无奈苦笑的缘由,那就是各类术士套牌天梯上都泛滥成灾在测试版本早期开始的时候,术士,尤其是动物园术士和其变种,总能够在构筑套牌的取舍中占有一席之地.因为其优势在于可以迅速建立场面优势,并且还能够连续扔下能在游戏早期造成威胁

推荐的套路

推荐的套路的相关文章