今日头条的引擎是怎么样工作的?

把媒体内容分发给用户,“你关心的才是头条”,对于今日头条这个产品,相信大家都不陌生。那么,你是否好奇过,今日头条是如何做到,向每个读者推送不一样的、据称是符合读者每个人不同兴趣的内容的呢?今日头条算数中心执行总监刘志毅在日前于深圳北京大学汇丰商学院举行的“数据之美”论坛上做了介绍。

首先,数据从哪里来?

虽然对于头条来讲,其用户量、用户的粘性时间已经足够大了,但是,要怎么样精细,怎么样的数据才是可信赖的,怎么样的数据是可复用的?

对于数据所产生和获取的流程,今日头条算数中心执行总监刘志毅抛出一道小问题来介绍:

现在面前有很多颗糖果,然后有两个人要把这个糖果的数量数清楚,有一个人他会加减乘除地来数,3颗3颗数,5颗5颗地;还有一个人就很笨,只会一颗一颗,永远一颗一颗地数,那问一下,是哪一个人能够先把这一大堆糖果数清楚啊?

事实上,按正常的逻辑确实应该回答“第一个”的,“但是在互联网公司,答案是第二个,因为虽然是一颗一颗地数,但他一秒种可以数一万个,所以他更直接更快速。”这是机器学习发展到今天的成果,机器分发的效率一定大于人工分发。在2016年的年终,易观发布的第三方数据显示,如今机器分发的比例已经超过了人工分发。

分发糖果与分发内容逻辑是一样的。那么,这背后,头条具体的引擎是怎么样工作的?这时候需要把文章和用户两端的数据连接起来。

据刘志毅解释,

首先文章进入机器引擎后,头条需要机器识别它们的关键词,识别其涉及到的内容领域,用户对它们的反应,然后把结果放到一个特征向量空间中。

与此同时,用户端也发生了同样的变化。

“然后我们去看这两个向量,怎么样匹配度最高,然后就推送给他。”

具体来说,这些用以匹配的数据变量可能包括几个大方面的特征:

首先,这个用户,他的性别兴趣,年龄地域用的手机是什么?

家乡是哪里?关注什么东西?会点什么样的广告?

然后他目前处在什么样的环境?今天有没有下雨?用WiFi还是用3G,4G,2G?

这个文章本身是一分钟之内的快消息,还是几年之内看都不算失效的消息?用户的反馈对他们是什么样?

这个文章有什么样的关键词……等等

这些数据将产生一个百亿级别的特征,今日头条最终根据特征判断用户的需求,把内容呈现到每一个人不同的手机屏幕上。

但是,这还不是最技术范的地方。数据部门真正做的事情是,“从刚刚所描述的这个过程中积累出来一些东西,然后让他去发挥价值,”刘志毅说道,这才是数据挖掘的价值所在。

“这只是我所想要表达的数据维度的1%,”

用户点击什么文章?没有点击什么文章?

点赞还是点踩?

阅读速度快不快?完成多少比例?

对某一个话题产生了持续性的还是短暂的影响?读完之后有没有讲到什么评论?

那他用的是什么样的手机在读你的东西?是什么样的手机的什么型号?去年用这个型号,今年是不是还用这个型号?

……

刘志毅称,“这样的信息都会作为这个用户的组合特征的一部分,然后我们去提取这一部分来把它作为数据的样本进行分析。”

数据到哪里去?

知道了数据怎么来之后,数据要到哪里去,产生怎样的价值?这又是一场好戏了。

据雷锋网(公众号:雷锋网)了解,今日头条曾推出了“今日头条媒体实验室”,这个实验室的作用,相当于差异化内容创作的“参谋”。就是说,其将通过每一篇文章的传播数据去告诉不同的内容的写作者创作者,假如想要影响某一个特定的人群,需要怎么样创作内容,并且在什么样的平台上,以什么样的方式在什么样的时间点发布是效率最大化的。

刘志毅举了这样一个例子:以美国总统选举为例,在中国希拉里一直热度是领先,但是跟美国人投票不一样。最后希拉里败选,但是她败选之后,在头条平台上面的热度也降得非常快,这个可能跟中国人对美国时政事件的关心规律有关系,那么,媒体则会依据这个来进行内容创作。

另外一个是,数据也许可以呈现出人类作者意想不到的角度:在今日头条与南方周末的合作中,大家都关心学区房房价的问题,但数据显示——在这些事实之外,跟学区房同时出现的概率最高的词中间,“离婚”排在前3位。

这就是计算机辅助报道的一种方式,也是大数据、AI带给传统行业的变革。

AI带给商业市场更多机会

除了反哺媒体创作,阅读数据还有哪些想象力呢?

透视市场潜力

雷锋网此前报道,在一些数据密集型的产业,都成为了AI产业应用孵化的首选之地。接下来看了OPPO和vivo的案例,你就不会奇怪了。

众所周知,去年,手机市场一个关注度颇高的话题是:大家发现主流手机品牌不那么景气了,包括苹果,但是有两家厂商非常受关注——OPPO和Vivo。

“OPPO跟Vivo做了一件很有意思的事情,他们在345线城市的用户很多,但是他们请了很多跟一二线城市的口味更匹配的代言人来作为宣传他们品牌的代言人。这是他们根据通过阅读数据产生的决定。他们充分把握住了345线城市对于手机的需求。”

雷锋网了解到,根据头条阅读的数据发现,345线城市对于手机的具体参数、性价比方面表现得不那么敏感,但对于手机的体验的介绍,却是阅读量远高于一二线城市的。“所以当OPPO没有把大部分的推广和宣传经费放到线下的渠道去影响345线城市的时候,他后面的成功,也是在阅读数据上能够发现的奇妙的地方。”

总的来说,刘志毅表示,AI之所以影响人类各行各业,是因为,“阅读其实是一种人们对于自我归类的一种方式,所以头条上面阅读数据其实是人在不同的组别中间自我归类的一些信息,这些规律的信息产生了我刚才所说到的所有的价值。”

封面图来自网络


本文作者:温晓桦

本文转自雷锋网禁止二次转载,原文链接

时间: 2025-01-19 12:54:22

今日头条的引擎是怎么样工作的?的相关文章

新闻外衣的推荐引擎:今日头条的价值在哪里?

资讯类APP"今日头条"今日确认获得1亿美元的C轮融资,估值超过5亿美元.据了解,此轮融资由红杉资本和新浪微博领投.此前"今日头条"已经进行过两轮融资,2012年7月获得SIG海纳亚洲等数百万美元A轮投资,2013年9月获得DST等数千万美元B轮投资.自2012年8月份上线以来,今日头条已经累计用户超过1.2亿. 一支没有任何新闻门户基因的创业团队,却做出了一款用户规模近1亿的热门新闻客户端产品,这听上去有些不可以思议,但它的确发生了. 在2013年的新闻客户端大战

今日头条马维英:从结绳记事到超级智能,AI Era保持竞争力的5大优势

只有到了现场才能深切体会新智元的"AI春节"有多么火热,这不仅仅是说700多人的聚会让会场温暖到热,各位技术大牛轮番知识轰炸也让人的脑筋在高速运转下真的发起烫来. 一身优雅的衬衫和儒雅的台湾腔,今日头条马维英博士的登台瞬间为现场带来一股清流,脑汁被干货压榨也成为享受. 马维英博士是今日头条副总裁兼人工智能实验室主任.今年2月他离开微软加入今日头条的消息在业界引发了不小的震动.各方都在密切关注这位前微软亚洲研究院常务副院长在新岗位上的新动向. 马维英博士的研究领域包括机器学习.自然语言处

今日头条获巨额融资却遭质疑 回应不存在侵权

中介交易 SEO诊断 淘宝客 云主机 技术大厅 延伸阅读:今日头条否认侵权遭质疑:腾讯搜狐否认合作 纸媒已起诉广州日报起诉"今日头条"侵权 回应称并非转载只是导流每日话题:今日头条5亿美元估值的背后是新闻搬用工还是侵权"今日头条"融资后遭媒体围剿 回应 版权和估值质疑一亿美元,"今日头条" 多少能用在版权? 央广网北京6月6日消息(记者庄胜春)据中国之声<新闻纵横>报道,如今用手机看新闻,已成为很多人的习惯.各种各样的新闻.阅读客户端

专访 | 今日头条李磊:程序员如何跻身AI大潮,应用如何落地

李磊博士是今日头条人工智能实验室(Toutiao AI Lab)总监,原百度美国深度学习实验室"少帅科学家",师从数据挖掘领域权威Christos Faloutsos教授,主要研究领域为深度学习.概率模型与推理.自然语言理解,以及时间序列分析.在国际顶级学术会议发表学术论文30余篇,拥有三项美国发明专利. 今日头条科学家.人工智能实验室总监 李磊 近日,这位研究出身,如今又投身工业界的博士接受了CSDN的专访,采访中李磊分享了他对当下人工智能过热的一些看法,并结合自身的求学与从业经历,

CCAI | 今日头条实验室李磊:我们离会思考的机器人还有多远?

在刚刚结束的中国人工智能大会CCAI上,今日头条科学家李磊同我们分享了一些他对机器学习未来发展方向的一些思考,以及在此基础上讨论了一下我们还要做些什么才能向通用型AI再靠近一点的问题.今日头条最初是一家新闻聚合平台,但素有应用AI来解决问题的传统.最近今日头条也做出了自己的新闻机器人,在里约奥运期间自动完成了大量的报道.而李磊作为有着多年机器学习.人工智能和深度学习领域研究经验的科学家.在这个问题上也有着自己的看法. 李磊在演讲中说,要弄清楚我们离通用机器人还有多远,首先要弄明白三个方面:一是人

暴风也要做“信息流”精准推荐,坦言模仿今日头条

"你关心的,才是头条." 想必大家已经对这句广告耳熟能详. 这句简单的广告词可以说代表了今日头条的核心优势:以机器算法来做新闻资讯的精准推荐和分发,让用户能看到自己喜欢的内容. 这种推荐机制打破了传统的新闻页面的分类方式,而是以像瀑布一样实时流动的"信息流"的方式呈现. "信息流"的方式帮助头条取得了巨大的成功.  在9月6日的暴风风迷节现场,暴风宣布全面拥抱"信息流".风迷节上暴风提出了几大战略升级,包括人工智能引领电视革命

今日头条APP,北京字节跳动科技已经完成了红杉领投的1亿美元的C轮融资

你看到这篇文章的时候,今日头条APP,也就是北京字节跳动科技有限公司(以下称"字节跳动"),已经完成了红杉领投的1亿美元的C轮融资, 微博 同时参与跟投.张一鸣的"字节跳动"估值高达5亿美元. APP越来越值钱?2014年初,安卓应用搜索(现扩展为"移动内容搜索")APP豌豆荚B轮融资1.2亿美元.再往前, 百度 以近19亿美元收购91无线.还有,接近神话的, Facebook 宣布190亿美元收购Whatsapp. 用户数量决定估值的耀眼度.来

“今日头条”成个性化推荐阅读年度黑马

在你的智能手机上,你是怎样获取和阅读信息的?在2013年,有一款名为"今日头条"的应用可谓是抢尽了资讯阅读类APP的风头,并且在大众中快速地流行起来.而这款应用不需要手机用户做出任何操作,就可以马上自动地为用户推荐个性化的.让用户自己真正感兴趣的信息,而且随着使用次数越多,信息推荐也就越准确.因为产品的易用性加上用户对产品使用超爽的反馈,"今日头条"就获得了360颁发的中国手机游戏软件排行榜年度黑马奖. 在信息爆炸的时代,人们面对的选择越来越多,选择过多,信息超载,

今日头条上线“今日特卖”

DoNews 7月21日消息(记者 周勤燕)7月21日,新闻推荐引擎"今日头条"低调上线电商导购产品"今日特卖",涉足个性化电商导购领域. 从"今日头条"客户端中可以看到,"今日特卖"以消息流的形式展现在今日头条APP的推荐界面中,用户点击活动推广图后,会跳转至mashangju.com网址.该站点分为"今日精选"."优品预告"和"淘我所爱"三个频道,涉及百货.数码.