叶炜晨:视频遇上大数据,会擦出什么火花

文章讲的是叶炜晨:视频遇上大数据,会擦出什么火花,在近期的视频网站大会上,除了“独播”这种老生常谈的话题,大数据名副其实当选为视频网站宣传时最爱的词,爱奇艺也不例外。早在2013年,爱奇艺就着手将大数据“落地”,并研发了一套实时数据采集计算的综合解决方案—Venus。实时数据采集对视频行业到底意味着什么?当视频遇上大数据到底会擦出什么样的火花?这些谜题都会由本期采访嘉宾--叶炜晨,一一揭晓。


▲叶炜晨

  叶炜晨,毕业于上海交通大学计算机系。2013年加入爱奇艺云平台,14年起开始负责爱奇艺HBase业务,15年起开始负责爱奇艺实时计算相关业务。

  爱奇艺是如何运用大数据的呢?

  1.选用合适的数据处理系统

  叶炜晨表示一些公司的大型数据,如播放记录,搜索爬虫信息,用户信息等等,必须使用大数据相关系统才能存储,比如HBase/HDFS/HIVE等。传统的数据库方案不能很好处理TB以上量级的数据内容。而爱奇艺日均需处理数据量近50TB,传统的数据库方案显然支撑不住,Venus应运而生。Venus平台技术的实现是基于Spark Streaming,Flume,Kafka,Elasticsearch,Hadoop等大数据技术的二次开发应用,不是简单的部署搭配。其次,Spark在爱奇艺的应用比Storm更加广泛,在一部分业务中,Spark方案是作为MapReduce的优化和替代,将业务从MapReduce计算转移成Spark计算,计算速度可以大幅提升。另一个方面,Spark被广泛用于爱奇艺内部商业智能团队的数据挖掘和机器学习等场景下。在实时计算业务中,Spark的实时计算模块Spark Streaming也在日常业务中被广泛应用。相比Storm,Spark Streaming的吞吐量更高,这个是它的核心优势。在爱奇艺,Storm业务主要运行在Mesos集群上,Spark任务主要运行在YARN集群上。

  2.对用户行为精准画像

  爱奇艺近年在视频网站中崛起,除了“独播”之外,对用户行为的精准画像功不可没,这与大数据密切相关。叶炜晨说,爱奇艺是一家技术基因浓郁的公司,大数据部门是为公司决策层提供参考信息的核心。公司几乎各个技术部门都会使用大数据技术产品来辅助自己部门的业务。一些典型场景例如:根据用户行为,对用户进行画像,从而实现精准推荐和精准广告投放根据用户行为和百度提供的数据,预测一些版权视频未来会火的可能性,为版权视频采购提供指导性意见;根据用户行为和后台数据记录,实时统计所有业务的运营状态,计算各种业务运营报表,为市场,运营和决策层同学提供决策参考。良好的用户体验为爱奇艺赢得不少口碑。

  对数据的实时分析处理让爱奇艺可以对用户进行精准画像,从而了解用户的需求,开通个性化电影频道,为用户“私人定制”看片平台。

  互联网视频行业遇上大数据

  1、大数据带来了什么?

  今时今日,大数据已成为现代企业发展的核心资源之一,叶炜晨认为大数据从两个方面为互联网视频行业带来了可观的价值,一个是通过大数据计算的结果,为决策方提供一些辅助信息。在爱奇艺,无论是运营,市场,采购,安全风控,和各个决策部门,都在使用大数据的结果来辅助决策和判断。另一方面是通过大数据的计算,为用户提供更好的体验,如视频推荐,广告精准投放,弹幕互动等等。近年来,爱奇艺也在大数据技术上屡屡创新。更与百度大数据、第三方数据打通,推出爱奇艺大脑,并且利用HCDN等庞大的带宽储备技术,保证用户视频观看的流畅度。

  2、大数据在互联网视频行业如何应用?

  大数据在各行业蔓延,各行各业也各有千秋,大数据遇上互联网视频,会擦出什么火花呢?叶炜晨表示,互联网视频行业的大数据分析,较互联网其他行业,有很多独特之处。例如大数据分析中最基础的用户画像(判断一个用户的年龄,性别,职业,收入水平和兴趣爱好),在电商,O2O等其他互联网企业的大数据部门已经被广泛应用,然而在视频行业,对用户画像的难度远远超过电商。互联网视频行业的一个基本特点是,用户账号并非独立使用,而是普遍存在多人共用账号的情况。一个用户账号可能白天孩子在家用来看喜羊羊,晚上爸爸看二战电影,周末妈妈用来看韩国偶像剧。因此,传统电商或O2O企业使用的用户画像技术,在视频行业未必适用。对互联网视频行业的用户画像分析而言,对用户行为分析的相关算法的研究必须要更加深入,对计算实时性要求也会更高。

  写在最后

  在本届数据库技术大会上叶炜晨将带来《爱奇艺实时数据采集计算平台--Venus》,Venus是爱奇艺研发的一套实时数据的采集计算的综合解决方案。该方案专注于为公司各业务提供专业、灵活、可扩展的实时数据接入处理平台,对各类数据实时地进行汇总分析,分析结果可及时的反馈到各业务线(播放系统,搜索,CDN,会员等),用于故障排查、报警,日志分析,指标统计,智能化运营等场景,上线以来,日均处理数据量近50TB。感兴趣的小伙伴不要错过哦!

  2016第七届中国数据库技术大会(DTCC)将于2016年5月12日-14日召开,大会云集了国内外顶尖专家,共同探讨智能数据平台、数据治理、大数据创业、大数据深度学习等领域的前瞻性热点话题与技术,为数据库人群、大数据从业人员、广大互联网人士及行业相关人士提供最具价值的交流平台。欲了解更多有关大会的精彩内容请访问DTCC 2016官网:http://dtcc.it168.com/

作者: zyy

来源:IT168

原文链接:叶炜晨:视频遇上大数据,会擦出什么火花

时间: 2024-09-12 01:37:52

叶炜晨:视频遇上大数据,会擦出什么火花的相关文章

宜信大数据负责人Joyce:当金融遇上大数据,能擦出什么火花

ZDNet至顶网软件频道消息: 这两年,互联网金融的成长速度让一些不可一世的传统金融巨人也不禁打了个冷战.倒不是因为互联网金融业务的规模真的威胁到了传统金融,而是伴随它而来的这股创新力量让传统金融行业中存在的问题和局限性暴露无余.所幸,已经有一些人开始意识到问题的紧迫性,当然,还有问题背后所蕴藏的巨大机遇. Joyce Zhang 就是这些人中的一个.Joyce 是宜信 CEO 唐宁从美国挖来的一位资深大数据专家,现在担任宜信大数据创新中心的总经理.在来宜信之前,Joyce 曾经服务过 Hulu

当DCIM遇上大数据:ZNV中兴力维“维统管”驱动IDC产业

中国数据中心市场在规模不断扩大的同时,正由野蛮生长迈向精耕细作,对运维管理的重视度与日俱增.另一方面,传统行业的数字化转型.物联网在工业领域的应用将带来远超以往的数据量,这也对数据中心的运维管理提出了更高的要求. ZNV中兴力维4月下旬发布了最新一版的智慧数据中心综合管理系统--维统管2.1.与传统数据中心基础设施管理系统(DCIM)相比,其最主要差别就在于创新性地引入大数据技术,以此来打破数据库桎梏.支持秒级的高密度数据采集,带来更高效.更精准.更实时的管理,数据中心业主及运营者亦能藉此延展出

宜信大数据负责人Joyce:当金融遇上大数据

这两年,互联网金融的成长速度让一些不可一世的传统金融巨人也不禁打了个冷战.倒不是因为互联网金融业务的规模真的威胁到了传统金融,而是伴随它而来的这股创新力量让传统金融行业中存在的问题和局限性暴露无遗.所幸,已经有一些人开始意识到问题的紧迫性,当然,还有问题背后所蕴藏的巨大机遇. Joyce Zhang 就是这些人中的一个.Joyce 是宜信 CEO 唐宁从美国挖来的一位资深大数据专家,现在担任宜信大数据创新中心的总经理.在来宜信之前,Joyce 曾经服务过 Hulu.Microsoft 等公司,主

当人工智能遇上大数据 第九届中国云计算大会——大数据与人工智能应用论坛吸睛亮点集结

至顶网个人商用频道 06月10日 北京消息(文/黄雅琦)科技正在进入一个新的时代,这个时代的一个典型特征就是数据成为一种宝贵的资产.在海量的数据支撑之下科技越来越智能,不仅能"听懂"我们的语言,还能"看懂"我们的表情,帮我们做出更为科学的决策.在这些科技进步的背后离不开数据处理技术的飞速发展,从商业智能.大数据到人工智能,人类对数据的处理能力不断提升,数据背后的商业价值在不断发掘,也给人类更大的帮助. 基于这样背景,第九届中国云计算大会将在6月14日-16日在北京国

世纪佳缘:当爱情遇上“大数据”

一年时间,大数据已开始进入人们生活的方方面面,恋爱也不例外. 据相关统计,有约五分之一的恋爱关系是从http://www.aliyun.com/zixun/aggregation/17676.html">婚恋网站开始的.去年11月新华社报道,中国适婚单身男女数量已超过1.8亿,这一群"嗷嗷待哺"的单身青年在努力寻找一个方式,遇见爱情,婚恋网站成了他们最好的选择. 是什么在网络婚恋的背后默默无闻?庞大的数据库如何变身红娘,面对1.8亿单身男女的"饥渴"

当世界杯遇上大数据

当世界杯遇到大数据,这场狂欢注定与众不同. 且不论通过大数据分析,球迷们对比赛结果的预测多了份自信.大数据更让商家发现,原来世界杯可以热卖的远不止啤酒和鸭脖. 在商家眼里,球迷可以分为三类:狂热球迷.世界杯赛季球迷.女球迷.分析不同球迷的不同行为,大数据能判断出他们潜在的消费点在哪里. 狂热球迷每场必看,世界杯赛季球迷基本只关注强队比赛.深夜看球对啤酒.饮料.零食的需求较大.很多人看自己中意的球队比赛时,还会穿上球队球衣来助兴,这也是http://www.aliyun.com/zixun/agg

当足球遇上大数据

2013/14赛季英超联赛戏剧性地画上句号,如果说还有什么比最后一轮才决出冠军归属更让人跌破眼镜的,一定是卫冕冠军"红魔"曼联的快速衰落和名不见经传的埃弗顿异军突起.埃弗顿不仅力压曼联,排名甚至高于转会市场一掷千金的伦敦球队热刺,也成为球迷津津乐道的话题. 埃弗顿的逆袭代表了足球界的新趋势:数据革命. 欧洲足球正在经历这样一场革命.专业球迷们可能从新闻堆里发现蛛丝马迹:各大球会都在变得更聪明也更有效率.以前,关于足球的数据统计只有角球.任意球.红黄牌和射门次数,现在人们还可以看到球员单

黄金周遇上大数据:云平台给力居家旅行

9月中旬刚到,铁道部12306网站试点的预约订票,就吹响为中秋和十一接连的黄金周准备的号角.在互联网和移动互联网已经渗透我们生活的今天,不管是居家还是旅行,互联其背后的服务都是至关重要,那么,云计算和大数据能为我们的黄金周做些什么呢?9月12日下午,英特尔(中国)有限公司服务器平台产品经理张振宇对IT专家网记者表示,英特尔的至强处理器平台和Hadoop大数据解决方案,已经在我们的日常生活中发挥着重大的作用. 张振宇从3G流量查询.网购.平安城市.智能医疗.天气预报和玩转微博等六个活生生的案例,再

当捕鱼人遇上大数据

60岁的浙江捕鱼从业者朱义峰出名了,以一种自己没想到的方式. 在云集了2万多开发者的杭州云栖大会预热海报上,朱义峰的名字赫然在列.对他的介绍是:用科技创新来改变捕捞方式,让渔民不再靠天吃饭,风险难测.海报背景呈现的是两位远洋捕鱼者站立的侧影,顺着他们的目光远远地看去,是乌云密布之下暗潮涌动的大洋-- 这张海报已经开始在网络上流传,远洋捕鱼者和大数据,两个看似毫不相关的事物,通过这张海报拨动着每个观者的心弦. "我从事大数据捕鱼快20年了,从来没想到会以这样的方式出名."朱义峰一边说着,