随着社会的不断发展,数据分析的价值越发凸显。洞悉本质,预测未来,是人类追寻的永恒真理,也是数据分析的价值所在。2017年5月10日,由中国新一代IT产业推进联盟主办,CIO时代APP承办的"第57期CIO时代信息化大讲堂"活动在北京大学燕园大厦如期举行。
中国传媒大学信息工程学院副教授、兼任中传影视大数据研究院技术负责人、中国商业联合会数据分析专业委员会特聘讲师王鑫作为本期活动的特邀讲师,发表了题为《大数据在传媒领域的应用》的主题演讲。
他主要从数据和大数据的定义、怎么使用数据、数据的应用领域三大方面展开详细阐述。
数据的发展
从远古时代开始,人类就开始对自然界的事物以及自身的活动进行测量和记录。因此,可以说人类社会时时刻刻都在产生数据。只是随着社会的发展和技术的进步,人们需要并且能够记录和分析更多的数据。直到2014年1月25日,央视《晚间新闻》“据说春运”特别节目首次播出后,观众们对这种运用数据可视化技术来播新闻的新颖方式非常感兴趣。在技术进步和用户需求双轮驱动下,大数据的列车已滚滚而来。大数据将深深的影响我国的政治、经济、文化和社会各个层面。
数据可视化工具和数据挖掘十大算法
数据可视化工具包括EXCEL、Tableau、D3、R语言、Gephi、NodeXL等等,数据挖掘十大算法包括用于统计学习的SVM、EM工具,链接挖掘的PAGE RANK,袋装推进的AdaBoost,用于聚类的K-Means,用于分类的C4.5、KNM、CART、Naive Bayes,用于关联的Apriori。
数据:将带来一场新的革命
数据价值的凸显和数据获取手段、数据处理技术的改进是"大数据"爆发的根源。而随着数据生产要素化,数据科学、数据科技的不断发展和数据价值的深度挖掘及应用,一场大数据革命正在进行,它将带动国家战略及区域经济发展,智慧城市建设,企业转型升级,社会管理及个人工作、生活等各个领域的创新和变革。如何真正应用好大数据,发挥大数据的威力,是当前所有人都在共同研究和探索的问题。
可视化技术行业应用
1、新闻。主要应用于新闻舆情分析、新闻热点分析、新闻重大事件分析。
2、电影。主要应用于电影剧本分析、电影营销分析、电影用户行为分析。
3、广电。主要应用于用户行为分析、用户肖像刻画、广告精准投放、智能推荐系统。
4、电视剧。主要应用于节目收视分析、节目流失分析、节目偏好分析。
广电大数据 —分析
1、在直播方面,数据分析包括收视时长、收视率、到达率、接触度、市场份额、观众忠诚度等。创新指标里的节目相对吸引力、收视率分布等。
2、在点播方面,主要分析VOD业务使用及VOD节目指标以及各时段在线户数、在线率;到达户数、到达率、点播户数、点播率、收看时长、页面点击等。创新的竞争力指标里的时间转化率、点击转化率。按栏目、按供应商分别分析。
3、在时移、回看方面,业务各时段在线户数、在线率、页面点击率等分析。各频道及节目的收视时长、收视率、到达户数、到达率、市场份额等数据分析。
4、在广告业务方面,按各广告位、广告包进行指标分析,和各广告位曝光频次、n+曝光率、n+到达户数、有效曝光率、有效到达户数等。
5、其它增值业务。数据分析包括业务各时段在线户数、在线率、页面点击率以及其它定制指标分析。
广电大数据的特点
1、数据准确、分析计算误差小;公正、抗污染、不易造假。全网海量用户收视数据分析,全方位、无死角,尤其对弱势频道、非黄金时段节目的数据分析更准确,使其数据有意义,更能反映实际情况;全网双向用户可达千万以上,用户污染影响微乎其微;
2、指标更有价值。例如忠诚度、竞争力指标等,对低收视率的频道和节目,能提供更多参考依据;
3、能提供舆情分析。根据全网用户的收视行为,结合节目播出信息,可以分析舆情;涉及舆情及国家信息安全,不建议外资公司参与;
4、能了解每一个用户的偏好,提供个性化服务。
5、技术难度大。采用传统手段采集海量用户收视数据,成本太高;采用终端数据回传,需要掌握嵌入式设备、计算机、网络相关的关键技术;全网收视数据是海量数据(以歌华为例,400万用户每天>2亿条),传统的数据库技术无法支撑,需掌握大数据处理系统的架构、算法、专业工具等核心技术;
在提问环节中,他对到场的嘉宾所提的问题依次进行了详细的解答。他的讲解环环相扣,理论与实践兼备,现场提问不断,十分精彩。活动最后,现场嘉宾进行了合影留念。
合影留念
本文转自d1net(转载)