持续11天的2014年全国两会落下帷幕,围绕两会的新闻大战也进入收官和盘点阶段,今年两会新闻报道与以往最大不同就是对大数据的运用,在央视的《新闻联播》、《焦点访谈》、《晚间新闻》等王牌栏目中,均出现了用数据来解读两会热点的内容,《晚间新闻》更是推出“数据哥”作为“据说两会”的主播,拉近了与观众的距离,成为两会电视新闻报道的一大创新。
今年春节期间,《晚间新闻》采用百度大数据相继开创据说春运、据说春节等特别节目,新颖的形式受到了观众好评,新闻学术界也对这一创新予以肯定。中国人民大学新闻学院的陈力丹教授认为,重大新闻如果能够运用大数据来报道,深度会大大强化,也能够给人以更强的动感、论据,并且帮助人们比较准确的把握新闻内容。
2014年全国两会开幕后,《晚间新闻》主播顾国宁的称谓从“数据观察员”变成了“数据哥”,节目还别出心裁的设计了“数据哥”的素描像,由老百姓最关注的热门词汇组成,比如医疗、教育、环保、网络安全,互联网金融,让观众一眼就能看到两会期间都有哪些热点话题。
两会期间,央视在新闻报道中越来越多地利用大数据的研究成果,例如百度指数、百度新闻热搜榜,这些基于大数据的分析报告与以往的抽样调查结果相比,更加全面、客观和直观。其实,新闻和大数据的关联,基于以下几个特性——实时性、海量样本、数据挖掘、真实表达等,大数据因其“快、准、新、真”的特点,成为媒体争相采用的新方式也就不难理解了。
从央视各个栏目对大数据的运用来看,百度成为最主要的数据来源,这其中的原因在于百度作为搜索引擎,其后台数据在体现用户需求方面存在天然的优势。就两会这样的全国甚至全球都在关注的热点事件,百度大数据是汇聚了国情民意的最大平台。
首先,百度大数据的量大、面广。百度是中国流量排名第一的网站,在移动端拥有超过14个过亿的App,它们均会形成数据的积淀,数十万台服务器组成的爬虫集群每天不遗余力地到处去收集优质数据。同时,百度云稳定可靠的服务,为海量的数据存储、运算提供了保证。
其次,百度在数据处理和分析方面具有丰富的经验,数据洞察能力领先于其他互联网公司。百度在建立索引过程中需要去解析网页,去理解超链接,去分析原网页文本内容,在处理搜索时需尝试理解用户五花八门的输入请求,这些都促进了百度对非结构化的互联网数据的分析处理能力。
新闻报道对于大数据的应用,是互联网表达民意的一大进步,但大数据的价值远不止此,它可以支持媒体收集民意,反映真实世界,更大的想象空间则是与政府数据结合,与行业数据结合,一方面成为政府科学决策的重要依据,另一方面在金融、教育、医疗等各个领域激发创新,帮助传统产业升级和转型,探索出更新的模式,发掘更大的价值。