二○一三:中国政府统计之大数据元年

2013年即将进入最后一个月份。无论是否认可或采纳接下来的说法,但已经成为过去时和正在成为现在时的工作表明,2013年注定要成为中国政府统计的大数据元年。

曾经有两幅曲线图形象地反映了大数据受关注的程度,即谷歌和百度以“大数据”为关键词的搜索曲线。前者在从2011年到2012年的时段,后者在从2012年到到2013年的时段,都有了一个明显、甚至可以说是陡然的上升。无疑,上升的曲线表明,大数据的炙手可热,其实只是近两年来的事情。而作为最大的中文搜索引擎,百度曲线的变化,表明大数据火在中国,或只是近一年多来的事情。两条曲线的对比,表明以“大数据”作为关键词进行搜索,其曲线的陡然上升,中文比英文慢了大约半年到一年的时间。但是,在中文搜索曲线陡然上升的同时,中国政府统计有关大数据应用研究确已经同步开始了。

一年来,我们走访了商务部、国家测绘局等政府部门,到百度、淘宝、腾讯、华为、苏宁、1号店、58同城、京东商城、天脉聚源、擎天科技、天云融创、S.CN鞋业等知名企业,与国内诸多业界知名专家、多位美籍华裔专家进行了探讨请教,聆听了大数据代表性论著《大数据》作者涂子沛先生、《大数据时代》作者舍恩伯格先生的讲座,组织了多次系统内各级领导、科研人员参加的座谈,形成了十几万字的研究报告,并进行了许多次修改。最终的研究成果,已经以《大数据在政府统计中的探索与应用》为题正式出版发行。

一个月前,两年一次的全国统计科学讨论会在杭州举行,会议的主题就是《大数据背景下的统计》。包括香港浸会大学数学系首席教授朱力行、阿里巴巴集团数据委员会会长、首席数据官车品觉先生在内的多位知名专家和200余位统计理论、教学和实际工作者聚集一堂,共同分析大数据对统计学和统计工作的影响,共商在政府统计工作中应对大数据挑战的对策。国家统计局副局长徐一帆指出,“大数据将对政府统计工作的各个环节产生广泛而深刻的影响。政府统计要努力发现数据中所隐含的现象和规律,从而提高政府统计的能力。”

一个星期前,2013年11月19日,国家统计局与阿里、百度等11家企业签署了大数据战略合作框架协议,共同在分享、开发、利用大数据方面进行合作,以推动大数据在政府统计中的应用,促进大数据实现大价值,使之更好地服务于社会。国家统计局局长马建堂在讲话中指出,“国家统计局与协议签订企业的合作是优势互补、互利双赢,也是国家统计局打造现代化服务型统计的重要举措。通过合作,必将极大推动大数据开发利用的科学性、统一性、规范性。”

虽然在协议签署的当天,邀请的媒体并不多,但第二天,诸多媒体对此还是给予了广泛的关注和报道。《经济日报》、《第一财经时报》等财经类媒体,都在显著位置进行报道,前者还配发了题为《比技术更重要的是观念》的编辑点评;国家统计局官方网站刊发消息后,新浪、搜狐、凤凰、和讯等综合和资讯类门户网站都广泛予以转载;11家签约企业中的上海钢联、山东卓创、泛亚有色金属、1号店等企业,纷纷在自己的网站、微博上发布消息,相关行业网站也都及时进行了转发和报道。还有与大数据相关的企业,积极联系,表达意愿,愿意成为合作的第12家企业。合作协议的签署,表明推动大数据在政府统计中的应用,正在从研究论证阶段转入实际操作阶段。

当然,我们一点也不会低估统计工作应用大数据,在组织、设计、技术等诸多方面和环节上的难度。11家企业,每个企业有每个企业的特点;政府统计各个专业,每个专业有每个专业的要求。导入也好,对接也罢,在实际应用中要迈出哪怕很小的一步,也需要付出大量艰苦细致且具有一定科技含量的努力。但是,大数据时代毕竟不以人的意志为转移地已经开启和到来了;中国政府统计系统审时度势、抓住机遇,也已经作出和采取了紧跟时代步伐同步前行的决策和举措。元年已是。接下来,就是如何续写历史了。

(责任编辑:蒙遗善)

时间: 2024-09-18 03:31:34

二○一三:中国政府统计之大数据元年的相关文章

国家统计局:政府统计应用大数据的主要障碍

2014年8月19日中国国际大数据大会在北京国宾酒店举行.在大数据应用发展论坛上,国家统计局统计科学研究所副所长许亦频对政府统计应用大数据面临的主要障碍进行了详细的阐述. 许亦频 法律.法规与数据安全 随着大数据应用的不断深入,有关数据产权.数据公开和数据安全的法律.法规缺失很严重.同时大数据对隐私的窥探和暴露与大数据本身的特点是紧密相关的,这必然冲击现有的管理方式.社会秩序和法律体系. 在法律的层面上我国只有针对国家秘密的<国家保密法>,缺失针对个人隐私和商业秘密的专门法律.在专门的行政法规

于施洋:中国政府如何应对大数据时代的挑战

在当今世界,发达国家都在运用大数据精准营销来提升政府机关.个人的商业价值和形象,奥巴马就是其中的佼佼者.在2012年的大选中奥巴马有效地利用了社会化的精准营销,获得了大胜.而中国http://www.aliyun.com/zixun/aggregation/14297.html">电子政务的数字化才刚刚起步,对于政府来说,利用大数据进行精准挖掘.营销和电子政务的智能化主要的困难和挑战是什么? 国家信息中心网络政府研究中心副主任于施洋 国家信息中心网络政府研究中心副主任于施洋在昨日国双数据中

日媒:助力政府治理!大数据助中国打造诚信社会体系

在"来自皇帝的口信"寓言中,20世纪初期德语作家卡夫卡描述了一名信使为即将驾崩的中国皇帝向边疆省份传达信息的过程.中华帝国如此庞大,这名信使将为抵达遥远内陆而穷尽一生. 纵观历史,中国统治者获得有关其庞大且多样化人口的可靠数据,一向颇费力气.已故美国华裔历史学家黄仁宇说,古代中国缺乏"数目字管理".地方官员为一己私利编造光鲜事迹上报朝廷.政府无法收集可靠数据,不仅曾阻碍资本主义在华发展,还曾影响了中国现代化进程. 现代中国继承了这些问题.众多地方政府为中央收集数据,

2016中国高校计算机大赛——大数据挑战赛极客奖:COM团队

摘要:2016中国高校计算机大赛--大数据挑战赛是由教育部和全国高等学校计算机教育研究会联合主办,清华大学和阿里云联合承办,在"天池大数据众智平台"上开展的高端算法竞赛.本次赛题是对于阿里音乐流行趋势进行预测,本文整理自大赛极客奖COM团队的答辩演讲. 本文整理自获得本次2016中国高校计算机大赛阿里音乐流行趋势预测比赛中COM团队答辩视频.在游戏世界中其实流行这样的一句话就是:不怕神一样的对手,就怕猪一样的队友.团队对于最后获得的成绩是十分关键的,COM团队由三名成员组成的,下图为C

IDC:中国金融行业正步入大数据时代初级阶段

3月25日,IDC研究显示,当前,数据是重要资产的理念已经在中国金融行业形成共识,数据的真正价值在于能够洞察企业内部规律,数据的洞察力成为金融企业的核心竞争力.在中国金融行业信息化建设中,与信息加工密切相关的大数据管理正逐渐成为与核心业务系统建设.渠道建设和前置建设同等重要的领域. 经过多年的发展与积累,目前中国的大型商业银行和保险公司的数据量已经达到100TB以上级别,并且非结构化数据量在迅速增长.基于IDC对大数据的定义(通常数据量大于100TB, 数据量年增率大于60%,数据采集是高速数据

探秘中国最大的第三方大数据中心&quot;乾鸣&quot;

文章讲的是探秘中国最大的第三方大数据中心"乾鸣",能容纳50万台服务器是个什么概念?这样的数据中心长啥样?以园区形式落地的 "一体化"大数据中心到底有何不同?今天老鱼就带大家一起走进中国最大的第三方公立大数据中心:贵阳乾鸣国际信息产业园. 没见过乾鸣国际信息产业园?正式内容之前,我们先来看看位于贵阳高新区沙文产业园区的贵阳乾鸣国际信息产业园的照片.下图为,项目一期8号楼,ECC总控中心楼,目前也承担部分接待工作. ▲乾鸣国际信息产业园 项目名称:乾鸣国际信息产业园

“大数据元年”:中国发展异军突起

2012年,从铺垫.酝酿.诞生再到质疑.喧嚣.炒作,大数据在2013来临之际,终于正式走下神坛,向着各个行业各个领域深入渗透,产生了巨大变革之力,这也是"大数据元年"的核心要义. 从全球范围看,这种变革正在发生.互联网行业首当其冲,接着是商业智能与咨询服务领域.零售行业,还包括医疗.卫生.交通.物流甚至生物科技.天文--大数据催生的数据服务意识和能力,正在影响这个社会的方方面面,从商业科技到医疗.政府.教育.经济.人文以及社会的其他各个领域,并催生了了各行各业的变革力量. 处于发展中国

2016中国高校计算机大赛——大数据挑战赛极客奖:data_coders团队

2016中国高校计算机大赛大数据挑战赛上,data_coders团队对阿里音乐流行趋势预测进行了自己的阐述理解.首先对赛题进行了分析,确定解题思路,重点对算法进行了说明,包括类别分析.特征提取和算法模型,最后做了简要的总结.一起来欣赏下.   问题分析 已知20150301-20150830的用户行为和歌手歌曲历史记录,预测9月1日至10月30日1000位歌手每天的歌曲点播量? 对用户来说,用户涉及到的歌手进行点播量预测累加,但是单个用户点播行为随机性大,误差积累,模型复杂,直接Pass掉:对歌

2016中国高校计算机大赛——大数据挑战赛季军:Heal the World团队

2016中国高校计算机大赛大数据挑战赛上,Heal the World团队对阿里音乐流行趋势预测展示了自己的比赛成果.主要从问题分析开始谈起,确定解题思路,重点分享了分类与预测,进行了五步分离,最后做了简要总结.擦亮眼睛快看看吧.   问题分析 此次比赛给出了1000位艺人在2015年3月1日至2015年8月30日之间的所有歌曲数据以及相关用户的行为.要求预测9.10月份的艺人所有歌曲的播放量. 但是我们发现,预测的数值在一个比较短的时间以后都是一个常数.这启发我们直接利用一个常数作为预测.我们