大咖丨交通运输部科学研究院:交通运输大数据的基础环境正日益成熟-清数•思享会

“交通行业是一个基础性产业,我们面对的是点多、线长、面广的现状。”交通运输部科学研究院交通信息中心副主任黄莉莉用这样一句话概括了交通行业特点。

交通运输部科学研究院信息中心肩负着交通行业统计数据生产和交通运输部综合交通运输大数据应用中心的工作任务,多年来专门从事交通运输相关数据的采集、处理、分析应用等工作。这样一个部门,面对管理上条块结合的交通运输行业,如何才能协调各业务领域,从质量参差不齐的数据中挖掘价值?

12月7日,清数大数据产业联盟与清华校友总会AI大数据专委会(筹)共同主办的交通大数据思享会上,黄莉莉分享了交通运输大数据的分析与应用的实践。

我们对本次分享的精彩内容进行了整理,在不改变原意的前提下有删改:

首先说一下交通运输行业大数据相关工作的一些背景。交通行业的业务领域覆盖面很广,今天介绍的重点是以公路和水路为主。

随着十一五、十二五整个行业信息化的推进,交通运输行业管理部门和相关交通运输企业掌握的交通运输大数据正在日益形成。但与公安、国土、海关这些部门比,交通领域的大数据依然十分分散。行业信息化还在不断发展的过程中,交通运输大数据的基础环境正在日益成熟,这是一个大的发展背景和情况。

综合交通运输大数据应用中心目前主要承担以下几个职能:

第一承担综合交通运输大数据政策标准研究。

第二关于行业数据资源目录的编制和维护。我们今年编制了2017年版的交通运输行业信息资源目录,在这个目录里涵盖了部里主要司局相关的信息资源。

第三负责建设部级交换共享平台的建设和运维,目前正在与国家平台进行对接。

第四关于行业大数据的分析和应用,以及我们为部为行业提供大数据分析决策技术支持和服务,以及对外的交换共享联络以及关于共享监测分析。

今年我们成功申报了行业综合交通运输大数据应用技术实验室,来推进数据交换共享开放工作。主要是希望能让更多的想使用行业数据的企业和研究人员,能依托实验室这个开放的技术平台,到我们的实验室来开展研究工作,使用实验室提供的数据,参与到行业大数据分析应用工作中。

交通行业特点:点多、线长、面广

对于实验室的方向,第一政策标准研究,第二是大数据采集模型建立还有数据处理。前面讲了,行业数据比较分散,主要是由于交通行业管理对象的特点决定的。我们一直说交通行业是一个基础性产业,但我们面对的是点多、线长、面广。比如像中资现在做行业遥感数据中心,公路去用遥感数据,跟其他的行业比最典型的问题是,公路基础设施是覆盖全国的。比如跟水利部门比,水利枢纽位置很固定,获取固定范围的遥感数据就好了。但是交通是一个全域覆盖的线状的。在路上运行的车辆又是到处流动的,而且它的行驶和运行情况也是不可控的,不像铁路在有限的环境和区域,包括航空也是,有航线的要求。尤其是货运车辆是市场化的行为,监管的范围和难度都很大,因此很难通过行政命令要求货运企业给政府提供数据。所以大数据采集、处理的技术有很大的挖掘空间。

政策研究

去年和今年部里出台了两份重要的文件,一个是推进交通运输行业数据资源开放共享的实施意见和交通运输政务信息资源共享管理办法。按照实施意见和管理办法的要求,行业内的政务信息资源共享是原则,不共享是例外。所以政务信息资源原则上都应该共享,不共享的要拿出明确的依据文件,这是一个非常大的变化。对于我们这些长期做数据的人来说,我们认为这两个文件很好的推动了行业数据的共享工作。

第二个是目前建立了行业的信息资源目录。目录整理得非常详细,目前目录的资源类别有500多类,信息项有6900多项。总的来说,覆盖了部里主要的信息系统。其中无条件共享的部分占40%左右,有条件共享的部分需要提出申请使用数据的明确用途才可以共享。从目前的情况来看,相关管理部门的思路和理念也发展得比较快,部门在提供数据时比较大的顾虑主要是担心数据共享后,产生错误的使用和解读,造成不良的影响。

应用实践

从2013年开始我们更多通过应用系统来提取统计数据,我们做了一件事情,采集了各省的高速公路联网收费数据并进行了数据分析应用,最初的目的是提高统计数据质量。我们采集的内容包括每一辆车,行驶高速公路的时候从哪里进从哪里出,可以具体到哪个收费站点进出以及进出时间,另外这辆车是客车还是货车,以及车牌号、车型、行驶里程等等。相关的数据分析比较关注货运车辆的行驶情况,包括拉了什么货、多重的货、拉到了哪里,因为全国货运车辆的行驶情况是能反映国民经济运行情况的。

这一数据覆盖了29个省份,这里面不包含西藏和海南,海南的高速公路是不收费的,是燃油税。西藏的高速公路没有联网。此项工作从2013年开始一直做到现在,目前涵盖了8500多个高速公路收费站,平均一个月会有8-9亿条数据。

从2013年做到现在,采集了这么多数据,与以往统计数据的管理有了天翻地覆的变化。又因为这段时间大数据技术发展非常快,对于我们做很多数据的测算和分析起到了很多好的促进作用,所以我们越来越多地采用了大数据技术。所以我们有时候更多去讲,不是因为有了大数据技术行业才做了这个工作,而是行业有需求,大数据提供了这样的一个技术手段和支撑。

这项数据采集是一个非实时的系统,因为最初是从校验统计数据质量的初衷建立的信息系统,所以数据更新频率是按月,部里在每一个联网收费中心或者省厅设置了相应的前置机,由各省按月把数据推送到前置机上,部级系统每月把数据取走。部级系统拿回来数据以后,首先会做常规的统计数据的处理,从中形成月报提供给部里做决策使用。另外,还会做一些数据的分析和挖掘以及关联分析。

工作之初,行业的高速公路联网收费数据是被认为数据质量很好的系统,但是做了相关工作以后才发现其实会面对很多最开始没想到的情况:由于系统是分级管理的,各省的高速公路以及收费系统是分别进行投资、建设的。而且各个省的高速公路管理体制也不一样,比如说有的省是由一个统一的高速集团管理省内所有的高速公路,这种管理是相对比较简单的,但是有的省有很多的业主单位,省里为了解决多个业主单位收费清分的问题,建了高速公路联网收费中心。由于各省情况不同,也就导致了采集到的数据字段、质量、问题都各有不同。

当前信息化技术的快速发展较好地推动了行业应用,但很多好的技术在行业的应用落地又非常困难,存在这样那样的现实问题。比如掌握了各省联网收费数据的实际情况之后,希望能通过技术手段提高车牌这个指标的数据质量,但由于车牌识别的硬件设备和软件都早就建设了,这些系统不是想升级就能升级的,涉及到大量的收费站、不同的车道分批分次的建设,而且还有资金投入等问题,需要一个漫长的推进过程。

新动力、新机遇和新趋势

我们做这些工作的感受,一个是有了新的动力,有一种媳妇熬成婆的感觉,做了很多年的数据之后,现在大家对数据的重视程度、关注度都比以前高了很多,在这样的环境下坚守这样的阵地,我们有了更多的推动力。

第二个是我们总体感觉行业大数据发展的大环境好了很多,部里信息化的建设开始以“大系统”为目标,也发布了国家综合交通运输信息平台总体技术方案,带来了新的机遇。

第三方面是政企合作共同推进交通大数据发展趋势日益明显,我们与企业之间的合作也越来越多了,能更好地为行业大数据分析应用工作服务。

清数•思享会是由清数大数据产业联盟与清华校友总会AI大数据专委会(筹)共同发起的小范围深度思想交流平台。大数据文摘作为战略合作媒体,将持续推出相关报道,敬请关注。

原文发布时间为:2017-12-13

时间: 2024-09-20 00:48:16

大咖丨交通运输部科学研究院:交通运输大数据的基础环境正日益成熟-清数•思享会的相关文章

交通运输部:对交通节能减排实施问责制

新华网北京5月7日专电交通运输部部长李盛霖强调,各级交通运输主管部门要将国务院和交通运输部明确的交通运输节能减排重点工作任务列入年度工作目标责任体系,加强督促检查,并实行严格的问责制. 李盛霖7日在此间接受新华社记者专访时表示,交通运输行业要把思想和行动统一到中央的决策部署上来,落实目标责任,采取有力措施,打好节能减排攻坚战,为兑现政府的庄严承诺作贡献. 李盛霖介绍,国务院明确了加强车辆用油定额考核.严格执行车辆燃料消耗量限值标准.对客车实载率低于70%的线路不投放新运力和推行公路甩挂运输4项交

交通运输部:预计下半年运输生产增速放缓

7月14日消息,交通运输部今天在其网站上发布了<2010年上半年交通运输经济运行情况>的公告.公告显示,公路.水路.民航.邮政.港口的生产数据基本呈两位数增长,同时预计下半年运输生产增速放缓. 上半年,全社会完成公路货运量和周转量分别为114.5亿吨和20101.9亿吨公里, 同比增长15.5%和17.9%,公路客运量和周转量为148.9亿人和7321.4亿人公里,同比增长7.6%和9.9%.全社会完成水路货运量和周转量为17.5亿吨和30830.4亿吨公里,同比增长16.7%和15.5%.水

大咖 | 车品觉:我们为什么要认识数据的本质

时下仿佛大家都在谈人工智能,就像当年人人都在谈大数据一样.在不同场合上,阿里巴巴的马云.百度的李彦宏及腾讯的马化腾分别谈过自己对人工智能的看法和观点.这种对话有点儿像金庸小说中的华山论剑.到底是气宗( 大数据)还是剑宗(人工智能)更有战略意义?我认为,两者是相辅相成的.经历了互联网20年的发展,我们已经积累了足够多的数据去驱动一场"智能盛宴",以大数据为核心的人工智能渐露端倪. 有一天晚上准备睡觉时,听到隔壁传来女儿跟苹果智能语音助手Siri对话的声音.我太太问我,这样正常吗?我告诉她

让基础设施研究变得更可见--- 清华大学数据科学研究院大数据基础设施研究中心成立

信息技术与经济社会的交汇融合引发了数据迅猛增长,数据已经成为国家基础性战略资源,大数据正日益对全球生产.流通.分配.消费活动以及经济运行机制.社会生活方式和国家治理能力产生重要影响.然而,相对于金融.医疗领域的火爆发展,大数据基础设施的建设往往会遭到忽视.为提高社会对大数据基础设施的认知.推动数据基础设施建设.促进数据开放共享,2017年8月17日,在清华大学FIT楼多功能厅举办了大数据基础设施认知RONG论坛暨大数据基础设施研究中心(以下简称"中心")成立仪式. 北京龙腾佳讯科技股份

跨学科融合、塑π型人才 数据科学研究院 第二届“RONG”奖学金答辩会成功举办

为服务国家大数据发展战略,打造多层次.多类型的大数据人才队伍,清华-青岛数据科学研究院(以下简称:数据院)"RONG"奖学金答辩会于2017年12月21日成功举办.数据院大数据能力提升项目教育指导委员会主任刘政,研究生院专硕办副主任李鹏辉,数据院执行副院长韩亦舜,数据院"RONG"教授兼社科学院社会学系副教授郑路,数据院教学管理部马洁老师和罗国荣老师作为评委,认真听取了来自于11个专业的15位同学的答辩汇报,并根据同学们的汇报表现逐一进行了点评和指导. "

大咖 | 从Ian Goodfellow到Yann LeCun,对话Quora AI大佬TOP 10

与AI大咖对话,是不是听起来就很激动呢? 在人工智能.数据科学领域,学术与行业的发展瞬息万变,成果频出,通过二手资料了解这一领域似乎已远远不够.如果有机会,当然还是要紧跟大咖们的步伐呀~ 那么,人工智能.数据科学领域的大咖到底在哪里?文摘菌悄悄告诉你,他们可都在国外知名问答论坛Quora上等着你呢!从GAN之父Ian Goodfellow,到CNN之父Yann LeCun,你都能在Quora上找到他们的身影. 今天,文摘菌就将为你盘点Quora上人工智能.数据科学领域的10位大咖,并为每位大咖精

揭秘QQ音乐业界首创「大咖装」的背后设计过程

  编者按:想看看腾讯的高级设计师都怎么干活?来看看今天这篇揭秘!@腾讯ISUX 在这篇文章中分享了整个设计背后的思考过程,小到一句运营文案,大到每个主题的设计思路,满满当当都是干货,帮设计师们突破美工思维,成为真正专业的设计师. 注:本文是设计分享,非软文. QQ音乐明星大咖装终于来了! QQ音乐5.0首次推出炫黑模式,是QQ音乐个性化迈出的第一步. 发布以来用户的肯定与喜爱让我们坚定不移地想要继续挖掘音乐个性化的可能性.音乐不止一种曲调,用户没有唯一个性,QQ音乐可拥有各样的色彩. QQ音乐

中国航海学会和交通运输部水运科学研究院获得中国航海日论坛主办权

8月21日,中国航海日活动组织工作委员会办公室致函中国航海学会和交通运输部水运科学研究院,授权其继续主办在宁波举行的2015年中国航海日论坛,并明确2015年以后的航海日主体活动由上述两个单位主办. 据悉,主办单位每年要确定一个具体主题,通过"中国航海日论坛"的形式,研究选择2至3个有典型意义的城市轮流举办.活动要坚持"主题突出.规模适当.内容丰富.节俭务实"的原则,结合国家涉海领域重点任务和举办地实际情况,通过论坛增强全民航海.海洋和海权意识,促进航海文化传播和海

关于未来交通,这些大咖在未来论坛上的讨论火花四溅

雷锋网(公众号:雷锋网)新智驾按:2017 年 10 月 28 日,"未来论坛"2017 年会在京举行,一场关于智慧城市.人类交通的大讨论率先碰撞出火花.参与讨论的既有王印海这样的学界专家,又有李开复.杜江凌.沈晖这些业界新老势力,主持这场讨论的则是余凯.各自的观点在交换过程中产生了非常有意思的对抗,值得大家品读与思考. 从左至右依次为: 地平线机器人创始人 余凯 通用汽车中国科学研究院院长 杜江凌 创新工场董事长兼 CEO 李开复 威马汽车创始人.董事长兼 CEO 沈晖 华盛顿大学(