[独家]大数据版穹顶之下:清华人气男模解码雾霾分布

【导读】:柴静的一部穹顶之下将对雾霾的讨论推到风口浪尖,与此同时在太平洋的另一端,一群来自中国大陆的合伙人也在针对雾霾展开一场大数据战场的较量。

怎样的“个人恩怨”引发了针对雾霾的创业?又是怎样的机缘巧合让三位创始人一拍即合?清华男模、国旗仪仗队成员、单车骑行西藏、阿拉斯加极地穿越……大数据原点栏目本期为您专访佳格霾图的情怀团队,直击他们的创业点滴,用大数据解密雾霾。

未来的“雾霾预警图” — 佳格“霾图”

佳格“霾图”是王蕴刚及佳格公司设计的一款基于环境大数据,对大气污染进行实时监测预警的产品。“霾图”用地图的形式实时展现我国任一地区的大气污染数据,并预测未来五天的空气质量。佳格“霾图”的实时数据目前每小时更新一次,空间精度为五公里。佳格计划将来做到每二十分钟更新一次,空间精度达到一公里。

用大数据直面雾霾这块“硬骨头”不仅需要充分准确的数据源、优秀的数据处理和可视化能力,更重要的是一种可以时刻激励自己奋斗下去的情怀,而王蕴刚的创业就始于这样一种情怀。


佳格霾图截屏

跟雾霾有“私人恩怨”的不只是柴静

很多创业者的创业灵感都来自一个不经意的“灵光一闪”,而佳格(GAGO Inc.)创始人王蕴刚对于空气的“情怀”却是从初中就开始酝酿了。

王蕴刚的初中同桌因为一次煤气中毒意外去世,那是王蕴刚第一次了解到死亡的无情,也是他懵懂的跟“有毒气体”结下梁子的开始。“很想知道这种无色无味的气体是怎么夺走人的生命的。”这个‘私人恩怨’ 到了高中进一步深化,“北京的沙尘暴那几年特别严重,沙尘过境的时候天空瞬间会变成橘子皮的颜色,坐在教室的倒数第二排都看不清讲台上的老师。” 王蕴刚如今说起自己的家乡还会苦笑,“特别恨空气污染,把我的家乡(北京)变成这个样子”。因为这个“私人恩怨”,王蕴刚高中毕业后毅然报考清华大学环境工程专业,并选择了当时并不热门的大气污染方向。

本科从清华毕业后王蕴刚选择去美国深造。从Texas A&MUniversity;的研究生到Clarkson University的博士再到加州大学伯克利分校Lawrence Berkeley国家实验室的博士后,王蕴刚花了近十年的时间研究美国、加拿大以及墨西哥的大气问题。采访中他对于大气遥感知识和相关的国内外学派以及理论信手拈来、如数家珍,这为之后的创业打下了坚实的基础。

在美国做“中国合伙人”

与雾霾的斗争是一件艰苦的事业,一个人“单打独斗”总会有动摇的时候。“创业当中最难的是找到一个真正跟自己合得来的合伙人,这会是你动摇时候最坚强的后盾。” 王蕴刚在回忆自己的创业之路时把合伙人放在一个特别重要的地位上,他跟另外两个合伙人的创业之路也是一个发生在美国的“中国合伙人”故事。

博士后毕业的王蕴刚在一家全球环境咨询公司任空气污染与气候变化高级工程师。多年的海外留学跟科研经历并没有让他忘记跟大气污染的“私人恩怨”,创业的欲望一直在,他需要找到志同道合的人跟他一起迈出第一步。

王蕴刚的第一位合伙人是自己的高中同校师兄,也是在伯克利熟识很久的朋友张弓。张弓的本科就读于南京大学环境系,硕士就读于北京大学地理系,之后在美国犹他州立大学攻读遥感与卫星大数据的博士。两人相遇时张弓在湾区环境研究所工作,从业于同一领域并是校友的他们经常一起交流想法,渴望把复杂的科研成果转化成真正通俗易懂的产品供人使用。甚至还产生过把学术论文翻译成更通俗的语言发到微信上给更多人看的想法。

2013年1月,美国驻北京大使馆的PM2.5浓度监测数据爆表,纽约时报连续报道这件事。“我第一次看到对一个城市的空气质量的形容不仅仅是bad,还是crazy bad”, 王蕴刚一方面心里很痛,但一方面也觉得创业的时机到了。经过对政府政策,市场现状,盈利模式等多方面的深入考察,王蕴刚于2014年决定将公司定位成2B的经营模式,即向政府以及企业提供佳格“霾图”。 2B的经营模式对数据分析以及用户体验有了更高的要求。

第三位“合伙人”刘志成的加入解决了这个燃眉之急。刘志成是大数据可视化的专家,斯坦福的博士后毕业后在全球最大的数据可视化公司做核心产品的研究科学家。刘志成的入伙完善了佳格的创始团队。这个平均学历是博士后的环境大数据专家团队组成了佳格最核心最早期的“三人帮”。


佳格三位合伙人合照


佳格的运作模式

在中国环境方向做2B模式有两种可行的方向,一是跟国内行业的前辈公司合作,做软件产品出来,让感兴趣的环保机构来定制、购买以及使用自己的产品;二是直接跟政府环保部门合作。当佳格刚刚推出“霾图”的想法的时候,国家地方环保局对此已经表现出了浓厚的兴趣。

国内地方政府对佳格霾图的青睐与当时环保局一个新的政策有关:在未来五年内在全国范围内推行大气污染预警系统。国内的大气污染的数据来源主要是通过地面监测站点,而目前中国的地面监测站点还非常不完善,尤其在西部地区非常少,短时间内要进行大气污染预警在这些地方难度很大。佳格“霾图”可以作为地面站点采集到的数据的很好的补充,节省政府基建费用。这也是国内目前非常流行的 PPP(private public partnership)模式。

从不同的国际卫星拿到数据源

做环境大数据,首先要拿到准确的数据源。佳格霾图的数据源主要来自几个不同国家的极轨卫星,静止卫星和激光卫星。据王蕴刚叙述,这些卫星数据是公开的,它一直在往地球发射信号,理论上只要有接收器就可以搜集卫星数据,并且全球无死点,各地数据都是可以拿到的。

极轨卫星每天两次飞越地球表面上的同一个点,而且总是在同一个钟点(极轨卫星所在的瞬时轨道平面与太阳始终保持固定的取向,可以使得卫星所经过地点的地方时基本相同,卫星遥感探测资料具有长期可比性。由于这种卫星轨道的倾角接近90°,卫星近乎通过极地,所以称它为“近极地太阳同步轨道卫星”,简称极轨卫星。)。它的优点是空间分辨率高;不同于极轨卫星,静止卫星则定点在某个地方,每二十分钟提供一个采样点,优点是时间精度很高;激光卫星,则能给大气污染物垂直方向分布有一个测量,人的呼吸空气是地表空气,而前两种卫星测量大气高度相对较高,所以这个卫星可以纠正之前的数据。

三种卫星的数据融合后,再加上地面数据进行矫正。地面数据首先包括从交通部门拿到的车流量数据。王蕴刚举了个例子,“比如某个地方车流量很大,该地区空气质量就会比较差”。除此之外,地面数据还包括了地形数据,气象数据等。

佳格霾图的数据存储、整合及算法

佳格在初期从Amazon WebService (AWS)租了入门级的服务器来存储数据。随着产品的不断开发,此存储器已远不能满足数据的需求量。现在佳格使用的是AWS的升级扩容版的服务器,但是存储量依然不能满足实时的需求 - 只留存三十天的数据,并且只储存处理过的数据而不是原始数据。从卫星和地面收集的原数据量极大,实时的话每小时就可以达到数十GB左右的数据。未来佳格将会把服务器搬回国内,使用国内的数据服务器来存储佳格所需的环境大数据。

对采集到的大量数据,需要进行整合处理才能用来生成佳格霾图。佳格霾图的数据算法主要包含两个任务:

(1)数据同化和实时展示任务。佳格可以拿到的卫星数据主要分两种,一种是时间分辨率高的数据,一种是空间分辨率高的数据,佳格需要把这两种数据进行融合;同时卫星并不会直接给出PM2.5的测量数据,而是一类的光学指标,其中包括大气气溶胶光学厚度(aerosol optical depth)。佳格利用基于不同城市的自主研发的算法将这个变量计算出准确的PM2.5浓度值,并在“霾图”上实时展示。

(2)预测任务。现今国内空气质量预测主要有两种传统方法:第一种是根据大气物理化学(污染物的沉降,运输和扩散以及二次气溶胶反应)的经典算法跟污染物排放清单的集合对未来大气情况进行推测;第二种则是基于数理统计模型方法,比如拿到过去十年的数据,通过对时间序列的季节性,趋势性进行分析来做预测,最终辅以人工判断。这两种方法主要使用的都是地面监测点提供的数据,并没有用到卫星数据。同时国内排放清单数据存在时效性弱的弊端,并且地面监测点分布不均且数据容易受到人为因素的影响。这样所得到的预测结果存在着极大的偏差和局限,准确度较低。

相比这两种传统方法,佳格所开发的预测方法和模型具有自己的特点:首先,佳格做预测的数据是更精确均匀的卫星数据。其次,佳格运用模型最优化方法,综合考虑多种国际上最先进的气候预测模型,通过算法选出动态的最合适的预测模型,用于预测未来五天内的空气质量情况。

佳格的未来 - 用大数据“雪中送碳”

“通过卫星大数据其实可以解决很多环境问题”,王蕴刚希望未来的佳格能够用大数据解决更多人们关心的问题。除了“霾图”,王蕴刚认为农业也是一个很有发展潜力的方向,卫星数据可以反应出地表植被,花期,作物何时成熟,土壤肥度,何时降水,地下水分布等农民关心的问题。“希望我们能够通过大数据产品解决农民耕种的实际问题,像何时耕种,种什么更高效,提高农作物产量等等,相比‘锦上添花’的产品,我们更希望自己能够‘雪中送炭’。”

小编的话:王总充满磁性的声音、幽默的语言、清晰的逻辑让两个小时的访谈轻松愉快。王总采访间隙中还和小编们爆料曾经“清华人气男模”以及“国旗仪仗队队员”的难忘经历,并和小编们分享了即将做爸爸的喜悦。这让小编们深切体会了一把这位曾经的“人气男模”、现今的佳格公司创始人、未来的“好爸爸”的个人魅力。

另外王总一直强调跟几个价值观合拍的合伙人一起做一件有意义的工作是特别幸福的事情。这一点小编们也深有体会,大数据文摘聚合了一批对大数据感兴趣、来自世界各地的志同道合的小伙伴,跟原点栏目一起工作的每天都充满乐趣,也欢迎对大数据及创业感兴趣的各位读者加入我们。回复“志愿者”可了解更多信息。

采访结束之时,王总还特意让小编带给大数据文摘原点栏目的读者一些自己的创业及工作上的启发。小编在此原文附送。

王蕴刚任清华国旗仪仗队成员照


王蕴刚给读者的话:

给创业者:

首先,创业当中最难的是找到一个真正契合的合伙人,现在回头看创业这条路很难,特别是当还没有完全退出自己之前工作的公司的时候,很多诱惑,有时候会想不如继续呆在原地,这个时候合伙人就是自己坚强的后盾;其次,创业公司早期人数不要多,2、3个人互相支持,是比较合理的方案;最后,我觉得创业不分老幼,如果觉得自己目前已经准备好了了,觉得能够很好的时间管理,就可以了,逼自己一下,人的潜力是很大的。

给大数据行业专家、工作者及爱好者:

大数据是一个比较新的行业,但是这个行业往前发展的前景非常光明,就像第四次产业革命,堪比瓦特发明蒸汽机,会颠覆很多传统行业,如果你们能坚持在这个行业,以后会有非常好的发展,如果想创业,目前也是一个非常好的创业时机,可以出来试试看。佳格目前在擂鼓征召海内外各类大数据行业技术人才,有感兴趣的朋友请直接与佳格取得联系。

给投资人:

佳格公司目前处于天使轮融资阶段,我们欢迎价值观以及专业背景与我们锲和的投资人入伙一起做些能写进未来史书的事情。

原文发布时间为:2015-05-15

时间: 2024-09-23 08:33:55

[独家]大数据版穹顶之下:清华人气男模解码雾霾分布的相关文章

【玩转数据系列九】机器学习为您解密雾霾形成原因

一.背景 如果要人们评选当今最受关注话题的top10榜单,雾霾一定能够入选.如今走在北京街头,随处可见带着厚厚口罩的人在埋头前行,雾霾天气不光影响了人们的出行和娱乐,对于人们的健康也有很大危害.本文通过爬取并分析北京一年来的真实天气数据,挖掘出二氧化氮是跟雾霾天气(这里指的是PM2.5)相关性最强的污染物,从而为您揭秘形成雾霾的罪魁祸首. 这里我们是用阿里云机器学习平台来完成实验:https://data.aliyun.com/product/learn 登陆阿里云机器学习平台,即可在demo页

治霾先治堵 浙江交通大数据应用的启示

本文讲的是治霾先治堵 浙江交通大数据应用的启示,最近几天,雾霾压城,心情不悦,当然路上不断BB的司机心情也不好.不过,偶然间看到几条新闻还是让笔者的心情回暖了不少:第一个是应对雾霾,北京从12月8日7时至10日12时启动最高预警等级,提醒大家注意防护,暖人心扉;第二个是环保部抓到雾霾的"真凶",称9个城市已完成PM2.5来源解析,其中北京.杭州.广州.深圳的首要污染来源是机动车;第三个是浙江交通运输厅用大数据提前1小时预测道路堵车,对于经常开车的朋友来讲,绝对很赞.看似第三条和前两条雾

大数据解读:穹顶之下,谁在关注雾霾

1.雾霾关注度 我们先一起来看几张图表. 以2月27日的数据为基准可以看出,自2月28日起,雾霾的关注度持续升高,对柴静本人和<穹顶之下>的关注度更是节节攀升,3月2日达到高峰.数据告诉我们,<穹顶之下>唤起了大家对雾霾.PM2.5的关注,同时也说明网络的影响力及传播速度巨大,而柴静本人的号召力也是非比寻常. 2.关注雾霾人群的性别分析 近年来雾霾天数明显增加,一项调查显示,雾霾对男性的危害更大.从图中可以看出男性较女性高出12个百分点,男性网民更关注雾霾. 3.哪些城市的人更关注

自拍有风险!大数据在用什么姿势“出卖”你?

 史上最昂贵的自拍照,诞生于2007年.两名美国大兵在伊拉克的军营中玩自拍并且传到了社交网络上.结果几天之后,这个秘密的驻扎地就遭到了恐怖分子火箭弹的袭击.四架"阿帕奇"直升机惨遭"爆菊",两亿美金灰飞烟灭.美军情报部门"百思不得姐",最后才发现:原来是大兵的自拍照中附带了经纬度信息,让"好友"轻易掌握了他们的位置. 而就在几个月前,某ISIS成员在其"总部大楼"自拍,并且在社交网络上大肆吹嘘这里的指挥能力

中关村发布:大数据企业分布图等3张图

2015年12月12日,中关村大数据日在中关村国家自主创新示范区会议中心举办.此次大会主题为"共享共融 数创未来". 在大数据文摘后台,回复"中关村大数据日",下载高清大图.发布PPT:点击文末"阅读原文",加入大数据企业名录 指导单位: 中关村科技园区管理委员会.北京市经济和信息化委会.北京市海淀区人民政府 主办单位: 中关村大数据产业联盟 联合主办: 美林数据技术股份有限公司.北京久其软件股份有限公司 协办单位: 北京大数据研究院.清华大数据

高考志愿季|如何从选专业开始 科学规划走上大数据之路

◆ ◆ ◆ 导语   随着全国各省高考分数线的公布,考生和家长也投入到了报考志愿的战争中.高薪.市场需求居高不下的数据科学家正在成为众多年轻人的理想职业.那么想要进入大数据领域并成为佼佼者,如何从高考选专业开始科学规划?   大数据文摘联合数据派(datapi)策划了本期专题,针对"数据科学家"的专业成长路径,采访了清华大学徐葳教授.阿里数据专家刘智勇.哥伦比亚大学数据科学在读硕士王昱森,希望他们从各自不同的角度,给想要走上大数据这条路的年轻人选择专业提供一些参考. ◆ ◆ ◆ 数据分

巅峰对话:畅想大数据时代的车联网与智能汽车

ZD至顶网CIO与应用频道 01月20日 北京消息:2016年1月20日,数据猿作为独家全程直播与专访媒体,受邀参加"全球大数据峰会 Global Big Data Conference 简称为 GBDC"本届大会由世界O2O组织.全球大数据联盟GBDC.全球移动游戏联盟GMGC.光合资本主办,中国互联网协会O2O工作组.中国汽车流通协会支持. GBDC全球大数据峰会在北京国家会议中心举办,本届大会规模逾3000人.大会从大数据改变政务管理方式.引领全球企业营销.智能交通综合服务.互联

湖北省大数据发展行动计划(2016-2020年)

各市.州.县人民政府,省政府各部门: 现将<湖北省大数据发展行动计划(2016-2020年)>印发给你们,请结合实际,认真组织实施. 2016年9月14日 湖北省大数据发展行动计划(2016-2020年) 大数据是继云计算.物联网和移动互联网之后新一代信息技术革命的制高点,是当今社会重要的基础性战略资源,不仅代表着当前信息技术的新热点.产业发展的新方向,更是加快推动经济社会转型升级的新引擎.为贯彻落实<国务院关于印发促进大数据发展行动纲要的通知>(国发[2015]50号)精神,推动

大数据视角的内容产业供给侧结构性改革思考

作者根据"出版业供给侧结构性改革解决之道·优化供给优控库存2016年度峰会"的主题,将国家新闻出版广电总局在新闻出版大数据体系建设方面的思路与大家进行交流;同时,与党中央.国务院当前提出的供给侧结构性改革任务作一个交互对照,梳理新闻出版业大数据体系建设与新闻出版业供给侧结构性改革的关系,从大数据的视角思考新闻出版业供给侧结构性改革的具体方向与任务. 大数据体系建设 与出版业供给侧结构性改革 对供给侧结构性改革的认识:最终目标是提高供给与需求的匹配度. 2015年11月10日,在中央财经