清华韩亦舜:大数据革命与新经济分析

◆ ◆ ◆

导读:本讲座为清华大学数据科学研究院执行副院长韩亦舜于2016年7月14日在首届中国大数据应用大会上所做的题为《大数据革命与新经济分析》的演讲。

◆ ◆ ◆

我们研究经济的时候,一定会放眼世界看更大的版图,因为今天的中国已经是世界第二大经济体了。看这张图的时候大家想一想,如果没有互联网,我们不可能及时地看到这个世界。80年代,电话开始进入了普通中国家庭。但是数量还是很少,通讯基本还是靠书信。现在信息发展非常快,这就要求我们思考:当我们放眼世界的时候,以什么样的思想和工具观察这个世界?

这些大数据的发展历程大家已经耳熟能详了。大数据分析未来的发展趋势是:数据将应用于社会化的分析,工具会越来越灵活;越来越多的人借助可视化方法来表现数据魅力,可视化做好以后数据会有美感方面的创新。数据的搜集将不但来自特定机构的数据,也来自老百姓的无私奉献。我们知道,每个人在网上随便一个动作都能留下很多痕迹,特别是当有些机制会让民众以很自然的方式参与公共数据的采集,这会减少政府维护基础设施的成本,也让市民有很好的参与感。大数据叠加上互联网、云计算,会带来新机遇。

今天我希望讲一讲大数据和经济分析的关系,过去我们有宏观经济、微观经济,今后经济研究领域会越来越注重用数据说话,数据会给我们呈现什么东西呢?

关于大数据只重视相关性不重视因果性,这个说法有片面性。数据表明海盗数量减少和全球气候变暖高度相关,可这有什么用?我们不能把全球气温抬高来遏制海盗数量。人类现在的思维水平更多地可能还是愿意找一些因果关系才能重复使用,包括结构化和非结构化,目前很多科学家做的努力都是把非结构化的数据结构化或半结构化,就是因为目前我们的认知水平多数还是用结构化的方式处理更有效和更习惯。

我们尝试用大数据处理手段做行业分析,开发出一些行业指数。这些数据一定不是交易数据的全部,但是经过持续采集、连续分析,当它作为一个行业指数来说还是有比较好的参考价值的。这里面我们着重做了一些行业相关的指数。今天我说的数据主要来自银联刷卡数据,它有一定的代表性。当然第一,大家知道外国的卡不归它管;第二,现金交易不归它管,第三方支付也拿不到数据,所以采集到的数据仍然不是全面数据。但即便不是全面数据也可以呈现出一些比较有趣的现象。


这是房地产数据,虽然和传统统计方式不太一样,它确实呈现出与国家统计局公布的数据拟合度很高的情形。而且,我们的实时性很强,这些数据对于一些想提前知道经济状况,想提前对经济进行预测的金融机构还是有很大价值的。

这是一个高端酒店的行业数据,这是以2011年的数据做基准,黄色的曲线可以看出它的起伏。灰色的竖道是环比增长情况。

这里面有三个数,一个是餐饮指数增长增速,一个是酒店增速,和各省GDP的增速。里面可以看到全部是深红色的地方是西藏这个地方,酒店指数这块——青海、新疆发展很快,包括贵州、广西也都发展得比较快。在整个沿海地区呈现出相对发展较慢的情况,但是那边的经济并不是想象的那么差,只不过它的餐饮业酒店业饱和度比较高,所以就没有呈现出那么好的增长趋势。

这张图说明了什么?刚才介绍了几本书,其中讲到了区域相关性,我们有几个大的经济区域,它们之间存在着什么样的经济关系,我们也用手上的数据进行分析,呈现出类似一些情况。

前不久我们做了一个大数据交流会,和韩国的学者一起交流。我们利用跨境交易数据做了统计,2013年—2015年跨境交易金额数据香港第一,澳门第二,韩国从2014年的第三掉到2015年的第五,2015年日本从后面又赶上来了,这是不是背后有可以解释或者暂时不能解释的原因?另外是交易笔数,香港第一,到2015年韩国第二,日本第三,这说明什么呢?说明在韩国买的都是小件东西,所以交易笔数多但是金额不多,在日本买的都是大件东西,交易笔数相对少一点,但是交易总额多一些。这就是我想说的,有的时候当你利用手上一部分数据,分析它会发现一些比较奇特的现象。

这个是日韩跨境消费数据,主要集中在珠宝百货与美容行业,韩国珠宝类的交易几乎不太多,特别突出的是韩国行业的美容,这个和大家的认知差不多,很多人去韩国购买深度或者浅层的美容服务,但是在那儿买珠宝的很少。我们展示这个数据并和韩国学者交流,他们承认他们的珠宝类产业不够发达,据说和他们国家的珠宝加工水平不高有关,这些数据是不是反过来指出规划产业的时候在这些略有不足的地方存在发展空间,这对他们也有指导意义。

这是中日韩消费经济呈现区域引力效应图,竖向是在几地的消费,横向是三个月后又在这些地方消费。红色的框是三个月出现在香港消费,三个月又出现在香港消费的比较多,泰国只有百分之七点多,法国百分之八点几,瑞士只有百分之四,美国有百分之二十多,其中是什么原因不敢轻易下结论。这里面有几个蓝框,讲区域引力效应,香港和澳门框的比例相对高一些,日本和韩国的框整体又是在百分之十几以上,另外就是法国和瑞士,前面讲的几本书,其中有一本讲到了区域经济引力,相邻地区或者风格相近的地方因为对彼此的风格很认同,所以愿意再去。如果我们对这种问题一探究竟会很有趣,比如为什么去过香港以后去澳门就多一些,这些都可以做一些深入探讨。

原文发布时间为:2016-08-07

时间: 2024-09-20 00:26:31

清华韩亦舜:大数据革命与新经济分析的相关文章

清华数据院院长韩亦舜:大数据时代的数据伦理问题探究

导读:5月26日,2015年贵阳国际大数据产业博览会暨全球大数据时代贵阳峰会在贵阳召开,数据开放与隐私保护作为一个专门的分论坛,在同天下午举办.清华大学数据科学研究院执行副院长在会上做了大数据伦理与道德的分享.大数据文摘今日带您走进数据开放与隐私保护论坛,聆听韩亦舜院长对数据引发伦理道德问题的看法. 韩亦舜 清华大学数据科学研究院执行副院长,关注数据开放,数据伦理以及数据隐私研究 以下是演讲实录 刚才几位嘉宾就数据的安全问题,隐私问题分享了观点,我今天从不同的角度说一些有待探讨的观点. 我不知道

韩亦舜:谁能熟练运用大数据思维,就有机会成为下一个马云

在大数据时代,没有人能游离于大数据之外.为更好的融入这个时代,我们能做的就是学会并熟练的掌握和运用一种全新的思维方式--大数据思维.大数据可以是名词.是动词.是形容词--正如许多流行语一样,"大数据"是一个含糊不明确的词语,经常被人们信手拈来又随手抛去.从2012年至今,经过铺垫.酝酿.炒作.质疑,"大数据"渐渐走下神坛,轮廓更加清晰.界限更加明确. 近日,中国大数据产业观察网记者在清华园内专访了清华大学数据科学研究院执行副院长韩亦舜,探究大数据的"真实身

韩亦舜:客户数据隐私问题初探(附PPT)

 韩亦舜:大家上午好.老实讲,看了一下演讲嘉宾的构成和他们要讲的题目,把我放在第一个讲还真有点儿压力,因为隐私这个问题在中国有些模糊,我第一个讲可能让大家的思想受到束缚.当然,可能也说明咱们联盟对数据隐私问题比较重视.我就借此机会分享一下我们的思考. 隐私是一个让大家比较纠结的话题,大数据时代的客户是什么样?隐私又有什么样的内涵?在座的做客户管理的人很多,我们就先从客户与商家的关系说起.中国有很多的话都把客户关系描述的很感人,有人说:客户是上帝;有人说:客户是衣食父母.其实本质上,客户和商家就是

韩亦舜:大数据、大挑战、大责任

我们先来看看大数据与大挑战. 在座的有谁11.11的时候参加过"剁手党",买过东西?双十一让我们爱恨交加.我们来看这两张图,一张是春运,一张是十一黄金周. 黄金周和春运带来的问题大家都有了解. 再来看看这张图. 为什么这个时候拿出这样一张图来看?一个是时尚的网上采购,一个是那么拥堵的线下行为,有联系吗?有!我们应该想一想,这两个线上线下看似无关的事件,背后是资源的不均衡利用和商户的不当得利.春运的时候大家都希望用最短的时间回到家,但是最后导致社会资源的不均衡.十一黄金周集中出行有这个问

大数据革命,才刚刚开始

大数据时代的到来,让"数据即资产"成为新的全球大趋势,国家竞争焦点正从对资本.土地.人口.资源/能源的争夺转向对大数据的争夺,大数据颠覆性地改变全球战略格局.国际安全态势.国家治理架构和资源配置模式,引发了巨大的经济社会变革.对于中国而言,只有将大数据上升为国家重大发展战略.上升为提升国家治理体系与治理能力现代化的层面才会实现"变道超车". 大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理.换言之,如果把大数据比作一种产业,那么

Hadoop掀起大数据革命 三巨头齐发力

本文讲的是Hadoop掀起大数据革命 三巨头齐发力,开源的数据处理平台凭借其低成本.高扩展性和灵活性的优势已经赢得了多数网络巨头的认可.现在Hadoop将进入更多企业.IBM将在明年推出内置NoSQL技术的DB2旗舰级数据库管理系统.上个月Oracle和Microsoft也分别透露了将计划在明年发布基于Hadoop的产品.两家公司都计划提供协助部署服务和企业级支持.Oracle已经承诺将会在大数据设备中预装Hadoop软件. 大数据革命正以Apache Hadoop为中心如火如荼的进行着.自从开

哈佛耶鲁不如敢闯敢干,清华北大不如胆子大

"哈佛耶鲁不如敢闯敢干","清华北大不如胆子大",从哈佛大学的演讲台到中欧国际工商学院的演讲台,王健林一再重复这样的句子. 最新的2014年华人富豪榜显示,他仍是大陆首富."王健林成功学"里,"创新,胆子大,敢闯敢试"排名第一,这是他的人生信条和价值观中最重要的一部分. "清华北大不如胆子大" 26年前,34岁的大连市西岗区人民政府办公室主任王健林接手了万达集团的前身--大连市西岗区住宅开发公司,这份闯劲为

麦肯锡:医疗行业的大数据革命

美国的医疗开支如果保持目前的增长速度,20年后将占到美国GDP的17.6%,这意味着将比正常基准高出6000亿美元.这多出来的让奥巴马政府绝望的6000亿美元,有一种"特效减肥药",那就是医疗大数据.华尔街日报上周在一篇报道中指出,大数据应用将为美国节省数千亿美元的医疗开支,但前提是医疗行业必须进行一些根本性的变革. 华尔街日报引用的数据来自麦肯锡公司的一份报告<医疗行业的大数据革命>,麦肯锡在报告中指出: 大数据将节省12-17%的医疗成本,以目前的2.6万亿美元医疗开支

2017-2021年中国大数据产业预测分析及全球市场规模预测

一.有利因素 (一)政策利好 2015年7月,国务院出台了<关于积极推进"互联网+"行动的指导意见>,计划推动移动互联网.云计算.大数据.物联网等与现代制造业结合,促进电子商务.工业互联网和互联网金融健康发展.<指导意见>中涉及的11项重点行动几乎全部提到对于大数据的应用,从根本上肯定了大数据在推动互联网与实体经济融合中的重要作用. 2015年8月,国务院印发了<促进大数据发展行动纲要>.<纲要>提出未来5-10年我国大数据发展和应用应实