压轴论坛:大数据时代的商业变革
和讯科技消息 1月16日,2012中国互联网产业年会今日在京召开,本次大会的主题是“酝酿2013:在变革中掌握精彩”,和讯科技进行全程报道。
以下为“压轴论坛:大数据时代的商业变革”实录:
主持人:高新民理事长
嘉宾:谢文知名IT评论人、徐明强 微软亚太研发集团windows Azure首席架构师、齐向东360公司总裁、姜奇平中国社科院信息化研究中心秘书长
姜奇平:对于大数据现在大家是众说纷纭,想听听大家的看法,高新民老师是中国互联网协会副理事长,过去我们一直以来有云计算和物联网,新的浪潮又到来,怎么评估,美国奥巴马政府也提出了自己的战略,这里面的要点在什么地方,请高老师发表意见。
高新民:我是一个旁观者,这轮的互联网的新技术,主要是移动互联网,一个是云计算,还有一个是物联网,前几年炒的很热。大数据是和这些紧密的联系在一起的。现在移动互联网产生大量的数据的很重要的基础,云计算实际是存储大数据的很重要的技术。我认为将来可能是一体化,但是运用层面看,移动互联网现在是已经做的非常好了,每天我用手机上网,企业加速,你的手机快慢了,要加速了。垃圾太多了,按一下就清理了。
大数据在网络营销是现实的问题,在其他的领域里面,大数据还是蓄势待发,主要是数据量还不够大,或者量很大的数据还没有结构化的技术的支撑。广东有一个交通卡,全广东的16个省市在一个平台上做起来了,每一个城市都几百万张卡,坐地铁、公共汽车,积累了大量的数据,这些数据是非常的有价值的,这个数据智能交通里面叫欧迪数据,始发点在什么地方等,有多少人群,坐公交为什么要挤,线路和车次够不够,对于改善交通有极大的价值。
互联网这个产业里面,做精准营销,做交易平台,还有DSP广告投放,进入了大规模的发展。
姜奇平:到最后大数据到底是什么已经搞不清楚了,我想请教谢文老师,您在行业是非常资深,在您看到,大数据到底是什么?
谢文:大概是去年这个时候写了相关的文章,简单的讲,大数据的概念,有一批人是用现代数据来描述,我个人选择用将来时,凡是现在说到的,用到的,卖软件的,硬件的,和我说的大数据不沾边,大数据是一个比较模糊的未来的东西。在座的领导和姜老师都经历了,我们都是经历了中国互联网从无到有的阶段,信息化社会分三个阶段,第一个是计算机,第二是互联网时代,第三是大数据时代,当大数据时代成熟的时候人类进步就完成了信息化时代。世界的万世万物都在以极高的速度迅速的数据化,包括人,包括社会和物质世界,我们不断得用到云计算,物联网都是这个过程中的现象,当世界的万世万物都数据化的时候积累下来的庞大的不知如何下嘴的那样一个数据的堆积,规模之大,挑战之复杂,形成了未知的巨大的财富,或者叫资源,我们管这个资源、资产叫大数据。对资源、资产的理解,利用,挖掘,使得人类的生活方式由此产生巨大的变化叫做大数据时代。从概念上讲,我是以奥巴马的来讲,他是2012年讲的这个词,我们一般比他们慢3、5年,本来我希望2013年是作为大数据的元年,一看咱们又通过法,恐怕还要推两年,2015年才是开始认认真真的有一个比较好的环境。有人把它比喻成新时代的星球也好。
大数据不等于数据大。大家讲的大数据基本是数据挖掘,数据挖掘有20年的历史了。现在大概处于补课阶段。我们干了好多年了,一点新意都没有。
姜奇平:谢老师的见解非常的犀利,大数据不是大,这是一个普遍的观念。下面我们有请徐明强先生,您觉得云计算和大数据是什么关系?您是怎么看待技术发展和潮流的关系?
徐明强:我搜索了大数据和数据大的相关的信息,谢老师和我的观点惊人的一致,我讲一个寓言故事,一个球遇到一个蚂蚁,他说做三围的东西真好,我一眼就看到有多少的蚂蚁,蚂蚁说线上有多少蚂蚁我也得从头爬到尾才知道,三维和二维就是这样的差距。
大数据是在原来的基础上给你一个新的看见,是质的区别。
再讲一个真实的故事,2006年的时候,国际是公信贷上收益是80%,中国是20%多,中国发现差数据,差二维和三维的数据,如果你只有二维的数据对企业本身分析你很有可能觉得这个企业风险高不能贷给他,但是你看三维的信息,母公司有很多的控股,你就可以给它贷款,但是因为中国没有这样的数据,就没有办法做成。
在我们这些从事者或者推动者来说,有两个因素,一个是不可控因素,还有一个是可控因素,我们常常把可控因素说成完成这个事情的必要条件。
第一,云存储,我个人认为,在初期是非常的成功的,是拿微软的云存储举例,现在是供不应求的状态,每个星期都有一个崭新的数据云存储中心,原因是客户和企业发现云存储确实可以以最低的成本,和高可靠性,方便扩容的方式代替他们本地和企业内部做这样的存储。低成本到什么程度?在今后的几年,利润会到百分之几。因为这是竞争非常厉害的产业。
第二,云计算给大数据的应用提供了非常好的弹性的处理的能力。我们微软的Azure,夏天就要落地。我们的合作伙伴说现在要弄上千台机器,但是云计算给我们提供了非常便捷的方式。
姜奇平:齐总您怎么看大数据到来了以后带来的创新的机会?
齐向东:云计算的概念很多人还没有完全弄清楚, 我更喜欢大数据的词,比较形象,云计算感觉云里雾里的感觉,但是谢文老师一说,大数据我又有点晕了,谢文老师是理论家,说3、5年之后是大数据时代的到来,但是大数据时代的到来不是天上掉下来的,是我们产业的人士从不像大数据的事开始,先把大数据变大,把变大的数据处理,逐渐的让我们的社会真正的进入到谢文老师指引的时代。
360是具有创新精神的公司,06年我们开始做安全,很多人都知道360的成功是因为做免费的杀毒,普及到中国每一个人的电脑里面去,老百姓受益,颠覆了整个产业。但是很少有人关注商业模式成功的背后,还有我们技术上的颠覆的创新,安全,老百姓是有明确的使用诉求的话,如果不能解决安全问题,06年用了你的软件,07年就卸掉了,06年到今天,用户口碑越来越好,用户数不断的增长,360和其他的杀毒软件相比好用,06天我们做杀毒的时候是不懂的,杀毒行业的公司在这里面耕耘了20几年,积累了很多的专业的知识,360为什么能够战胜这些杀毒的厂商?主要是我们的技术比他们好,传统的杀毒没有把客户变大,很难应对互联网千变万化的木马,360就做了件事,在传统的杀毒引擎又加了一个大数据。我们不仅仅依靠客户端,对木马进行识别,我们更重要的是客户端,构筑了大数据的集合,每一个用户,我们叫云安全,每一个用户用我们的安全软件扫描自己软件和程序的时候,我们把电脑的每一个程序都打上一个做的程序的指纹。
把这个东西放在服务端,在你的电脑你都有很多的程序。这些程序的样本分布在全国各个电脑里面是什么情况?安装了多少?通过这样的一些数据的分析,我们就能够创造出一种更好的对未知木马的病毒的查杀的力度。
木马的传播路径和正常程序的传播路径是不一样的,木马是昨天还没有这个程序,今天就突然爆增,被挂马的网页把漏洞补上了,传到第三天高速增长的时候就不再增长了,过了五天之后它又搞了一个网页,传播途径,他的传播路径就是高速增长,停止,再高速增长,再停止。正常的软件,是有一个通知,然后下发一个光盘,比如全国3500个用户,一周之后增长,然后就不增长了,这是一个正常的传播路径,或者是商业的软件保持持续的增长,或者持续的下降。把这样的特殊的样本拿出来,再用机器的学习来处理。这是我们最初的时候对大数据的应用。
我们把用户电脑所有的程序数据化,然后打上指纹,通过这些东西来分析到底是好还是坏。这个技术是适合互联网的应用。我们用云安全的技术,彻底的颠覆了传统的杀毒引擎。
最近在手机上骚扰电话,垃圾短信,现在是越来越厉害,前几年,垃圾短信都是SP,运营商,造成的,这几年经过工信部的治理有明显的成效,现在的垃圾短信都是分布在全国各地的销售,卖房子、保险的。从各种途径拿到电话,都是点对点的攻击和轰炸,不是通过SP的端口号发出去的,一天发500个,从行为上你没有办法识别,这是骚扰还是正常的电话,我们在360里面加了一个云举报,你接到一个电话是卖保险的,我们就会出现一个提示,如果是骚扰电话我们会分类,标志的数据就会到云端,这样的数据积累多了,我们通过算法分析,达到什么程度可以确实是广告、推销的。这个定义完了之后,再有人接到电话,可能有7-8个人标注他是一个卖房子,你可以选择不接,这样的大数据的汇合,把垃圾短信进行有效的分析,我们拦截骚扰电话,已经几百亿条了,还是很能解决问题的。
姜奇平:我是你们的用户,确实是这样的。最后一个问题想问一下高新民老师,大数据在中国,我们看到美国是高度的重视,推动中国的大数据时代的商业变革,政府和协会、市场在里面都应该发挥什么样的作用?
高新民:大数据的概念,刚才几位专家都讲了,互联网和云计算到现在为止都没有突破,有各种各样的说法。要真正的推进它本来对我们所有的信息资源的一些充分的利用,而且能够提供创新的服务,同时带动产业。我建议我们的政府,因为云计算、互联网都有专项的资金,移动互联网和云计算都可以充分的利用政府的有利的政策和基金的渠道来发展大数据。
作为企业,最终还是要创新,包括精准营销等等。
作为我们协会讲,主要是为行业服务,一点我们既然是讲大数据,肯定涉及到很多个人的信息,这里面有很多的细节要做,上次我们开的座谈会,当时有很多的专家是坚决反对基于大数据的(应用),有很多的垃圾的软件。第二个是创新,我们互联网企业规范的竞争,既保护知识产权,又要保护创新者的权益。我们的行业里面,包括大数据的行业里面,也是需要研究。我们协会也愿意和大家一起研究来推动和找出一些大家能够接受的。
姜奇平:谢谢,由于时间的关系,我简单的点评一下,今天几位专家都是非常资深的,概括起来,我们现在解这个题起来很难,这个事情刚开始,以后我们会继续的剖析大数据的细节。作为第一个题目,比如说在这样的论坛上,由业界专家解析,破这个题的意义在这儿。今天破到什么结果呢?大数据的水挺深的,道可道,非常道。谢文说了,我们说不是什么很好解决,大数据不是数据大,但是数据是什么?我认为从今天的结论里面我隐约的感觉到大数据从历史来又走向未来。
在道层面是信息化的浪潮的自然的延伸,大数据的概念第一次出现是托夫勒33年前提出的,大数据除了表面的意思以外更是信息化的发展浪潮,包括云计算、物联网、互联网,到当前的自然结果,我们更多关注与怎么推,推进我们的产业的发展和应用的发展是实实在在的。同时我又看到谢文说的,我们不知道明天的事情,明天是一个重要的事件,也许我们不知道它,不知道的时候怎么把握它呢?就是把它创造出来,创新,也许在创新的过程中,我们铺的路把它走出来了,所以我认为在这个过程中,大数据才能不断的发展。但是我认为就是要把握这样的原则,在历史的基础上,包括我们今天谈了很多很深的话题,这背后的挖掘和发展与基础,我们这样好的题目,沿着大数据的方向通过创新,把它创造出来,我认为这是对大数据最好的定义方法,今天的论坛就到这里,让我们一起来谢谢这些嘉宾!