2016年北京hadoop in china见闻

一、 概况

笔者有幸参加了今年在北京主办的hadoop in china,在与会中有不少的感受与大家分享。今年的hadoop in china整体来看,参加会议的人比较多,在第一天上午场的topic里,大厅人都满了,内容也比较多。今年主题内容从大局观、产品、技术都有很多的内容。貌似今年的议题是假设参加会议的同学有一定的基础,没有过多的去介绍基础的内容,比如,没有人说hadoop是啥了,单刀直入,趋势、产品、新技术。大数据改变人类的未来,正在渗透到每个行业中,甚至是人的基因分析。

二、 云化

今年开始,有一个明显的趋势是,很多公司都开始在云化自己的产品,创业公司基本是使用公共云,传统的公司基本是私有云加上混合云的方案。但总体来讲,大家都一致认为最终的形态还是公用云的,不管是业务还是大数据。

三、 实时大数据

在第二天的下午场次里,最热是实时大数据处理,技术比较多,到了17点的时候还座无虚席。大家关注最新的实时化的技术点,如jstorm、druid、streamSql、kudu都是目前比较火的,当然包括flink、spark(因有spark submit所以这个会就少了)等更好了。其实说实在的,根据笔者个人的观察,目前hadoop+spark+hbase已经满足90%+的需求,对与一些新的技术的探求目前还是仅仅在大公司,为了满足一些特别的业务场景。对于小公司也许这些技术也可以满足你的需求,但是是否有必要,还需要想想。

四、 大数据创业的黄金时期

大数据应该会慢慢深入到了各行各业,新型的创业公司,业务创新公司正在层出不穷的在涌现。几年前,想要听关于大数据的产品是都没有,只有技术的。如今,来讲的基本都会带产品来,基本都是宣传下产品,再讲下怎么做的,最后有的还不忘招聘。BAT来的人比较少了,一般的创业公司其实还没有到BAT的规模基本也不会出现BAT的问题。创业公司基本还是比较关注自己的业务模式的问题。大数据的重心会从技术本身转移到专业的产品、业务上来。毕竟,大数据技术Hadoop已经为业务、产品铺好了路。

五、 笔者比较关注的

笔者第二天的下午场次要主持《云计算与大数据》,这个场次主要是讲述怎么在云端搭建hadoop,包括了各家的产品,比如:星环的、微软的、VMWare的,当然我也宣传了下自家的产品阿里云的。另外就是华大基因、思迈特分别介绍了下各自的业务。云化,也会遇到很多问题,不过可惜的是,各家基本都在讲自家的产品多么的好,也没有太多讲有啥问题,怎么去解决问题,毕竟各家还存在一定的竞争。比较有意思的是第一次权威的听了关于基因的测讯的历史现状及未来。

《HDFS在云环境下架构演变》,笔者听了下,主要讲了怎么把HDFS做成没有状态的,把数据存放到阿里云的OSS或者AWS的S3上。当在带宽充足或者不是瓶颈的情况下,这样可以让计算动态伸缩,且原有的code又不需要动。

星环的同学讲的比较多,各个层面都讲了下,星环在原有的hadoop的基础上开发出基于自己的一套引擎着实不容易,在私有云场景下,跟阿里云、华为在激烈的竞争。

ebay到了上万的规模,跟他们聊了下,只能说当年的云梯1做的还是真不错的。也跟cloudera、Hortonworks、微软的同学聊了下,大家的想法还是比较类似的。

行业应用需要具体到具体的行业中,基本是用streaming加上机器学习,解决特定的问题,如百分点讲的PHM硬件损坏检测,预测;特定行业的分析,如华大的基因,金融行业大数据等。

六 、一些思考

我生活在互联网时代,在人工智能、智能驾驶、智能家居、虚拟现实、量子计算快要来临的时代,有人说这是第四次工业革命-智慧革命,还有人预言2050年人有机会获取永生,我们翘首以待,当然,我们也可以投入其中,迎接未来。
但是,也有另一个声音,核武器是人类第一次有把人类灭亡的能力,那么未来,人类也可能制造出人类的主人,类似《黑客帝国》中的人类似,一生都生活在虚拟世界中。人类一次次发展,到底是否更加幸福?很多人都认为现代人更加不幸福。这些深奥关于人类的命运,人生意义的话题也许就是如《2001太空漫游》中讲述,人类本身就是高等智慧生命的试验场,又或者根本没有意义,一切的意义也就是人类自己认为的罢了。

七、 接下来呢?

云是载体,计算才能发挥价值,计算的核心就是机器学习,只有具体的业务产品才会普惠所有人。
听起来就是废话,也是。具体怎么做,目前大家都类似,新的谁也不知道。好处就是不知道明天会咋样,坏处也是不知道明天会咋样。又是废话,额,好吧。

非常感谢组委员组织此次会议,具体的相关信息及PPT,请关注:http://chinahadoop.com/

版权声明

笔者微博:阿里封神 欢迎转载,但请保留原文地址

时间: 2024-10-26 12:45:42

2016年北京hadoop in china见闻的相关文章

2013年北京hadoop in china见闻

谈下这次参加中国hadoop技术峰会的收获,两天大约听了20场次,上午的是必听的,下午就听了一些关心.大数据峰会肯定是包括技术和技术之上的应用的.各个公司结合自己的业务特点来构建集群,特别听到了电信和银行类的公司在用hadoop或者尝试去用.应用的情况简单的出出报表,复杂点可能会涉及到一些机器学习和深度挖掘. 非技术的来看,本次大会传递的信息有: 银行.电信也在用hadoop hadoop生态圈依然是大数据相关技术的首选 国内很多大小公司正在使用hadoop 因为开源,所以繁荣 技术来看,本次大

2015年上海hadoop in china见闻

上午场次 jeff的<entierprise Hadoop:Past,Present, and Future>主要从功能.性能.安全等方面说明了hadoop是个啥,由于本人一直关注在这快,所以没有太大的新的知识点,这些点也可以在社区的文档上看到. 永洪的<敏捷BI最佳实践>我听起来就是用现有的hadoop技术来提供快速敏捷的BI分析,从老板才能看数据到每个人都可以看,使用数据.其实阿里目前已经做的很好的.只不过我想说的是,一家独立的公司来给别的公司提供此类的解决方案,其中更多应该是

2016年北京中国云计算技术大会见闻

概述 笔者有幸受邀请参加中国云计算技术大会,感谢主办方CSDN.此次大会有3天,第一天全部为topic,随后分为了若干个场次,有<Container技术峰会>.<大数据核心技术与应用实战峰会>.<云计算核心技术与架构>,第三天为<中国Spark技术峰会>.<OpenStack技术峰会>.<亚马逊AWS专场>,笔者基本一直在<大数据核心技术与应用实战峰会>与<中国Spark技术峰会>场次. 由于笔者关注在大数据方

【Hadoop Summit Tokyo 2016】使用Hadoop来构建实时和批数据的数据质量服务

本讲义出自Alex Lv与Amber Vaidya在Hadoop Summit Tokyo 2016上的演讲,主要分享了构建于Spark和Hadoop上的开源数据质量平台Griffin,Griffin可以用于处理批量数据.实时数据和非结构化的数据,并且构建了统一的过程来检测无效或者不准确等DQ问题,讲义中介绍了eBayGriffin的技术架构.以及用例等.

【Hadoop Summit Tokyo 2016】Apache Hadoop 3.0 :YARN和MapReduce有什么新特性?

本讲义出自Junping Du在Hadoop Summit Tokyo 2016上的演讲,主要分享了在Apache Hadoop 3.0中YARN和MapReduce已经拥有和正在演进的新特性,并且对于Apache Hadoop 3.0 版本的时间轴进行了分享.

【Hadoop Summit Tokyo 2016】追踪Hadoop与Storm资源与开销

本讲义出自Kendall  Thrapp在Hadoop Summit Tokyo 2016上的演讲,主要介绍了对于Hadoop与Storm资源与开销的追踪,以及为何要考虑资源优化和需要考虑哪些资源的优化.

【租房数据分析】2016年在北京如何租到好房子?

过年之后,很多人选择租房.我的不少朋友告诉我,"之前你公众号发布的北京买房攻略很有趣,可是不接地气,能不能分析一下帝都租房啊"!    我想也是,春节后我配置了爬虫工具,从北京各大中介网站抓取了8万余条租房数据.其实经过去重和过滤,剩下的不过两万余条.我估算,整个租房市场在春节后这个旺季,也就2万左右的存量. ◆ ◆ ◆ 第一因素:面积!单间or整租? 对于什么面积性价比高,只需要下面这一张图就一目了然:   当面积达到8平米时,均价达到最高,北京邮电大学附近的一间9平米的单间,都能租

阿里·云效平台成2016北京QCon大会亮点

4月21~23日,2016年北京QCon大会在北京国际会议中心举行,大会邀请了互联网领域的大咖分享国内外技术交流的最新趋势资讯,涉及自动化运维.移动开发挑战.移动测试技术.大数据平台架构等精彩专题.让人耳目一新的还属阿里巴巴旗下阿里·云效平台的亮相. 互联网高速发展,企业更需要互联网产品,技术研发能力以及产品迭代能力.传统研发模式.产品发布流程已成为企业快速升级的绊脚石,为解决系统复杂.开发协同难.开发测试比高等问题, 2012年3月阿里巴巴出品了业内领先的.面向企业的一站式研发效能平台.借鉴敏

聚焦行业最佳实践,BDTC 2016完整议程公布

2016年12月8-10日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所.中科天玑数据科技股份有限公司与CSDN共同协办的2016中国大数据技术大会(Big Data Technology Conference 2016,BDTC 2016)将在北京新云南皇冠假日酒店隆重举办. 中国大数据技术大会(BDTC)的前身是Hadoop中国云计算大会(Hadoop in China,HiC).从2008年仅60余人参加的技术沙龙发展到当下数千人参与,国内最具影响力