2013年北京hadoop in china见闻

谈下这次参加中国hadoop技术峰会的收获,两天大约听了20场次,上午的是必听的,下午就听了一些关心。大数据峰会肯定是包括技术和技术之上的应用的。各个公司结合自己的业务特点来构建集群,特别听到了电信和银行类的公司在用hadoop或者尝试去用。应用的情况简单的出出报表,复杂点可能会涉及到一些机器学习和深度挖掘。

非技术的来看,本次大会传递的信息有:

  • 银行、电信也在用hadoop
  • hadoop生态圈依然是大数据相关技术的首选
  • 国内很多大小公司正在使用hadoop
  • 因为开源,所以繁荣

技术来看,本次大会传递的信息有:

  • YARN将是下一代hadoop平台,多种计算模型即将随YARN一起整合资源。
  • 硬件结合hadoop来提升性能。
  • 可以尝试在虚拟机上做YARN,如EMR。
  • 准实时的时代即将到来,也可以说spark等基于内存的分布式时代即将到来。
    数据的收集、交换、存储、计算 (分析)、管理及监控等共同构成了大数据的技术生态圈。基本每个公司都会涉及到其中的方方面面,小的公司可能比较简单直接用社区的版本去做,大点的就直接成立相关的团队专门研发相关的工具及维护相当大的集群。

目前,其中计算之上的分析能带来实际的价值,技术一般包括:实时计算、图计算、流式计算、机器学习相关、数据挖掘相关。这些实际应用于广告、个性化推荐、搜索、社交图谱及基于特定行业的多维分析等等。

说说BAT吧,百度没有人来讲,比较可惜。腾讯走corona+CDH,随后也将考虑YARN的方案。阿里分享了跨机房方案,这可不是2T直接换4T所能解决的,计算层面阿里也将走YARN的方案。目前阿里和腾讯都有团队在走社区的方案。
不能说小公司就没有大数据,适合自己的业务系统的才是最合适的。如用YARN,小公司可以直接用,对于阿里就有很大的历史包袱。

如果想学习大数据特别是hadoop,把分布式的理论弄清楚,实际部署这些分布式的软件,多看看源码,多关注业界的动态。

最后比较感谢 Hadoop中国技术峰会 提供这样的学习交流机会。不过 纠结的是 还有一场是CSDN办理的。
其他具体的可以参考:http://www.it168.com/redian/Hadoop2013/

时间: 2024-12-17 20:01:42

2013年北京hadoop in china见闻的相关文章

2016年北京hadoop in china见闻

一. 概况 笔者有幸参加了今年在北京主办的hadoop in china,在与会中有不少的感受与大家分享.今年的hadoop in china整体来看,参加会议的人比较多,在第一天上午场的topic里,大厅人都满了,内容也比较多.今年主题内容从大局观.产品.技术都有很多的内容.貌似今年的议题是假设参加会议的同学有一定的基础,没有过多的去介绍基础的内容,比如,没有人说hadoop是啥了,单刀直入,趋势.产品.新技术.大数据改变人类的未来,正在渗透到每个行业中,甚至是人的基因分析. 二. 云化 今年

2015年上海hadoop in china见闻

上午场次 jeff的<entierprise Hadoop:Past,Present, and Future>主要从功能.性能.安全等方面说明了hadoop是个啥,由于本人一直关注在这快,所以没有太大的新的知识点,这些点也可以在社区的文档上看到. 永洪的<敏捷BI最佳实践>我听起来就是用现有的hadoop技术来提供快速敏捷的BI分析,从老板才能看数据到每个人都可以看,使用数据.其实阿里目前已经做的很好的.只不过我想说的是,一家独立的公司来给别的公司提供此类的解决方案,其中更多应该是

2013年北京小升初和幼升小人数均同比增加

多知网4月28日消息,北京小升初政策发布会上宣布,2013年北京小学入学人数17.46万人,比去年增加2.64万人:初中入学人数11.36万人,比去年增加5700人.数据显示,今年延续了几年来的增长趋势--连续几年,北京小升初和幼升小人数都在不断增加.为了应对未来三到五年适龄儿童的入学高峰,学位紧张问题,今年将进行诠释联网采集学龄人口信息.针对人户分离情况的入学人口采集工作,市教委相关负责人表示,面对这种情况,入学人口只能在户籍所在地或者居住地任选其一处登记.采集工作必须保证唯一性,否则将影响入

优酷数据架构师:搭建Hadoop平台三步走

文章讲的是优酷数据架构师:搭建Hadoop平台三步走,2013年11月22-23日,作为国内唯一专注于Hadoop技术与应用分享的大规模行业盛会,2013 Hadoop中国技术峰会(China Hadoop Summit 2013)将于北京福朋喜来登集团酒店隆重举行.届时,来自国内外各行业领域的近千名CIO.CTO.架构师.IT经理.咨询顾问.工程师.Hadoop技术爱好者,以及从事Hadoop研究与推广的IT厂商和技术专家将共襄盛举. ▲点击进入Haoop中国技术峰会 Haoop中国技术峰会由

第七届中国大数据技术大会将于12月在北京召开

从科学研究到技术分析再到产业变革,一个大规模生产.采集.存储.计算.分析,并提供新商业价值的大数据时代已然开启!由中国计算机协会(CCF)主办,CCF大数据专家委员会协办,中科院计算所与CSDN共同承办的国内最具影响.规模最大的大数据领域盛会--第七届中国大数据技术大会(Big Data Technology Conference 2013,BDTC 2013)将于2013年12月5-6日在北京世纪金源大酒店 举行. 从2008年至今,六年的时光,伴随技术大会的发展,我们亲历和见证了中国大数据技

Cloudera Impala:基于Hadoop的实时查询开源项目

正在纽约进行的大数据技术会议Strata Conference + Hadoop World传来消息,Cloudera发布了实时查询开源项目Impala 1.0 beta版,称比原来基于MapReduce的Hive SQL查询速度提升3-90倍(详情可以参考此文中的"How much faster are Impala queries than Hive ones, really?"部分),而且更加灵活易用.Impala是高角羚的意思,这种羚羊主要分布在东非. 同时,这个项目也将以Cl

Hadoop在电信大数据业务系统中的应用

文章讲的是Hadoop在电信大数据业务系统中的应用,2013年11月22-23日,作为国内唯一专注于Hadoop技术与应用分享的大规模行业盛会,2013 Hadoop中国技术峰会(China Hadoop Summit 2013)于北京福朋喜来登集团酒店隆重举行.来自国内外各行业领域的近千名CIO.CTO.架构师.IT经理.咨询顾问.工程师.Hadoop技术爱好者,以及从事Hadoop研究与推广的IT厂商和技术专家将共襄盛举. ▲IT168专题报道:http://www.it168.com/re

文档式数据库在Hadoop集群中的应用

2013年11月22-23日,作为国内唯一专注于Hadoop技术与应用分享的大规模行业盛会,2013 Hadoop中国技术峰会(China Hadoop Summit 2013)于北京福朋喜来登集团酒店隆重举行.来自国内外各行业领域的近千名CIO.CTO.架构师.IT经理.咨询顾问.工程师.Hadoop技术爱好者,以及从事Hadoop研究与推广的IT厂商和技术专家将共襄盛举. 在SQL&NoSQL专场,来自巨彬软件的CTO王涛做了<文档式数据库在Hadoop集群中的应用>演讲,从大数据

Hadoop峰会:南航航空大数据技术应用

文章讲的是Hadoop峰会:南航航空大数据技术应用,2013年11月22-23日,作为国内唯一专注于Hadoop技术与应用分享的大规模行业盛会,2013 Hadoop中国技术峰会(China Hadoop Summit 2013)于北京福朋喜来登集团酒店隆重举行.来自国内外各行业领域的近千名CIO.CTO.架构师.IT经理.咨询顾问.工程师.Hadoop技术爱好者,以及从事Hadoop研究与推广的IT厂商和技术专家将共襄盛举. Hadoop中国技术峰会由China Hadoop Summit专家