Amr Awadallah:通过来自">Cloudera的Hadoop来压缩大数据 发布时间:2012.05.25 10:31 来源:赛迪网 作者:赛迪网
【赛迪网讯】Cloudera创始人兼CTO Amr Awadallah近日访华,他表示,我们都知道如何去存储数据,但不知道如何去处理或者是回答一些关于数据的问题。我们可以通过使用Hadoop让数据存留时更长,完成数据良好的测算和计算。
不管是什么操作系统,都有两个核心任务:存储文件,以及在文件之上运行应用程序。Hadoop将其合二为一,不仅能够存储文件而且还能够运行应用程序,在文件顶层运行程序,而且它是在很多的服务器之上,来做这样的一个数据操作中心。
Amr Awadallah表示Hadoop能提供三个业务价值,具体表现在:
1. 灵活性,扩展性。传统数据库的管理系统是通过用一个程序进行,当你载入这些数据,这个程序已经进行预定义了,如果有些东西是它没有定义的,就不能够载入,这个程序让大家在读取数据时候非常快。但是,它没有足够的灵活性,而Hadoop则能够使用边读边写的程序,我们只需要处理一些文件,把这些文件原模原样给Hadoop,不管什么格式我都可以进行处理。
2. 可以扩展性。所谓的扩展就是能够扩展硬件,计算机,也能够扩展人的能力。用传统方式的话说,不管设计任务还是其他的程序,你必须按照预定义的方式,进行复杂操作,才能够成功扩展。Hadoop只需要增加服务器,不需要做表或者其他层面上的操作,也不需要写程序,这样以来,系统会被你分配更多的服务器。
时间: 2024-10-01 08:15:44