在过去的12个月当中,大数据浪潮席卷全球各个领域。即使是最大的机构也缺乏基础设施、工具以及方法,这直接导致了企业缺乏从大数据中有效的提取关键数据并转换为洞察业务的能力。但现今大数据的世界正在发生变化。对于所有类型和规模的组织,海量的开源软件和低成本的硬件组合大大降低了大数据处理系统的门槛。
简单的说,开源解决方案允许组织在短时间内将集群发展到成千上万台服务器的规模,以便更好地支持大数据的服务。并且只需支付所用资源的开销。而以下几点也充分说明了开源软件是大数据时代最好的选择。
1.包含众多的大数据处理工具
虽然专有的操作系统每2到3年就会升级,但相对于专有系统大多数开源系统提供更短的发布周期和长时间的系统支持时间。这也意味所有的组织都能够从他们业务需求角度上获得最合适的大数据处理工具(从Hadoop、Cassandra到MongoDB、Couchbase)。
2.更好的兼容性
开源操作系统与生俱来就可为公共云和私有云提供支持,并提供公共云和私有云之间工作负载的无缝迁移。开源系统支持实时的资源调配和扩展。兼容Amazon EC2的Nimbula Director云操作系统就是极佳的例子。Nimbula通过它的Nimbula Director服务提供了同时管理私有云和公共云的能力。Nimbula的服务允许移植现有私有云应用到公共云,使用可以管理整个云资源的API。
3.大数据基础设施的快速部署
处理大数据业务的基础设施必须是灵活且易于部署的。因此拥有自动在“裸机”服务器上安装实例以及根据不断变化的业务需求动态计算资源处理以应对不同工作负载的任务是大数据软件必须具备的特性。
4.面向服务的开发
在未来,开发者将更多的考虑服务更不是底层的基础设施。现今,已有可用于配置服务和底层基础设施的组件,这使的DevOps(DevOps是软件开发、运维和质量保证三个部门之间的沟通、协作和集成所采用的流程、方法和体系的一个集合。)可以在几分钟内部署大数据服务、调配相关资源并有机结合所有必要的基础设施和应用程序。
5.无授权限制
众所周知,大数据处理系统需要大量的基础设施。专有系统往往需要昂贵的授权费用。由于不要求每台计算机都具备相应的许可,开源操作系统在大数据环境中部署时可显著的节省成本。
6.完善的硬件支持
免费许可的开源操作系统现在已经被证实是运行在低成本、商业化数据中心中硬件上的最佳选择。由于大数据需要大量的计算资源,这一关键点也成为最大的好处之一。
开源技术正在帮助各种类型和规模的组织将大数据集转换为有意义的业务情报数据。相比于部署在大型分布式的大数据环境中昂贵的专有系统,开源软件显然要便宜很多。更重要的是开源软在对大数据处理系统需要扩展时不会带来额外的授权费。
由于以上这些原因,开源软件已经在大数据应用领域占据了重要的地位。最重要的是开源软件组建的大数据处理平台在计算和存储上具备良好的伸缩性,同时能够真正有效的确保组织最快的获取他们想要的结果。(李智/编译)
(责任编辑:蒙遗善)