谷歌在周三发布了 Cloud Dataflow,一个用来既可以使用流式处理又可以使用批处理模式的大数据分析服务。
这个消息是在旧金山举行的谷歌 I/O 大会上公布的。它帮助完成了搜索巨头的云计算格局,为了对抗亚马逊的网络服务而一直在添加新功能。
谷歌高级副总裁乌尔斯·霍泽尔简要介绍了 Dataflow,并演示了一个围绕处理推特上的数据和世界杯人气的 demo。Dataflow 是介绍的一系列云服务里的头条。
霍泽尔说谷歌内部已经使用 Dataflow 替代了 MapReduce(MapReduce 已停用好些年了)。Cloud Dataflow 被设计成流式分析任意大的数据集。
“Cloudflow 处理整个数据流,而MapReduce 处理单一的流”,他说道。
总的来说,谷歌的 Cloudflow 将对抗亚马逊的数据托管网络服务 Amazon Redshift 以及使用 hadoop 来处理大数据的弹性云服务 MapReduce。
Cloud Dataflow能创建数据管道,在批处理和流处理模式下摄取、转变和分析数据。Cloud Dataflow可以降低运营开销,更容易的从数据中获取到可行的见解。(Solidot)
时间: 2024-10-11 10:08:28