谷歌更新BigQuery，大型数据集被应用

据Gigaom报道，谷歌日前对BigQuery进行了更新，加入新的聚合功能。BigQuery是一个让用户使用类似SQL的查询来分析TB大小的数据集的云服务。它基于谷歌的Dremel查询系统，可以在其所处的位置(即Google File System或BigTable)上分析数据，不仅如此，还可在谷歌内部使用，分析各种不同的数据集。谷歌声称在BigQuery运行交互式查询速度，对实时性和复杂性的要求完全是MapReduce(上一代处理大型数据集的工具)所无法匹及的。当然，对于批处理，BigQuery同样胜任，而且费用更低。

BigQuery的产品经理Ju-kay Kwek表示现在用户可以加入大型表、导入和查询时间戳数据，以及使大量非重复数据的集合进行聚合。

因此，从一些类似Dremel和其商业发行版BigQuery上可获得潜在好处——不输于Hadoop生态系统，Hadoop本身已依赖MapReduce进行处理很多年。在过去一年，我们已经看到许多初创公司和大型厂商为坐落在HDFS上数据发布自己的类Dremel(或类MPP)技术。

撇开这个背景不谈，在BigQuery中加入连接大型数据集的能力可能是最重要的新功能。连接是大多数环境中数据分析的一个重要方面，因为彼此相关的数据并不总是驻留在同一个表，甚至在同一个集群中。(王旭东/编译仲浩/审校)

连接到BigQuery的方法

Kwek说明了为什么加入新的聚合功能是重要的：

当我们的App Engine团队需要调和应用程序计费和使用信息时，Big JOIN可以让团队在60秒内合并 2TB的使用数据和10 GB的配置数据。使用集成的Tableau客户端的团队可以快速的发现一些意想不到的趋势。

【编辑推荐】

关于云计算：IaaS的四个误解和四个猜想微软云计算Azure宣布：将支撑移动WEB应用迁移到云计算的三大最佳实践方案谷歌GCE vs. 亚马逊EC2：快源于谷歌本有的底蕴【责任编辑：箫韵 TEL：（010）68476606】

时间： 2024-10-31 12:48:27

谷歌更新BigQuery，大型数据集被应用

谷歌更新BigQuery，大型数据集被应用的相关文章

谷歌更新PR频次回归正常站长应该如何应对

新站网络推广需要坚持一个谷歌更新周期

【硅谷连线】Uber新一轮融资估值170亿美元谷歌更新搜索算法

书生：关于这次谷歌更新PR值的一些看法

数据挖掘——数据归约之大型数据集的维度

谷歌更新服务条款将对用户电子邮件进行扫描

谷歌更新PR频次回归正常站长如何让网站PR值不断的上升

手把手教你应对谷歌更新(I)

外贸SEO关注:谷歌更新网络垃圾算法提高甄别能力