谷歌更新BigQuery,大型数据集被应用

据Gigaom报道,谷歌日前对BigQuery进行了更新,加入新的聚合功能。BigQuery是一个让用户使用类似SQL的查询来分析TB大小的数据集的云服务。它基于谷歌的Dremel查询系统,可以在其所处的位置(即Google File System或BigTable)上分析数据,不仅如此,还可在谷歌内部使用,分析各种不同的数据集。谷歌声称在BigQuery运行交互式查询速度,对实时性和复杂性的要求完全是MapReduce(上一代处理大型数据集的工具)所无法匹及的。当然,对于批处理,BigQuery同样胜任,而且费用更低。

BigQuery的产品经理Ju-kay Kwek表示现在用户可以加入大型表、导入和查询时间戳数据,以及使大量非重复数据的集合进行聚合。

因此,从一些类似Dremel和其商业发行版BigQuery上可获得潜在好处——不输于Hadoop生态系统,Hadoop本身已依赖MapReduce进行处理很多年。在过去一年,我们已经看到许多初创公司和大型厂商为坐落在HDFS上数据发布自己的类Dremel(或类MPP)技术。

撇开这个背景不谈,在BigQuery中加入连接大型数据集的能力可能是最重要的新功能。连接是大多数环境中数据分析的一个重要方面,因为彼此相关的数据并不总是驻留在同一个表,甚至在同一个集群中。(王旭东/编译 仲浩/审校)

连接到BigQuery的方法

Kwek说明了为什么加入新的聚合功能是重要的:

当我们的App Engine团队需要调和应用程序计费和使用信息时,Big JOIN可以让团队在60秒内合并 2TB的使用数据和10 GB的配置数据。使用集成的Tableau客户端的团队可以快速的发现一些意想不到的趋势。

【编辑推荐】

关于云计算:IaaS的四个误解和四个猜想微软云计算Azure宣布:将支撑移动WEB应用迁移到云计算的三大最佳实践方案谷歌GCE vs. 亚马逊EC2:快源于谷歌本有的底蕴【责任编辑:箫韵 TEL:(010)68476606】

时间: 2024-10-31 12:48:27

谷歌更新BigQuery,大型数据集被应用的相关文章

谷歌更新PR频次回归正常 站长应该如何应对

11月8日,很多站长发现,自己网站的谷歌PR值有了细微的变化,而且有权威数据显示,这次谷歌更新PR值的范围非常大,几乎有一半以上的网站受到了影响,其中26.03%的PR权重上升了,14.76%的PR权重下降了.这种变化,无疑让原先还在担心谷歌将会削弱PR值的站长们恢复了信心,PR值依然是未来衡量网站质量的一个重要参考数据! 既然谷歌开始恢复更新PR值了,而且每次大范围的更新的间隔也越来越短,这次的大更新和上次的更新时间相隔也不过一个月左右,可见谷歌不仅仅恢复了PR值在网站质量上的参考,而且还把P

新站网络推广需要坚持一个谷歌更新周期

企业做网站进军网络营销这块,不像是进餐厅吃饭一样,照着菜单点,完了就可以上一桌大餐,网络营销是一个细活像是绣花,半点来不及.但是很多站都减持不到一个谷歌更新的时间,谷歌的pr更新意味着你会越来越好做你的站,尤其是pr提升之后. 做资讯站是后来的想法,之前的网站一直是以博客的形式存在的.新站一个星期被收录,百度和谷歌的收录还可以,但是之前以博客的形式存在的时候,优化一直不是很好,很多关键词无法排到百度的首页.可能之前的定位有很大的关系,于是后来重新定位网站从营销博客到营销咨询站的改变. 网站的定位

【硅谷连线】Uber新一轮融资估值170亿美元 谷歌更新搜索算法

中云网每天连线硅谷,呈现最新鲜资讯!这里的"硅谷"指的是国外具有典型性和创新性企业代表. 1. 租车服务Uber新一轮融资估值高达170亿美元 http://tech.ifeng.com/mi/detail_2014_05/26/36503404_0.shtml 北京时间5月26日消息,据<华尔街日报>报道,租车服务Uber在上周进行了最新一轮融资活动,据知情人士称,Uber在此轮融资中的估值或将接近或超过170亿美元. 据其中的两位知情人士称,在Uber公司代表向潜在投资

书生:关于这次谷歌更新PR值的一些看法

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 谷歌Google今日更新PR值,这或许是绝大多数站长朋友都没有想到的事情.因为距离上次更新PR值,甚至还没到2个月时间.而传统上的PR值更新是3个月一次的. 我询问过很多站长,在这次PR值更新中有什么收获.然而绝大多数的人反映,这次PR值更新,有点出乎意料,甚至是难以置信.或者说,谷歌这次的PR值更新,完全没有按照常理.很多网站每天更新,每天

数据挖掘——数据归约之大型数据集的维度

前言 虽然大型数据集可能得到更佳的挖掘结果,但未必能获得比小型数据集更好的挖掘结果 对于多维数据,一个主要的问题是在所有维度中搜寻所有挖掘方案之前,是否可以确定某方法在已归约数据集的挖掘和发现中国发挥得淋漓尽致. 一.大型数据集的维度 数据的描述以及特征的挑选,归约或转换可能是决定挖掘方案质量的最终更要问题. 预处理集的3个主要维度通常表示为平面文件即列,行和特征的值因此数据归约的3个基本操作就是删除列,删除行和减少列中值的数量.这些操作的目的是试图删掉不必要的数据来保留原始数据的特征 在准备数

谷歌更新服务条款 将对用户电子邮件进行扫描

中介交易 SEO诊断 淘宝客 云主机 技术大厅 4月15日消息,据国外媒体报道,谷歌周一更新了其服务条款,告知用户将对他们收到和发出的电子邮件进行软件自动分析,以便该公司创建定向广告(Targeted ads). 谷歌此次修订其服务条款,更明确地说明了谷歌软件如何扫描用户的电子邮件:无论是储存在谷歌服务器中的信息,还是在传输过程中的信息,均会被谷歌软件扫描.目前,这一有争议的做法已成为多起诉讼的焦点. 在美国,已有数起诉讼指控谷歌侵犯其数亿电子邮件用户的隐私权.但美国一名法官上月决定,不会把这数

谷歌更新PR频次回归正常 站长如何让网站PR值不断的上升

摘要: 11月8日,很多站长发现,自己网站的谷歌PR值有了细微的变化,而且有权威数据显示,这次谷歌更新PR值的范围非常大,几乎有一半以上的网站受到了影响,其中26.03%的PR权重上升了, 11月8日,很多站长发现,自己网站的谷歌PR值有了细微的变化,而且有权威数据显示,这次谷歌更新PR值的范围非常大,几乎有一半以上的网站受到了影响,其中26.03%的PR权重上升了,14.76%的PR权重下降了.这种变化,无疑让原先还在担心谷歌将会削弱PR值的站长们恢复了信心,PR值依然是未来衡量网站质量的一个

手把手教你应对谷歌更新(I)

最近周围的朋友一直在问我为什么火影SEO推广的网站能安然度过谷歌企鹅更新,大家推广的产品差不多,为神马我们推广的关键词排名就能一直保持在首页呢? 大家都知道如今再指望SenukeX.Xrumer或者虫虫等纯自动软件来做网站优化已经不现实;依赖黑链之类的黑猫方法也逐渐成为了过去.但是,能重新回到纯手工时代吗?NO!且不说人工成本渐涨,优秀的SEO员工流动性高这些因素,单单谷歌不断变化,惩罚.降权每天发生,如果不同时推广大量的网站,就意味着你公司随时可能会关门!所以,人工+自动的推广方式已是大势所趋

外贸SEO关注:谷歌更新网络垃圾算法提高甄别能力

4月24号谷歌杰出的工程师Matt Cutts在谷歌网站管理员博客中公开表扬了那些高质量的网站,并表示在接下来的工作中,会重点推出一个算法,针对那些垃圾网站,这个算法将会影响网站的排名. 这在seo业界似乎已经不是新鲜的事情了,众所周知,谷歌很长一段时间都在这对过度优化的网站进行算法更新,而此次算法更新针对的目标就是那些垃圾网站.什么样的网站将会在这次算法更新中遭受袭击?我们先来了解一下这次"网络垃圾算法的更新"的几大亮点: 1.谷歌推出几个不同元素的识别系统来检测网站 搜索引擎以某种