AWS首席数据科学家谈云价格战和大数据

  亚马逊Web服务近年来频繁变动,从价格削减到紧密整合私有数据中心,再到调整企业市场,而且不断扩展其原来的开发者和创业公司客户。

  在众多执行者中一马当先的就是Matt Wood,他是亚马逊Web服务(AWS)的数据科学总经理。SearchCloudComputing本周在AWS峰会上和他探讨了企业客户的热点问题。这里我们将谈谈云价格、云联盟、法规以及数据定位。

  TechTarget云计算:云价格是当下的热点话题,谷歌和亚马逊都在本周大幅降价。在每个人都可以免费得到一切之前价格究竟会有多低?

  Matt Wood:我们一直都知道, 和我们的零售业务有一点像,云计算是一种大容量、低利润的游戏,而且这是一种我们非常适应的业务模式。

  如果你回顾过去的八年,我们降价42次,这样做并没有任何真正的竞争压力。降价只是我们所做的一部分,是我们的组织发展的脉搏的而一部分,而且我们处于良性循环中……有越多客户采纳这个平台的地方,他们就使用得更多,而且因为我们能走出去和我们的厂商进行客制交易,我们走出去,并且利用规模经济,总体上我们最终是节省了成本。我们还可以从中获利。这也是一种合情合理的事情。但是我们选择将这些成本节省回馈给客户……我们一直在做这些事情,而且未来我们还会这样做。

  TechTarget云计算:你的专长领域是数据科学和大数据分析。在这个领域里你是否看到了一些新的趋势?

  Wood: 最大的趋势之一就是增益,而非取代,但是传统商业智能的增益则伴随更加实时的服务。而且是二者同时变得更加强大。

  芬兰游戏公司Supercell就是个很好的例子……他们运作流行移动游戏,比如部落战争(COC),而且他们一天中有八百万人在ios上玩这个游戏。理想上,如果你是个游戏公司,你希望尽可能地捕捉价值。你想知道人们如何同游戏世界交互。你想知道你的游戏竞技表现如何。你想知道谁买了什么,以及谁和谁进行了对话,在什么情况下退出了游戏。你可以利用这些信息改善游戏。

  通过收集所有数据有些已经实现了。你收集什么并没有限制,使用亚马逊实施管理流服务Kinesis,就是一种实现途径,你可以将数据丢进去,并且以不同的样本率连接传感器,,用同样的数据流可以做不同的事情。

  TechTarget云计算:亚马逊将自己描述为“客户导向”。那么哪些特性和服务是客户目前寻求的呢?

  Wood:他们会询问类似这样的事情,‘是否易于访问高价值、公共数据集?’这就要求我们要做很多。因为有很多数据。我们花费大量的时间识别,且同公共的可用数据工作,并且使其易于使用。

  Common Crawl就是个很好的例子,它会定期更新,是一个非常大的Web集,Web上的每一页、下载和预计算,放到一个主页上,这就让Hadoop很容易运行。你不必自己来抓取,必须将原素材进行预计算所有的标签,并且移除HTML和类似的东西,这些都已经做好了。

  你所得到的就是格式化的数据,易于用分布式的方式使用。你可以在冷启动中在不到十分钟的时间里查询数十亿网页。我们存储且托管这个数据是免费的,因为对于整个社区是有益的,然后我们确保其遵循了最佳的简单对象存储(S3)访问实践,所以这也很容易加速大型Hadoop集群,并且运行查询。

  TechTarget云计算:我们接触的一些客户认为云联盟很有前途,亚马逊如何看待这个问题呢?

  Wood: 我们目前还没从客户那里听到这样的说法,但是这并不代表未来这不重要。

  我们从一些更大企业机构那里听到就是已经在基础架构上进行了大量投资。他们已经有了蓝图。我们和这些人谈论的时候,我们尝试引导他们并非一种选择,可以本地运行或者是在AWS上运行一切。

  我们过去的十八个月都在构建集成点,使其更易于让用户在有意义的地方运行工作负载。我们在他们的数据中心和我们的数据中心之间构建了直接的链接,我们提供私有存储选择,我们也有私有计算选择,我们识别了联合选择以及类似于WorkSpaces这样的事物,这是一种在后端同活动目录集成的事物。所有的这些集成点都帮助客户在其工作负载上做出正确的选择。

  TechTarget云计算:一些客户处于法规遵从原因需要将数据保存在某个特性区域,亚马逊能够签署法定协议,保证客户的数据不会离开具体的可用区或者具体的区域吗?

  Wood: 实际上,你如果不选择数据存在哪里是没办法使用我们的平台的。客户必须做出谨慎的决定,确定其数据将会存在的区域。我们有这样的特定区域,每一个区域都有多种可用区,而且可用区内部都有数据中心。以S3服务为例,我们通过可用去得到镜像数据,但是我们不会在区域间做镜像数据。

  原文链接:http://www.searchcloudcomputing.com.cn/showcontent_81368.htm

时间: 2024-10-02 18:00:27

AWS首席数据科学家谈云价格战和大数据的相关文章

禾连健康CDO沈金:谈云时代的大数据平台架构

11+大数据行业应用实践请见https://yq.aliyun.com/activity/156,同时这里还有流计算.机器学习.性能调优等技术实践.此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps:更多精彩内容参见大数据频道:https://yq.aliyun.com/big-data . 禾连健康通过为医院提供无线WIFI网络解决方案作为切入点,让医护和患者在享受高速上网服务的前提,为医护提供提

【大数据干货】数据进入阿里云数加-大数据计算服务MaxCompute(原ODPS)的N种方式

免费开通大数据服务:https://www.aliyun.com/product/odps 想用阿里云大数据计算服务(MaxCompute),对于大多数人首先碰到的问题就是数据如何迁移到MaxCompute中.按照数据迁移场景,大致可以分为批量数据.实时数据.本地文件.日志文件等的迁移,下面我们针对每种场景分别介绍几种常用方案. 大数据计算服务(MaxCompute) 快速.完全托管的TB/PB级数据仓库解决方案,向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海

帮数据科学家干脏累活,大数据初创企业Paxata获3350万美元D轮融资

  经过前几年的炒作之后,大数据已经逐渐远离了媒体的焦点.这并不是说大数据已经失去势头,相反正是由于大数据应用之广泛已经到了几乎任何应用都离不开的地步,司空见惯了的东西所以就无人提及.但是大数据的应用普及仍然存在一些问题,主要的问题之一就是许多环节仍然离不开人工处理.比如最开始的数据抽取.处理与整合就需要大量人力--21世纪最性感的职业很大一部分精力都用在这些脏累活上面可一点都不吸引人.所以不少创业公司都把焦点放在解放数据科学家的事情上面,Paxata就是其中之一,在Intel Capital

LinkedIn首席数据科学家谈数据分析

本文讲的是LinkedIn首席数据科学家谈数据分析,在互联网企业中,LinkedIn是一家出了名的"慢公司",但LinkedIn也是最成功的社交网络,用户品质.广告价值都是行业翘楚,秘密在于LinkedIn有一个高效的数据科学家团队. 作为社交网络,LinkedIn并不是最大的,也不是生长最快的.成立于2003年的LinkedIn, 花了500天, 才达到了100万用户.然而,作为全球最大的职业社交网络,LinkedIn的后劲十足.今天,LinkedIn每6天就新增100万用户.平均每

福特首席数据科学家谈三点大数据经验

Photo: Ford 数据已经成了福特公司的"燃油",从产品设计到商业智能,从汽车部件到社交网络上的用户,福特公司每天需要处理海量且快速增长的数据. 今日福特公司首席数据官Michael Cavaetta做客Structure Show,介绍了福特公司的大数据处理经验,归结为三点: 一.数据可以影响设计 数周前福特公司在北美国际汽车展上亮相的F-150皮卡车型采用了轻型铝材取代钢材提高燃油经济性.鲜为人知的是,这项设计改动离不开 Cavaetta领导的数据部门的贡献.Cavarett

如何在云上实现大数据项目

云计算和大数据目前都是热门话题,如何把两者结合起来即在云上实现大数据项目,这是一个新的实践领域.资深数据专家David Gillman根据自己的经验,列举了云上大数据方案需要考虑的基本要素,包括对数据构建实时索引.自由模式搜索与分析.监视数据并提供实时警告等,帮助用户更好地评估和选择解决方案. 在谈到如何实现云上大数据项目时,David强调了三个实时要素,即实时索引.实时数据和实时监控.具体来说,实时索引指的是"对所有机器数据创建通用的实时索引": 这是大多数人所认为的大数据的核心;它

鲁四海解读中国大数据发展10大趋势5大挑战 —— 首席数据官联盟2016《中国大数据企业排行榜》发布会实录

2016年7月14号,首席数据官联盟在京发布了2016年<中国大数据企业排行榜>.本次发布的<中国大数据企业排行榜>由北京大学电子政务研究院.中国新一代IT产业推进联盟共同指导,由首席数据官联盟专家组依据大数据企业评价指标体系对国内大数据企业进行综合评定.与此同时专家组还总结出了中国大数据发展的10大趋势和5大挑战.此次<中国大数据企业排行榜>得到业界的大力支持,发布会由中华网.中关村智能硬件产业联盟.北京优智活孵化器协办.机械工业信息中心处长白涌如.北京大学电子政务研

云营销:大数据时代的新营销革命

营销学领域过去半个多世纪的发展让我们见证了从"以产品为中心"向"以客户为中心"的转变,最受欢迎的营销理论也从"4P"转向了以消费者需求为导向的"4C"理论和以关系营销为导向的"4R"理论.互联网与移动互联网主导下的数字化信息时代可以帮助企业以前所未有的速度收集用户的海量行为数据,在大数据的基础上分析.洞察.和预测消费者的偏好,并据此为消费者提供最能满足他们需求的产品.信息.和服务. 然而,即使在大数据时代,

云营销是大数据时代的新营销革命

营销学领域已经发展了很长的一段时间,它向我们展示了从"以产品为中心"向"以客户为中心"的转变,最受欢迎的营销理论也从"4P"转向了以消费者需求为导向的"4C"理论和以关系营销为导向的"4R"理论. 互联网与移动互联网主导下的数字化信息时代可以帮助企业以前所未有的速度收集用户的海量行为数据,在大数据的基础上分析.洞察.和预测消费者的偏好,并据此为消费者提供最能满足他们需求的产品.信息.和服务. 然而,即使在大