亚马逊Web服务近年来频繁变动,从价格削减到紧密整合私有数据中心,再到调整企业市场,而且不断扩展其原来的开发者和创业公司客户。
在众多执行者中一马当先的就是Matt Wood,他是亚马逊Web服务(AWS)的数据科学总经理。SearchCloudComputing本周在AWS峰会上和他探讨了企业客户的热点问题。这里我们将谈谈云价格、云联盟、法规以及数据定位。
TechTarget云计算:云价格是当下的热点话题,谷歌和亚马逊都在本周大幅降价。在每个人都可以免费得到一切之前价格究竟会有多低?
Matt Wood:我们一直都知道, 和我们的零售业务有一点像,云计算是一种大容量、低利润的游戏,而且这是一种我们非常适应的业务模式。
如果你回顾过去的八年,我们降价42次,这样做并没有任何真正的竞争压力。降价只是我们所做的一部分,是我们的组织发展的脉搏的而一部分,而且我们处于良性循环中……有越多客户采纳这个平台的地方,他们就使用得更多,而且因为我们能走出去和我们的厂商进行客制交易,我们走出去,并且利用规模经济,总体上我们最终是节省了成本。我们还可以从中获利。这也是一种合情合理的事情。但是我们选择将这些成本节省回馈给客户……我们一直在做这些事情,而且未来我们还会这样做。
TechTarget云计算:你的专长领域是数据科学和大数据分析。在这个领域里你是否看到了一些新的趋势?
Wood: 最大的趋势之一就是增益,而非取代,但是传统商业智能的增益则伴随更加实时的服务。而且是二者同时变得更加强大。
芬兰游戏公司Supercell就是个很好的例子……他们运作流行移动游戏,比如部落战争(COC),而且他们一天中有八百万人在ios上玩这个游戏。理想上,如果你是个游戏公司,你希望尽可能地捕捉价值。你想知道人们如何同游戏世界交互。你想知道你的游戏竞技表现如何。你想知道谁买了什么,以及谁和谁进行了对话,在什么情况下退出了游戏。你可以利用这些信息改善游戏。
通过收集所有数据有些已经实现了。你收集什么并没有限制,使用亚马逊实施管理流服务Kinesis,就是一种实现途径,你可以将数据丢进去,并且以不同的样本率连接传感器,,用同样的数据流可以做不同的事情。
TechTarget云计算:亚马逊将自己描述为“客户导向”。那么哪些特性和服务是客户目前寻求的呢?
Wood:他们会询问类似这样的事情,‘是否易于访问高价值、公共数据集?’这就要求我们要做很多。因为有很多数据。我们花费大量的时间识别,且同公共的可用数据工作,并且使其易于使用。
Common Crawl就是个很好的例子,它会定期更新,是一个非常大的Web集,Web上的每一页、下载和预计算,放到一个主页上,这就让Hadoop很容易运行。你不必自己来抓取,必须将原素材进行预计算所有的标签,并且移除HTML和类似的东西,这些都已经做好了。
你所得到的就是格式化的数据,易于用分布式的方式使用。你可以在冷启动中在不到十分钟的时间里查询数十亿网页。我们存储且托管这个数据是免费的,因为对于整个社区是有益的,然后我们确保其遵循了最佳的简单对象存储(S3)访问实践,所以这也很容易加速大型Hadoop集群,并且运行查询。
TechTarget云计算:我们接触的一些客户认为云联盟很有前途,亚马逊如何看待这个问题呢?
Wood: 我们目前还没从客户那里听到这样的说法,但是这并不代表未来这不重要。
我们从一些更大企业机构那里听到就是已经在基础架构上进行了大量投资。他们已经有了蓝图。我们和这些人谈论的时候,我们尝试引导他们并非一种选择,可以本地运行或者是在AWS上运行一切。
我们过去的十八个月都在构建集成点,使其更易于让用户在有意义的地方运行工作负载。我们在他们的数据中心和我们的数据中心之间构建了直接的链接,我们提供私有存储选择,我们也有私有计算选择,我们识别了联合选择以及类似于WorkSpaces这样的事物,这是一种在后端同活动目录集成的事物。所有的这些集成点都帮助客户在其工作负载上做出正确的选择。
TechTarget云计算:一些客户处于法规遵从原因需要将数据保存在某个特性区域,亚马逊能够签署法定协议,保证客户的数据不会离开具体的可用区或者具体的区域吗?
Wood: 实际上,你如果不选择数据存在哪里是没办法使用我们的平台的。客户必须做出谨慎的决定,确定其数据将会存在的区域。我们有这样的特定区域,每一个区域都有多种可用区,而且可用区内部都有数据中心。以S3服务为例,我们通过可用去得到镜像数据,但是我们不会在区域间做镜像数据。
原文链接:http://www.searchcloudcomputing.com.cn/showcontent_81368.htm