Amazon网页服务征集公共数据集

为了提供一种云数据服务,Amazon正在对外征集公共数据集。该服务可以提供一种简便方法,“分享、获得和使用公共数据”。

该服务名为AWS 公共数据集,可以让用户在Amazon EC2环境下使用公共数据。所选择的数据集作为AmazonEBS快照,免费存放在AWS上。

现有的数据集访问起来都很昂贵、费劲。比如Gutenberg项目,提供电子书下载,但是你要等上48小时才能完成下载(假定网速1M,文件14.5G)。如果你想得到mp3,下载91.5G需要等上9天。

但是好像项目并未列入AWS计划。我们计算了一下下载/上传80G大小的用户生成的虚拟图书馆(Virtual Conformer Library)所需的时间。

我们用加州的小区网络电缆做实验,下载需要22小时36分,上传需要3天零36分。如果服务器在纽约,我们在加州访问,下载需要3天42分,上传需要7天14小时。显然效率低下。

人们一直在寻找访问公共数据的更好办法,AWS项目也许不错。以前只有大公司花费巨资才可以实现云计算。

列入Amazon清单的数据集包括:破解人类基因数据、PubChem和虚拟图书馆(Virtual Conformer Library),美国人口普查数据,各种劳动力统计数据,以及各种经济和交通运输数据库。

AWS在以后将加入更多数据库,需要你的贡献。

如果你有公共数据集并且有传播权,可以提交到AWS公共数据集网站。

这太牛了!

时间: 2024-10-14 19:01:56

Amazon网页服务征集公共数据集的相关文章

Amazon云计算服务EC2、S3介绍

转自:http://blog.csdn.net/liuliming3000/archive/2008/07/31/2750114.aspx •EC2主要功能•EC2使用流程•EC2模板映像•EC2的流量和IP费用•S3功能•S3中的概念与操作•S3客户端•S3使用实例•S3的价格•Amazon AWS影响力•Amazon AWS侧面影响力•Amazon AWS潜力 EC2主要功能创建包含应用.库.数据和配置的机器映像.或者使用时限配置好的模板映像.上传映像到Amazon S3.用Web Serv

测试-公共数据集在哪?如何获取和使用?

问题描述 公共数据集在哪?如何获取和使用? 毕设需要对某算法进行测试,指导教师说有公开的公共数据集可以使用,目的是为了验证测试结果的准确性,因为既然是公用的那大家所得出的结果应该是相近的.但是网上没找到哪里有公用的数据集,哪里可以得到这些数据呢? 解决方案 http://blogs.msdn.com/b/azchina/archive/2011/04/08/datamarket_2d00_windows_2d00_azure_2d00_marketplace_2d00_cloud.aspx 解决

使用 Amazon Web 服务完成部署过程

Apache Geronimo是 Apache Software Foundation的最新项目之一.Java 专家 Kunal Mittal 将通过演示如何在 Geronimo 中编写和开发标准 J2EE Web 服务代码,向您介绍 Geronimo 的 Web 服务功能. 要确定某个应用服务器是否支持 Web 服务开发工作吗?Apache Geronimo 应用服务器完全可以满足这一要求,它是 Apache Software Foundation 的最新项目之一.Java 专家 Kunal

DragonDisk 0.97发布 Amazon S3服务的文件管理器

Dragonhttp://www.aliyun.com/zixun/aggregation/29800.html">Disk 是一个Amazon S3服务的文件管理器.它支持备份.共享,并通过一个直观的界面组织你的数据.功能包括:多窗口,Amazon S3帐户之间的复制/移动,一个多线程的HTTP/HTTPS的引擎,拖放,重命名文件和文件夹,文件名过滤器,BiTorrent,限制时间响应,签署网址,文件的完整性控制,元数据编辑器,ACL继承详细的操作日志,等等. DragonDisk 0.

DragonDisk 0.90发布 Amazon S3服务的文件管理器

DragonDisk是一个Amazon S3服务的文件管理器.它支持备份.共享.并通过一个直观的界面组织你的数据.功能包括:多窗口,Amazon S3帐户之间的复制/移动,一个多线程的HTTP/HTTPS的引擎,拖放,重命名文件和文件夹,文件名过滤器,BiTorrent,限制时间响应,签署网址,文件的完整性控制,元数据编辑器,ACL继承详细的操作日志,等等. DragonDisk 0.90版本增加了快速启动指南,在版本0.88中引入回归已得到纠正.提高账户管理功能. 软件信息:http://ww

从Amazon S3服务看将来的IT行业趋势

Amazon S3服务即Amazon Simple Storage Service (Amazon S3),另外也得知当我们某天给微软或者给国外某个大公司电话时候,而最后电话将被转接到印度,由印度的某大公司负责处理所有的业务.从这些我们可以知道,服务趋向于集中化,专业化,方便化! 这些业务在国外已经有很多成熟的应用模式,而国内相对较少,只听过携程老板说过他们的IVR每时每刻同时可以1000Phone接入量,我想有一天他们或许也会走如这个行业. 另外在服务器的架构集群化越来越夸张,国内的CDN虽然

DragonDisk 0.87发布 Amazon S3服务的文件管理器

DragonDisk是一个Amazon S3服务的文件管理器.它能备份,共享,并组织您的数据多亏有一个直观的界面.功能包括多窗口:Amazon S3帐户之间的复制/移动:一个多线程的HTTP/HTTPS的引擎:拖放:重命名文件和文件夹,文件名过滤器: BiTorrent,限制时间响应,签署网址:文件的完整性控制:元数据编辑器:ACL继承详细的操作日志:版本的支持. DragonDisk 0.87该版本增加了对日本和亚太地区其他国家的支持. 下载地址: Download DragonDisk fo

BitNami Cloud Tools 1.3-5发布 Amazon网络服务命令行工具

BitNami Cloud Tools 是一款http://www.aliyun.com/zixun/aggregation/2467.html">Amazon网络服务的命令行工具,支持同时运行预配置的Java.Ruby和Perl语言.该工具无依赖性,易于使用,使其从命令行简单使用AWS服务. BitNami Cloud Tools 1.3-5该版本更新了aws-ec2-api 到 1.5.2.5,AWS-SDK-Java到1.3.6,aws-sdk-ruby 1.3.8. 软件信息:ht

BitNami Cloud Tools 1.3-2发布 Amazon网络服务命令行工具

BitNami Cloud Tools 是一款http://www.aliyun.com/zixun/aggregation/2467.html">Amazon网络服务的命令行工具,支持同时运行预配置的Java.Ruby和Perl语言.该工具无依赖性,易于使用,使其从命令行简单使用AWS服务. BitNami Cloud Tools 1.3-2该版本更新了aws-ec2-api 1.5.2.4,aws-rds 1.6.001,aws-iam to 1.3.0,aws-ses to 2011