当Twitter向科学家开放数据之后

  最近,关于Twitter向科学家免费开放所有数据的事引发关注。虽然,其中会有隐私问题,但是,此举对大数据科研无疑利大于弊。

  一、Twitter免费向科学家开放所有数据  

  大数据时代,研究人员对数据的需求太强烈了。所以,当今天看到Twitter免费向科学家开放所有数据的消息后,颇感欣慰。

  实际上,今年2月,Twitter即宣布将把2006年以来的所有数据免费提供给研究人员,有望使得Twitter成为一项广受欢迎的研究工具。借助如此庞大的数据,科学家可以展开更加复杂的研究,瞄准更具体的问题。

  要知道,目前,许多科学家在研究项目时,只能使用有限的Twitter消息。尽管多数Twitter消息都对外公开,但科学家却希望能够随意搜索这些内容,他们目前只能通过Twitter的API实现这项功能,但却只能访问1%的数据。

  这显然是不够的。如果Twitter能如其所言,免费向科学家开放所有数据,则对科学家们而言,则是无不拍手称快的喜讯。

  二、免费开放所有数据举动利大于弊  

  应该承认,开放所有数据,或多或少存在">用户信息泄露的情况,甚至存在一些独创内容的版权使用问题。还有人提出:Twitter能否对相关科研结果享有任何权益?由于用户未必想将自己的内容贡献给研究人员,因此有人质疑Twitter此兴趣是否有违道德?

  然而,如果在遵守相应法则的情况下,免费向科家开放所有数据显然是利大于弊,甚至用“功在当代,得在千秋”也许都算不上太夸张。

  如果说,利用大数据辅助美女长相分析、足球队的运营、奥斯卡奖项预测及总统选举结果预测,与普通民众关系未必那么密切的话,那么,利用大数据在公共安全、疾病预测及地震信息跟踪等方面的研究,则会为人类带来更多的利益。

  君不见,有科学家利用大数据成功预测了流行病的爆发,有利用动态交通大数据减少拥堵,有公安利用大数据预防犯罪或提高破案率,还有对Twitter上的怀孕妇女透露出的情绪,开发了新算法预测产后抑郁症的风险,以及美国地质调查局使用Twitter追踪地震发生地,并进行相应的分析。

  三、大数据发展急需全面可靠的数据

  其实,大数据研究中对于数据的需求是相当迫切的。如果数据缺乏, 则不仅不会研究出可靠的成果,还可能引发外界的质疑。

  由于数据的问题,外界有时会有“数据会撒谎“的说法。实际上,最近的一些深度分析即指出:会说谎的不是数据,而是缺乏数据。

  实际上,许多有远见的企业已经认识到:数据也是一种资产。这也就是说,数据是宝贝,数据有价值,数据中隐含着许多重要的东西。然而,要从数据中发掘出重要的价值,前提就是要有更全面及更可靠的数据,否则模型再好,算法再高明,也很可能无法得到可靠的结果,甚至徒劳无功。

  虽然有很多网络上的数据是公开的,可以随时抓取,但是仍然有许多数据是半公开(如上述Twitter原来仅能使用到1%左右的数据),或不公开。这无疑会对许多重要的研究带来许多的不便。

  说到这里,也希望中国的大企业(发阿里、百度、腾讯、新浪等等)也能以更开放的心态,向重要的科研项目开放更多的数据。如果能如Twitter一样,向科学家全面免费开放数据,则真的是功德无量。

  最后,提醒许多商业机构,上述Twitter的免费数据开放应该是针对科学家的,如果是商业分析用的数据,让Twitter全面免费开放恐怕不易,因为使用这些数据多数是要付费的。(作者:陈永东,中国十大IT博主,新媒体研究者,电子邮件:cyd888@sina.com)

时间: 2024-12-23 13:30:02

当Twitter向科学家开放数据之后的相关文章

开放数据门户该如何评价?

建设一个成功的开放数据门户,能有效帮助公共部门推动公共数据开放工作,但什么样的开放数据门户才算成功?哪些指标可以作为开放数据门户评价标准?或许以下国际上应用较为普遍的开放数据http://www.aliyun.com/zixun/aggregation/18023.html">评价体系能给出答案. 一.阳光基金评价体系 阳光基金(Sunlight Foundation)是美国一家旨在提倡政府透明度的非营利性机构.2011年,阳光基金提出了十项标准,并由此建立了美国政府开放数据门户的评价体系

Chirp首日回顾:Twitter高速成长开放为关键词

Twitter CEO埃文·威廉姆斯演讲 北京时间4月15日早间消息,Twitter首届"Chirp开发者大会"今日进入第一天,新浪科技派出的前方报道团队在大会现场进行全程直播. Twitter今天公布的官方数据显示,Twitter以年均增长1500%之势迅猛发展.最新的数据显示,Twitter的用户数已超过一亿,月独立用户访问量1.8亿,来自API的日均访问量为30亿次.然而Twitter有75%的流量来自外部,开放合作成为增长的关键词. Twitter高速成长 在Chirp大会期间

OData的实际应用-通过开放数据协议构建富Internet应用程序

在 PDC09 期间,Microsoft WCF 数据服务团队(以前称为 ADO.NET 数据服务团队)首次推出 OData,即开放数据协议.这一消息是在会议第二天的主题演讲中宣布的,但实际上 OData 早就开始了.自从 Microsoft .NET Framework 3.5 SP1 中提供 ADO.NET 数据服务以来,熟悉 ADO.NET 数据服务的用户已经使用 OData 作为数据传输协议开发基于资源的应用程序.本文将介绍富 Internet 应用程序 (RIA) 的开发人员如何使用

微软向云靠拢 加入开放数据中心联盟

日前,微软已宣布加入开放数据中心联盟(ODCA).这个由用户领导的组织的目标是通过推广互操作性和统一标准来简化购买数据中心和云服务. 该联盟在成立两年半的时间里已经获得300多个成员.大多数成员是数据中心和云服务用户,主要是银行和电信公司.但是,其他的成员还有一所美国的大学.一家法国的汽车制造厂和荷兰国家警察机构. 厂商也欢迎加入这个组织,或者像微软那样作为这个组织的解决方案提供商成员,或者作为贡献者成员.贡献者成员可以看到这个组织出版物的早期版本并且向编写出版物的技术工作组作出贡献. 开放数据

开放数据中心联盟发布2.0版推动标准化

开放数据中心联盟(ODCA,http://www.aliyun.com/zixun/aggregation/13722.html">Open Data Center Alliance)成立于2011年,其成员是各行业数据中心服务的大商业用户. 近日,ODCA继续发力务求提供可跨产业使的用户基础标准化模式,以使得企业数据中心规范化及简化与供应商之间的关系:联盟就数据中心存储在编排(Orchestration)方面的使用模式发布一个含近30个文件的标准. ODCA使用模式重点是以下八类:基础设

专访旧金山市CTO:开放数据项目背后的架构与云

美国联邦政府应该是世界上最早设立国家首席技术官(CTO)这一职位的政府.相应地,作为美国最前沿的科技和创新基地,以及硅谷门户的旧金山,也是最早在市政厅设置首席技术官一职的城市.日前,旧金山市首席技术官 Gina C. Tomlinson在市政厅接受了PingWest创始人骆轶航(Thomas Luo)的专访.本次访谈涵盖了旧金山首席技术官的角色和职责.市政IT架构云端化.政府技术创新如何为旧金山硅谷的创业者和商业机构服务.开放数据项目(open data program)的进展以及数据透明的价值

淘宝首度向全球开放数据

本报讯(记者 李宽宽)3月31日,阿里巴巴集团旗下淘宝网正式宣布,将面向全球首度开放淘宝数据,商家.企业及消费者将在未来分享到来自淘宝全网的原始数据. 据了解,此次面向商家开放数据的方式主要分为两种.其一,通过淘宝数据魔方平台(http://data.taobao.com ),商家可以直接通过数据魔方产品获取行业宏观情况.自己品牌的市场状况.消费者行为情况等,但是不能获得竞争对手的数据:其二,通过第三方研究机构合作的方式,商家可以直接向研究机构获取服务,使得商家能够借此提高其电子商务业务,并用到

英国开放数据项目孵化器ODI获得首笔海外投资75万美元

12月3日消息,据科技博客TechCrunch报道,英国开放数据项目孵化器Open Data Institute(以下简称为"ODI")今天宣布,它从投资公司Omidyar Network获得了首笔海外投资,投资额为75万美元. 英国政府未来五年也将向ODI提供1000万英镑(1600万美元).ODI今天也开始正式运营,此前它已经试运营了将近两个月. 利用开源或者开放数据作为业务运营的基础,其实并不是新概念.对面向所有人的数据而非专有数据的需求将随着大数据行业的发展而不断增长. ODI

英国开放数据项目孵化器ODI获75万美元海外投资

12月3日消息,据科技博客TechCrunch报道,英国开放数据项目孵化器http://www.aliyun.com/zixun/aggregation/13722.html">Open Data Institute(以下简称为"ODI")今天宣布,它从投资公司Omidyar Network获得了首笔海外投资,投资额为75万美元. 英国政府未来五年也将向ODI提供1000万英镑(1600万美元).ODI今天也开始正式运营,此前它已经试运营了将近两个月. 利用开源或者开放