Twitter开放全部数据

  北京时间5月27日消息,每天有5亿条Twitter消息发布,内容涉及人们生活的方方面面,而现在,这家社交网络决定将这一巨大的数据宝库向科学家开放,帮助他们研究人类的行为模式、预判健康风险并追踪传染病的传播情况。例如,微软研究人员通过对Twitter上的怀孕妇女透露出的情绪,开发了一种新的算法来预测产后抑郁症的风险。美国地质调查局则可以使用Twitter追踪地震发生地。

  直到目前,多数对相关问题感兴趣的科学家都只能使用有限的Twitter消息。尽管多数Twitter消息都对外公开,但科学家却希望能够随意搜索这些内容,他们目前只能通过Twitter的API(应用编程接口)实现这项功能,但却只能访问1%的数据。

  不过,这种情况很快就将改变:Twitter今年2月宣布,将把2006年以来的所有数据免费提供给研究人员,有望使得Twitter成为一项广受欢迎的研究工具。借助如此庞大的数据,科学家可以展开更加复杂的研究,回答更具体的问题。

  Twitter的这一计划令人兴奋,但也引发了一些问题。Twitter能否对相关科研结果享有任何权益?由于用户未必想将自己的内容贡献给研究人员,因此Twitter的这一工具是否有违道德?

  为了解决这个问题,弗吉尼亚理工大学计算机流行病学家凯特琳·里夫斯(Caitlin Rivers)和布莱恩·刘易斯(Bryan Lewis)今年2月针对Twitter数据的使用方式发布了道德规范。他们建议科学家不要披露相关用户的名称,也不要公布研究目的。

  例如,尽管从公共空间搜集信息并不违反道德,而Twitter也的确是一个公共空间,但在未经他人许可的情况下分享其身份信息却有违道德。里夫斯和刘易斯认为,科学家需要将保护用户隐私列为Twitter研究项目的基本原则——数据越大,责任越大。(樵夫)

时间: 2024-07-29 08:48:54

Twitter开放全部数据的相关文章

淘宝开放内部数据

刘方远 3月31日,淘宝网在上海正式宣布,将面向全球首度开放淘宝数据,商家.企业及消费者将在未来分享到来自淘宝全网的海量原始数据. 据了解,淘宝将除了涉及个人隐私及企业机密之外的交易数据全部对外部开放.数据开放分为三个层次:其一为原始的基础数据,淘宝实行免费开放策略.比如涉及电子商务行业的宏观数据,以及让消费者了解最新消费风向标的数据. 其二为经过简单分析之后的标准化产品,比如涉及各个行业市场情况.消费者行为研究等商业数据,淘宝将通过商业方式开放.据悉,淘宝已于本周尝试推出针对普通 卖家的300

滴滴出行“盖亚计划”开放脱敏数据,举办首届信号灯挑战赛|CNCC 2017

本文讲的是滴滴出行"盖亚计划"开放脱敏数据,举办首届信号灯挑战赛|CNCC 2017, 由中国计算机学会(CCF)主办,福州市人民政府.福州大学承办,福建师范大学.福建工程学院协办的 2017 中国计算机大会(CNCC2017)于 10.26-10.28 日在福州·海峡国际会展中心举办.雷锋网(公众号:雷锋网)作为独家战略合作媒体对大会内容进行了全程覆盖和报道. 10 月 27 日下午,滴滴出行以"人工智能予力智慧出行"为主题进行了一个下午的主题活动及论坛.其中,滴

探访美式微博Twitter的大数据技术架构

  Twitter要上市了,再一次让全球瞩目,正是它所创造的twitte让互联网进入了微创新的时代.虽然它没有进入中国,但受其启发的新浪微博和腾讯微博在中国互联网上也成为一道亮丽的风景.Twitter在全球拥有巨大的用户群,海量的社交信息流,支撑其运转的大数据技术架构也颇受人关注. Twitter的大数据架构也是分为基于Hadoop的批处理和基于Storm的实时流计算等主要类型,主要基于开源项目中进行开发和发展.Twitter收集数据采用的是Facebook开源的日志工具Scribe,批处理地存

中兴通讯:融合 创新 打造绿色开放的数据中心

11月15~16日,由中国工程建设标准化协会主办,中国数据中心工作组(CDCC).综合布线工作组联合承办的"2016中国数据中心年度论坛"在北京新云南皇冠假日大酒店隆重召开.来自Uptime Institute.The GreenGrid(绿色网格).腾讯.百度.阿里巴巴.万国数据等设计院和行业厂商的近70位技术专家应邀在大会上做了精彩的主题演讲.同时,在会议现场,共有数据中心行业的71家企业集中展示了数据中心产品和解决方案. 中兴通讯公司亮相展台和论坛,并荣膺"2016数据

微软推“开放政府数据计划”直指云计算

5月7日消息,微软推出了开放政府数据计划(Open Government Data Initiative,OGDI)并将发布有关的软件套件,以促进政府机构和开发人员在微软的云计算平台Windows Azure上发布和互动(interact)有关数据. 微软公司负责美国公众部门业务的副总裁克尔特·科尔昆(Curt Kolcun)表示:"为了提高服务公民的能力,各个层级的政府机构都希望IT行业能够提供有关技术.微软正在帮助这些政府客户通过信息分享,实现开放政府的目标,其具体办法是扩展政府机构已经拥有

首个生物医疗开放大数据研究中心在沪成立

今天,由华东理工大学信息学院.梅斯医学主办,主题为"开放·链接·服务"的2016生物医疗大数据研讨会暨华理-梅斯生物医药开放链接大数据研究中心成立仪式在华东理工大学举行,来自复旦大学.交通大学-耶鲁大学联合生物统计中心.中科院系统生物学重点实验室.曙光医院.万达信息等高校.科研机构.医疗机构和企业的300余位专家学者与会,围绕大数据开放与共享.数据关联,大数据关键技术与大数据在生物医药行业应用等话题展开研讨. 同时,研究中心还向参会代表赠送了基于RDF(Resource Definit

编写Ruby脚本来对Twitter用户的数据进行深度挖掘_ruby专题

Twitter以及一些API 尽管早期的网络涉及的是人-机器的交互,但现在的网络已涉及机器-机器之间的交互,这种交互是使用web服务来支持的.大部分受欢迎的网站都有这样的服务存在--从各种各样的Google服务到LinkedIn.Facebook和Twitter等.通过web服务创建的API,外部的应用可以查询或是操纵网站上的内容. web服务可以使用多种方式来实现.目前最流行的做法之一是表述性状态转移(Representational State Transfe, REST).REST的一种实

中国开放政府数据平台研究:框架、现状与建议

摘要:依托"开放数据晴雨表"(Open Data Barometer)"开放数据指数"(Open Data Index)两项开放政府数据评估分析框架和和国际评估实践,基于中国国情,建立了基于"基础""数据""平台"三大层面共13个维度构成的评估框架,并对中国多个地方的开放政府数据实践情况进行了比较研究.研究显示,中国开放政府数据实践存在六个方面的主要问题:数据量少.价值低.可机读比例低,开放的多为静态数据,

百度正式开放大数据引擎

4月24日,百度公司宣布正式发布大数据引擎,将开放云.数据工厂.百度大脑三大组件在内的核心大数据对外开放,与百度合作的机构和传统企业将能够在线使用百度的大数据架构,处理自身积累的大数据,或融合百度大数据,来改造和优化传统行业的企业管理.产品服务.商业模式等环节.百度将在政府.医疗.金融.教育等传统领域率先开展对外合作. 开放大数据引擎 在当天百度第四届技术开放日上,百度首席执行官李彦宏重提互联网正在加速淘汰传统产业的观点,并补充道:"互联网几乎首先是颠覆了媒体,后来颠覆了零售,再往后是旅游,再往