23andMe:大数据引发大责任

23andMe是一家谷歌支持的面向消费者的基因检测公司,最近他们宣布将他们已有的海量基因数据应用于药物开发。我想这是一个非常好的主意,但我们要提醒谷歌记住他们的“不作恶”原则。

23andMe是什么?

23andMe提供通过邮件下单的个人基因组测序服务:下了单,你会收到一套试剂盒,用棉棒刮擦口腔上颚提取DNA样本,并寄回给测序公司,然后等待自己的基因检测结果(在线显示)。听起来很炫,不是吗?数据来源形式是一块“SNP面板”,这意味着测试一长串已知的在一般人群中很常见的单核苷酸突变。我们所继承的SNPs的独特模式可以描述我们祖先在世界各地的进化路径,并告诉我们可能携带的或风险比较大的疾病。

我的一个南非同事为了好玩做过其中一项测试。他惊喜地发现他家族中关于他的曾曾曾祖母是黑人的传言是真的,他的整个家族都继承了她的一些非洲黑人的SNP模式。在一次家庭聚会上,在一些令人不快的种族主义亲戚面前,他非常高兴地宣布了这个发现。这些科学证据无疑给了那些种族偏执狂们一记响亮的耳光,呵呵,没有比这更令人高兴的了。

这些数据如何应用于药物开发?

在药物开发领域,一个很流行的实践是:通过DNA测序从一群具有相同疾病人群中寻找出共同的因子,以确定治疗的靶目标。大部分时候,基因突变通过增加、减少或改变特定蛋白的产物引发疾病。明确影响某个蛋白表达的基因的突变给研究者提供一个靶点。然后他们能够尝试开发药物替代缺陷蛋白,或者阻止它的过分表达或错误表达。接下来,他们能够采用模型生物测试药物的有效性,如通过改变老鼠的基因结构使其携带相同的基因突变。

听起来很科学是吧?这种药物开发有时候会成功,但是更多的时候是失败,导致药物开发非常昂贵。制药公司存在的很多问题都源于这样一个事实: 药物开发是一个令人难以置信的昂贵和风险极高的事业。这导致了 “绑架信息”的行业氛围,阻碍了医学发现的共享。23andMe可能会改变这一局面,把信息共享的力量还给公众。当然,他们也可能会成为其他像葛兰素史克一样封闭的公司。

23andMe介入药物开发是好事吗?

我并不同意这一观点,即医药公司必然是“邪恶”的 - 但他们的行业的特性使得他们在盈利的时候兼顾道德几乎是不可能的。开发一种药物,平均而言,大约需要15年,耗资20亿美元,才能把它推向市场。按照法律规定,一个公司新药的专利保护只有五年,之后药物进入非专利保护的一般生产。在这些苛刻的条件下,企业如何能够盈利?他们或者在五年中拼命提高药价,或玩一些其他花样,如每4.9年召回'有问题'的药物,然后以不同的名称重新包装上市。

如果我们想要得到免费的信息和负担得起的药品,药物开发应留给各国政府和慈善机构,而不是企业。或者,你可以利用社会的头脑众筹来做这个事情。广大人民群众是个巨大的智力资源,具有难以估量的计算能力。目前已经有一些非常成功的智力众筹的例子:

- Galaxy Zoo 该项目让广大市民从望远镜和卫星图片中帮助分类数以千记的星系。电脑做这种工作不给力,而广大群众的头脑风暴推进了项目,并得以跨越式发展(漂亮吧!)

- The Yellow Card Scheme (黄色卡片计划),使人们能够自我记录报告任何药物的不良反应。成千上万的人填写卡片,详细记录了他们那一天吃了什么东西,他们是如何用药的,这些详细信息使我们可能发现一些以前很多年都没有注意到的重要发现,比如在服用某些药物时,饮用西柚汁是危险的。


西柚汁的某些成分能影响一些药物在人体内的代谢效率,进而影响药物剂量的有效性

我喜欢把科学交回人们手中的想法,它不应该被笼罩着神秘的面纱。科学不只是属于寥寥几个头发凌乱的天才 - 不管是谁,只要他有意解决问题,就可以推动科学前进。 23andMe公司有机会从大众手里获得极其丰富的数据,在科学发现上作出前所未有的贡献。我希望他们选择保持低调:越来越多的人会贡献和参与他们的项目,使更丰富的数据集成为可能。

自我报告数据集,会带来一些偏差。你能记住,你的姑妈是死于中风或动脉瘤?你究竟是否清楚你的大家庭的家族遗传关系?任何这种大规模的数据集都会出现可靠性问题。我认为,来自公众的公开报告数据和科学分析结合得越紧密越好。处理大数据时,强大的分析和自我报告产生的偏差都是大问题, 搞不好会导致虚假的相关分析和结果。除此之外,这些23andMe的测试结果还会带来另外的偏差:他们没有测试全基因组,甚至没有检测大段DNA的的突变。所以,利用该项目的数据我们虽然有可能找到一些新的药物靶标或未知的相互作用,但我们对结果需要谨慎对待。一个突变的存在或不存在仅仅是预测疾病的第一步:一个小的突变的表现型效应,像导致镰状红细胞疾病的突变那样,可以是非常难预测的,因为它依赖于一系列在基因、细胞和环境等不同水平的相互作用的因素。

大数据引发大的责任。我将继续跟踪23andMe,也许我还会买他们的测试盒 !不过,更多的数据可能来自政府牵头的巨资项目,虽然现在还是未雨绸缪阶段:比如100,000基因组计划( 小编注:100000基因组计划是英格兰政府的一个基因组计划,准备测100000个基因组

原文发布时间为:2015-04-16

时间: 2024-10-25 07:41:15

23andMe:大数据引发大责任的相关文章

韩亦舜:大数据、大挑战、大责任

我们先来看看大数据与大挑战. 在座的有谁11.11的时候参加过"剁手党",买过东西?双十一让我们爱恨交加.我们来看这两张图,一张是春运,一张是十一黄金周. 黄金周和春运带来的问题大家都有了解. 再来看看这张图. 为什么这个时候拿出这样一张图来看?一个是时尚的网上采购,一个是那么拥堵的线下行为,有联系吗?有!我们应该想一想,这两个线上线下看似无关的事件,背后是资源的不均衡利用和商户的不当得利.春运的时候大家都希望用最短的时间回到家,但是最后导致社会资源的不均衡.十一黄金周集中出行有这个问

大数据引发App应用市场巨变

正如马云所说,很多人还没搞清楚什么是PC互联网,移动互联来了,还没搞清楚移动互联的时候,大数据时代又来了. 2015年,大数据时代气息浓厚.利用大数据的分析和预测,电商们正在为用户进行深度画像开展精准营销,让15分钟送货上门成为现实:结合大数据分析,互联网金融企业捕捉来自大众点评.豆瓣等社交网络的有效信息,多维度分析借款客户信用情况,提高自身风控能力.此外,大数据应用还将触角延伸到教育.医疗.交通.制造.影视.政府等领域-- 如此有爆发力的大数据应用,2016年将去撼动何方呢?自阿里提出PP助手

大数据引发的安全性革命:在数字化世界进行身份管理(1)

现如今,数据正以指数级增长.有专家最近 提出,其增长率相当于在国际象棋棋盘的第一格放置一粒大米,第二格放置其个数的平方粒米,第三格放置其个数的三次方粒米.当放置到第64格时,最后一格的米粒数量将相当于全世界水稻年产量的一千倍.498)this.width=498;' onmousewheel = 'javascript:return big(this)' style="width: 320px; height: 187px" border="0" alt="

大数据意味着大责任

现在大数据已经变成了媒体们大肆炒作的对象.凭借着超快的速度对大量信息进行处理的能力,已经开始颠覆全球各地的商业模式.但是大数据和所有的技术一样,同样也会带来风险.所有的技术使用者都应注意:大数据意味着大责任. 近期我与他人联合主持的一项研究得出结论:仅仅使用公开的Facebook"赞"(Like)信息,也能瞬时生成极为详尽的用户心理-人口特征资料,包括种族.性格.智商分数.幸福感.药物使用.性取向.政治观点和宗教信仰等有效的个人统计信息. 一旦掌握了数据,便不难建立起能够自动更新的模型

CIO应思考如何让大数据产生大价值

根据IDC的一份名为"数字宇宙"的报告,预计到http://www.aliyun.com/zixun/aggregation/33722.html">2020年全球数据使用量将会达到35.2ZB.在如此海量的数据面前,处理数据的效率就是企业的生命. 然而,一些企业的CIO们还在观望和质疑--大数据是不是真的来了. 从海量数据到大数据的发展过程是一个从量变到质变的过程.数据发展已有多年,每年都以翻倍的速度在增长.过去增长以往的技术能够对它比较好的管理,但一旦到达一个临界点

未来每个人都将成为IT人 大数据孕育大机遇

2012年,科技成果异彩纷呈:从"上帝粒子"到"好奇"号火星探测器:从谷歌眼镜到无线充电再到3D打印机--人类对宇宙和世界的探索不断突破极限,人们的生活和生产也越来越智能和高效. 海量信息汹涌来袭,IT业继续孕育颠覆性变革.云计算催生大数据,大数据将带来大商机.根据国际数据公司IDC预测,云服务.大数据.移动.社交,将成为2013年科技发展的大趋势.也许,在不远的将来,数据可以改变一切:也许,每个人都将成为IT人-- 当你走进一家陌生的小咖啡馆时,耳边响起只有你才熟

品《阿里巴巴大数据实践-大数据之路》一书(下)

今天继续谈阿里的这本书,包括数据服务平台.数据挖掘平台.数据建模.数据管理及数据应用,希望于你有启示. 1.数据服务平台 数据服务平台可以叫数据开放平台,数据部门产出海量数据,如何能方便高效地开放出去,是我们一直要解决的难题,在没有数据服务的年代,阿里的数据开放的方式简单.粗暴,一般是直接将数据导出给对方,我想,现在大多公司的开放应该也是如此吧,虽然PaaS喊了这么多年,但真正成就的又有几个? 即使如阿里,在数据开放这个方向上的探索和实践,至今也有7个年头了,任何关于数据开放毕其功于一役的做法都

IBM最新调研表明:大数据等于大回报

文章讲的是IBM最新调研表明:大数据等于大回报,近日,IBM在全球发布了针对大数据分析的最新研究报告<分析:价值的蓝图>.报告表明,当前,全球领先的企业和组织中,将业务分析的首要价值定义为"增长"或"创新"的超过75%.其中三分之二的企业和组织认同"政策"或"执行"是阻碍价值最大化的最重要因素. 值此,IBM商业价值研究院在全球共进行了五次关于"分析的采纳和运用"的调研.在本次调研中,IBM发现

大数据就是大市场和大业务

2012年全球科技企业在大数据市场的营收排名榜(腾讯科技配图) 北京时间2月18日,美国科技博客网站SiliconANGLE.com创始人约翰-法瑞尔(John Furrier)在<福布斯>网站上发表文章指出,大数据目前是全球科技领域最热门的市场.对于企业来说,能够越早认识到并率先敞开怀抱迎接大数据时代的来临,它们进行创新.提高自身业务灵活性以及提升利润的机会就越大. 以下是内容全文: 我们都已经看到,大数据正是目前全球科技领域最热门的市场.从大数据开始逐渐兴起时,我就一直关注着该市场的发展趋