首届开放科学奖|6个创造性案例示范如何玩转医学大数据

导读:生物医学已经并且正在产生海量的数据。对这些数据的开源和利用将产生巨大价值。首届开放科学奖(Open Science Prize)正致力于找到开发利用这些数据的好点子。该奖项自去年10月发布后,接收到了来自45个国家96支队伍的参与。昨天,专家小组宣布了六个进入决赛的名单,从模拟果蝇大脑、病毒传播可视化、到创建罕见病基因库,让我们看看这些进入决赛的队伍是如何玩转生物大数据的。

◆ ◆ ◆

关于开放科学奖

生物医学研究产生了海量数据。许多《IEEE综览》(IEEE Spectrum是电气电子工程师学会发行一个杂志,是电气电子工程师学会的旗舰级出版物,致力于探索前沿科技的发展实现与应用——译者注)所关注介绍的诸如传感器、机器人及其它相关技术会产生出太字节(terabyte, 240字节——译者注)至拍字节(petabyte,250字节——译者注)的数据,而这只是在世界范围内所存储的健康信息容量中微不足道的部分。

 

如今,三家投资机构正在努力刺激工具和平台的开发,来提高研究者获取和使用这些数据的能力。在华盛顿特区举行的第7届医疗数据研讨会上,(美国)国立卫生研究院(National Institute ofHealth,简称NIH)、总部在英国的威康信托基金(Wellcome Trust)以及霍华德•休斯医学研究所(Howard Hughes Medical Institute)宣布了首届开放科学奖(Open Science Prize)的6支决赛队伍名单。

 

开发这些类型的工具的部分问题是没人知道谁该为它们负责。(美国)国立卫生研究院的数据科学副主任菲利普•伯恩(Philip Bourne)说:“数据的产生是全球性的,但是数据本质上是由国家管理和资助的。

去年10月发布后,来自45个国家96支队伍参加了这个比赛。昨天,专家小组宣布了六个进入决赛的名单,他们将获得8万美元的资助,在接下来的六个月里继续开发他们的原型。

 

好了,不多说了,让我们看看这些进入决赛的队伍是如何玩转生物大数据的:

 

◆ ◆ ◆

MyGene2

罕见疾病并不是你所想象的那么罕见。如今,在美国有超过6千种已知罕见疾病发生在大约2千5百万人的身上。但是,超过一半的家庭经历了基因检测而无法确诊为疑似的罕见疾病。一个名为MyGene2的网站(https://www.mygene2.org/MyGene2/)给家庭和临床医生带来一个分享关于罕见疾病的健康和基因信息的地方,以此来推动检测和发现引发疾病的新的罕见情况和基因。

▲MyGene2页面-根据基因或者家庭ID进行搜索

每个(疑似)罕见疾病家庭信息库都涵盖了故事-健康信息-基因数据-联系方式等资料。其中,故事部分介绍包括照片,患者基本情况,和一个有血有肉的真实故事。以96号家庭为例,作者生动地叙述了自己的女儿Ava患病及被确诊的整个过程。

 健康信息则包含了这个家庭成员包括“发热”“出汗”“头疼”等一系列病症的信息。

基因数据部分则可以根据” Inheritance Model”和” Confidence in Pathogenicity”的不同维度生过滤生成报告,发现这个家庭的candidate gene。

◆ ◆ ◆

Nextstrain

为了干预和阻止流行病的爆发,科学家们需要尽快得到来自病原体的基因数据。Nextstrain项目从世界各地的研究团体聚集了大量的基因数据近乎实时地进行了病毒传播的可视化。例如,可以查看一下他们关于目前寨卡病毒(Zika virus,http://nextstrain.org/zika/)演变的图片。

这一交互可视化作品记录了从2014年11月到现在Zika病毒的时时变化情况。可以按照“地理位置”和“样本时间”两种维度进行划分。

◆ ◆ ◆

OpenAQ


根据世界卫生组织(World Health Organization)的说法,空气污染是导致8分之1全球死亡病例的罪魁祸首,然而空气质量数据一直被存储在不起眼的网站上,难以访问,同时格式也不一致。OpenAQ平台(https://openaq.org/#/)原型将数据进行了合并和标准化,成为公众可得、实时的空气质量数据。它已经收集和分享了来自13个国家500多个地点的970万空气质量检测数据。

你可以通过地图查看全球各国的Pm2.5数值。

当然也可以直接用代码拿走你需要的城市和国家的API原始数据。


◆ ◆ ◆

Brainbox

能从互联网上得到的脑成像数据量是难以置信的。相对于其它类型的数据,神经成像数据需要更充足的人力,例如:策划和编辑图像。Brainbox是一个在线实验室,它被设计成方便研究人员访问的脑成像数据库(特别之处是无需下载),并启用分布式协作让每个人能分享努力。(https://www.openscienceprize.org/p/s/1838127/)

◆ ◆ ◆

NeuroArch

尽管在映射整个人类大脑上付出了巨大的努力,一个更短期的目标是映射一个更小的大脑,比如果蝇的大脑,它有着超过70%的涉及人类脑部疾病的类似基因。果蝇大脑瞭望台项目(Fruit Fly BrainObservatory project,https://www.openscienceprize.org/p/s/1998747/)将开放一个名为NeuroArch的开放图像数据库平台,这个平台存储和处理跟果蝇大脑有关的信息,包括位置、形状、每个神经元的连接。

在一个地方存放所有这些数据,可能形成一个模拟的果蝇大脑,在通过遗传或给药进行修改时,可以看到发生的相关变化。

◆ ◆ ◆

OpenTrialFDA

当美国食物和药品管理局(U.S Food and Drug Administration)批准一种药物时,该机构公开发布一系列关于该药物的信息,通常包含先前未公开的临床试验。尽管这些信息相当有价值,但难以获得、收集和搜索。OpenTrialFDA努力建立一个用户友好的网站界面让任何人能访问相关信息,还提供应用接口(API),允许第三方平台接入和搜索数据。(https://www.openscienceprize.org/p/s/1844843/)

原文发布时间为:2016-05-19

时间: 2024-10-31 09:15:50

首届开放科学奖|6个创造性案例示范如何玩转医学大数据的相关文章

6个创造性案例示范如何玩转医学大数据

导读:生物医学已经并且正在产生海量的数据.对这些数据的开源和利用将产生巨大价值.首届开放科学奖(Open Science Prize)正致力于找到开发利用这些数据的好点子.该奖项自去年10月发布后,接收到了来自45个国家96支队伍的参与.昨天,专家小组宣布了六个进入决赛的名单,从模拟果蝇大脑.病毒传播可视化.到创建罕见病基因库,让我们看看这些进入决赛的队伍是如何玩转生物大数据的. ◆ ◆ ◆ 关于开放科学奖 生物医学研究产生了海量数据.许多<IEEE综览>(IEEE Spectrum是电气电子

深圳立法开放病历引热议:看美国如何“玩转”医疗大数据

上周,<深圳经济特区医疗条例>(俗称"深圳医疗基本法")全文披露.该条例要求医院要向患者公开全部病历.然而,就全国而言,关于医疗大数据的隐私保护.开发与应用的法律仍存在空白. 近日,松禾资本精品论坛之"医疗大数据&智慧医疗"在深圳举行.松禾资本创始合伙人厉伟在为活动致欢迎辞中表示,现在各个单位.各个机构都在做大数据,但是如何让大数据共享.串起这些数据孤岛,是下一步推动精准医疗.智慧医疗的关键. 本文为上述论坛的演讲实录,较速记稿略有删改.本文作者

杉数科技CTO王子卓:4大案例告诉你,如何用机器学习玩转企业大数据 | 硬创公开课

在上一期雷锋网AI掘金志硬创公开课<十大场景案例详解:人工智能如何提升商业效益>中,我们通过案例详细介绍了AI用于商业实战中的场景和效益.而为了真正帮助推动AI落地,我们将带来更多场景单点技术干货分享,以飨读者. 因此,本期公开课,雷锋网邀请到杉数科技CTO王子卓博士来进行主题为"如何利用机器学习做运筹优化与智能决策"的分享. 以运筹优化与智能决策为例,王子卓表示,大数据要产生实质价值,必须真正提升决策质量.规律性分析能够从海量数据中发掘出规律,但是找到规律并不自然而然带来

案例分享:康诺云——医疗大数据里的学问

康诺云是一家致力于在医疗大数据领域创业的初创公司.通过给用户提供http://www.aliyun.com/zixun/aggregation/12034.html">可穿戴式设备,连续记录用户的体征数据(比如血压.心率.血糖等),然后将这些数据发送到云端,然后通过云端的算法对这些数据进行分析,得出用户自身的连续体征波动规律,当波动出现异常时则会有预警出现. 在今年5月份,小编曾有幸采访到了康诺云创始人之一康辉,但由于各种原因,采访内容一直未刊登.今天重新翻出当时的采访记录,发现其中有很多

首届中国数据标准化及治理大会落幕 大数据基础能力建设方兴未艾

2016年11月6日,"首届中国数据标准化及治理大会"在清华大学圆满召开,国内外200多位各界代表参加了本次大会,共襄盛举.与会嘉宾围绕数据标准化及治理展开了热烈的讨论和交流,共同呼吁社会各界积极参与数据标准的制定和推广落实.会上,中国电子技术标准化研究院.清华大学数据科学研究院.国际数据管理协会中国分会(DAMA China)三方签署了数据标准化及治理的战略合作协议,对于国家大数据标准化的试验验证和应用推广做了明确的规划,共同推动形成大数据标准化的产业生态环境."清数DAM

大数据如何改善社会治理:国外“大数据社会福祉”运动的案例分析和借鉴

一.背景 今年,国务院印发<促进大数据发展行动纲要>明确指出大数据将成为提升政府治理能力的新途径,提出:建立"用数据说话.用数据决策.用数据管理.用数据创新"的管理机制,-,推动政府管理理念和社会治理模式的进步. 与此同时,国外学术界和政府管理部门近年来也发起了一项"大数据社会福祉"(big data for social good)运动.与我国的目标相似,该运动也尝试将大数据技术与社会治理相结合,以数据驱动的方式应对现代社会中面临的一些复杂问题,增进社

大数据产业呼唤开放共享

在我国,大数据产业要想有更好更快的发展,一方面必须努力提供良好的法律环境,另一方面则要增强政府及企业开放.共享基础设施与数据资源的意识,摒弃"地方保护主义"和"自我保护主义" 当前,新一轮科技革命和产业变革席卷全球,大数据.云计算.物联网.人工智能等新技术不断涌现,数字经济正深刻改变着人类的生产生活方式,成为推动经济发展的新动能. 有研究显示,我国的数据总量正以年均50%以上的速度持续增长:预计到2020年,在全球的占比将达到21%.在我国,数据分析等技术已在网络社

甲骨文喻思成:大数据方案需要全面集成开放

[天极网服务器频道4月23日专稿]大数据的应用前景之广大已经毋庸置疑.企业CEO.CIO在讨论商业策略.IT模式创新时几乎言必谈大数据.Gartner发布的<Big Data Drives Rapid Changes in Infrastructure and $232 Billion in IT Spending Through 2016>(<大数据驱动基础架构的快速变化,2016年相关IT支出将达2320亿美元>)报告指出,2013年大数据带动的IT支出有望达到340亿美元;到

4大案例分析金融机构的大数据应用

  就"大数据+金融"思维利用而言,国外金融机构有着十足丰富的体现,已经将大数据技术在风险控制.运营管理.销售支持及商业模式创新等领域进行了全面的尝试. 案例一:汇丰银行-风险管理 汇丰银行在防范信用卡和借记卡欺诈的基础上,利用SAS构建了一套全球业务网络的防欺诈管理系统,为多种业务线和渠道提供完善的欺诈防范.该系统通过收集和分析大数据,以更快的信息获取速度挖掘交易的不正当行为,并迅速启动紧急告警. 案例二:Kabbage-开辟新商业模式 Kabbage主要为网店经营提供贷款服务的金融