数字医疗正在变革我们对疾病的认识,图片来源forbes。
2016年,世界超算大会(International Supercomputing Conference)公布了全球超级计算机排名,中国“神威•太湖之光”首次超越天河二号,成为世界第一的超级计算机,此次中国入围的超级计算机也首次超越美国,一时间这则振奋人心的新闻在朋友圈被刷屏。
人们追求越来越快的计算速度的背后,是我们日益增长的数据。面对如此复杂、庞大以及非结构化的数据,如果没有超级计算机来进行处理,我们很快会被淹没在毫无意义的信息汪洋之中。
2012年,在奥巴马的国情咨文中,大数据被重点提及,吸引了人们的高度关注。尽管大数据的拥趸很多,但对于它的概念,不同的人会有不同的理解。如下为2012年美国国会对大数据的定义:大数据是指多维度、复杂多样的数据,需要先进的技术进行获取、存储、分布、管理以及分析。
大数据很快就进入应用领域,很多公司都在拥抱它带来的数字或信息变革。在数学、物理、生物以及工程等领域,大数据扮演的角色愈发重要。在我们日常生活中,也会产生大量的数据,例如通过手机、智能手环以及其他可穿戴设备,每天都会产生大量的数据。通过对这些数据的分析,未来我们可预测健康或疾病,它将在医疗领域发挥重要作用。
大数据如何变革医疗
根据美国麦肯锡的一份报告显示“技术的发展正在变革我们的理解以及疾病的治疗”。2011年,美国医疗健康数据高达150eb,这一数字很快就会达到zb级别甚至yb级别。医疗数据正在快速地积累。
在传统的医生问诊环节中,医生在每一个患者面前的时间可能仅仅只有10分钟左右,但传感器以及移动健康APP能忠实地监控你过去一个月或一整年的健康信息,通过分析这部分大数据,医生很快就能做出趋向于正确的决策。这种基于综合数据获得的判断,准确率要远高于人类医生。美国食品与药品监督管理局(FDA)也向这一领域开绿灯,批准对人体血糖进行监控等相关设备。
尽管每年制药公司在医药研发领域投入巨资,但摆在眼前的是,他们仍无法充分了解我们的疾病以及获取足够多的有价值的信息,如果他们能够获取患者的DNA、蛋白质、代谢途径甚至细胞、组织、器官以及整个人体系统的信息,那么进行个性化治疗将会变得容易许多。当然获取这些数据的前提是,尊重患者的隐私。在未来,患者会携带好自己的医疗或健康大数据,参与到制药公司的药物研发中来,届时药物的研发将会越来越个性化。
通过大数据分析,能够帮助我们更早地发现疾病,并通过已有的数据,分析或预测未来疾病的发展状况。麦肯锡的一份报告显示,通过大数据分析,可每年为美国节约3000亿美元的医疗支出。
大数据将如何变革个人的生活
大数据不仅可用于疾病诊断和个性化治疗,还可应用于日常生活的不同场景,提升个人生活质量以及健康。传统的可穿戴设备,只是获得数据,而在未来通过智能手环或APP,可以为我们提供个性化的运动方案。例如,智能手机运动APP不仅能够记录我们每日行走的路程,同时还可以根据我们身体的健康信息,摄入的卡路里来提示我们每天应该要完成多少运动量才能保持健康。这会是可穿戴设备一个质的提升,可穿戴设备会是未来医疗数据采集的一个重要途径。
一款智能的、具有颠覆性的菜谱同样也会带来健康的变革
个人健康指数的上升,意味着我们可以将更少的钱花费在医疗上,这可能是大数据带来的福祉。以健康饮食为例,菜谱APP一直是家庭男女们的最爱,未来当菜谱APP与可穿戴设备结合起来,可根据时令、年龄、性别来提供吃什么食物的建议。它不仅能实时定位我们的地理位置,帮助我们寻找物美价廉的餐厅,同时也能推荐不同餐厅特色的营养菜谱。当我们在可穿戴设备上输入当前的健康指数,如BMI指数、腰臀比、血压、胆固醇指数等数据时,菜谱APP就可为我们提供有价值的、健康的膳食建议。例如,对一个胆固醇高的人,菜谱APP不会向他们推荐动物内脏,如含心、肝等食物,对于糖尿病患者,它也不会向他们推荐含糖量高的食物。它还可以根据身体特征来提供饮食建议,如果近期你的运动量比较大,在后台一直默默工作的菜谱APP根据你的运动量,会为你推荐一些热量比较高的食物,从而让你保持活力。
不过目前,通过现有的可穿戴设备或者移动APP,我们仍难以从中找出个人健康与疾病之间的关联,因为数据分析难以准确构建这些错综复杂的关系。例如,谷歌有一款隐形眼镜,可通过检测眼睛中的泪水,判断身体的血糖等指标,但这一技术目前尚未成熟,仍然属于“华而不实”的技术应用,仍有许多技术鸿沟需要逾越。
连接数据与健康间的鸿沟
数据与健康二者之间有何关系,首先摆在眼前的是:数据计算。传统的计算方法难以处理如此庞大和复杂的数据,这些数据既有实验室产生的数据,也有患者的影像数据以及电子病历数据(electronic patient records ),如何从这些错综复杂的数据中挖掘与健康之间的关联,将会是一个难上加难的问题。这也是本文前面提及为什么人们在追求越来越快的计算速度的原因。
作为互联网搜索引擎的巨头,谷歌和微软积累了庞大的数据,未来我们不仅可以在搜索引擎上获取信息,同时也能够更加精准地寻找到健康信息。利用医疗大数据来诊断疾病,IBM的沃森显然走到了这个领域的前沿。自2011年 Jeopardy!节目出现之后,IBM就将医疗视为未来一个主要发展的方向,目前,IBM已投入10亿美元,将研发团队1/3的成员纳入到这个研究组项目中。
实际上,沃森是一个智能的系统,使用自然语言、机器学习以及实时计算将庞大的、非机构化的数据进行处理,它可以通过经验和指示进行学习,类似人类那样进行思考。研究者通过大量的电子病历数据,甚至是教材中的知识输入,使其成为一个超级疾病诊断工具。
虽然在这一领域,还有微软的Cortana,苹果的Siri以及谷歌的Google Now,但认知计算仍只是初步发展阶段,IBM也是目前唯一一家使用大规模认知计算的公司。由于它们在预测以及疾病诊断上比人类更加具有优势,因此该应用会是医疗大数据未来一个非常具有前景的方向。
上海医疗大数据布局:从样本、队列研究到深度挖掘
上海正在建设具有全球影响力的创新中心,在医疗大数据方面自然也有布局。2013年,上海发布“推进大数据研究与发展三年行动计划”。该计划指出,“在健康信息网已有数据的基础上,汇聚整合医疗、药品、气象和社交网络等大数据资源。”从而形成智能临床诊断模式,自助就医模式等服务模式创新,为“医疗资源配置、流行病跟踪与分析、临床诊疗精细决策、疫情监测及处置”等方面提供帮助。
这些行动落实在具体项目上,可归结如下。2006年,上海医联工程就已正式启动,该项目是国内第一个大型跨医院区域医疗信息中心,拥有统一的技术标准,覆盖了上海市34家三级医院以及18个行政区。项目由上海瑞金医院、上海市第六人民医院,儿童医院等单位牵头,围绕高血压、糖尿病、肿瘤、儿童呼吸系统疾病等常见疾病开展大数据研究,并依托交大-耶鲁生物统计联合中心进行医学生物信息挖掘和分析。目前已建成了国内生物样本量最大的医疗健康信息库,拥有9.1亿个处方医嘱,诊疗事件拥有2.1亿,医学影像138Tb,检验报告9000万份。生物样本库以及医学诊断和影像资料是数据驱动医学变革的关键。
另一个大型项目是泰州队列研究,该项目由复旦大学等单位牵头,于2006年北京香山会议上,由陈竺、沈晓明联合发布,旨在通过宏观医学与微观医学的整合,大规模前瞻性队列研究,源源不断地产生有价值的医疗数据。
在医疗数据分析以及深度挖掘上,上海产研院正在筹划建立一个以医生和患者临床治疗体验为驱动,以生物医学大数据分析、知识库体系决策为主导、个性化用药为出口的一体化临床转化服务平台。未来该平台会利用深度学习、生物信息数据分析以及信息挖掘技术,处理医疗大数据。这既是精准医学的一部分,也是数据驱动医疗变革的一次创新。
不过我们必须承认,目前包括IBM在内的数字医疗项目,虽然雄心勃勃,但我们仍很难将大数据变成一个大发现,我们还将面对数据的权属、隐私、保护以及公开等问题。随着IBM的沃森机器人的崛起以及法律制度的健全,相信不久的将来,我们定会连接起医疗信息与疾病之间的鸿沟。
本文作者:纪十
来源:51CTO