医疗大数据的“苟且”与远方

 

 

编者按:2016年6月8日国务院总理李克强主持召开国务院常务会议,确定发展和规范健康医疗大数据应用的措施,通过互联网+医疗更好满足群众需求。2016年6月21日,经李克强总理签批,国务院办公厅日前印发《关于促进和规范健康医疗大数据应用发展的指导意见》(国办发〔2016〕47号文件)。医疗大数据产业或将迎来史上最重要的一次爆发机遇。当然,机遇与挑战永远并存,现实的障碍和困惑着实令人有些无从下口之感。

“我希望能和互联网创新公司合作,来打造一个‘临床遗传机器医生’,解决罕见遗传病的诊断难题,当然这还需要基因测序公司和临床遗传学家的参与。只要你输入收集到的各种基因型和表型,‘临床遗传机器医生’就可以马上帮你做出准确的诊断,并为下一步的处理给出最合理的建议和提示。”

今年年初,上海市第一妇婴保健院院长段涛在他的个人微信订阅号“段涛大夫”里面,发布了一篇院长日记《令人失望的互联网创新》。上面那段话是这篇文章的结尾,也是段涛提出的一个挑战,希望那些有创新基因的公司能够完成这个挑战。

春雨医生CEO张锐也曾在自己的朋友圈里表态:“段院长的挑战,春雨来接!”张锐认为:“未来三年,是AR和生物医学工程聚合、裂变的大好时机。技术的创新才是源创新,春雨一直在做‘人脑训练电脑’的浅层医学人工智能,应用在我们的用户自诊和智能分诊两个板块,每年节约我们的人力成本不低于1000万,现在是时候朝着更专业的医疗纵深挺进了!”

  这场隔空对话,展示了医疗领域中最先进的头脑对医疗大数据未来应用的想象。

确实,当AlphaGo大放异彩时,人工智能确实带给各个领域太多想象空间。尤其是在医疗领域,当Watson机器人在疾病诊断领域的能力已经可以媲美普通医生,它也许值得人们付出更多的金钱、精力以及激情去做更多探索。

故 事

版 本 一

医疗人工智能的基础,是医疗大数据的挖掘和应用。有关医疗大数据,这是这几年互联网医疗领域流传最广的故事。虽然每一家创业公司的模式千差万别,但无一例外都会有一条:对大数据的挖掘和应用,虽然关于如何实现的部分往往语焉不详。这充分反映了两个问题:所有人都意识到了医疗大数据开发的价值,但开发的路径却难度很高。

于是,我们听到的第一代医疗大数据的故事就变成了以下这个样子:

▍有关数据来源

中国互联网医疗可以说是白手起家,至今为止仍然不受传统医疗体系待见。所以,早期的医疗大数据基本上都只能来自互联网医疗公司自身的积累。这里的“早期”既指时间上的早期,又包括开发思路上的早期。那么,早期的数据来源大概有这么几类(欢迎补充):

在线咨询类公司——这类公司既有综合型的,又有垂直型的。数据积累的方式上主要是通过医患在线问诊的方式,建立患者个人的电子健康档案;

智能硬件类公司——纯粹的智能硬件在医疗领域的应用日渐式微,但越来越多的医疗服务开始结合智能硬件,比如血糖、血压、体温、心律等,数据积累方式主要是对用户体征数据的检测;

基因检测类公司——基因检测在近两年日趋火爆,主要是受到检测成本降低和精准医疗的推动,门槛大大降低,使得越来越多的普通用户能够消费基因检测。

科研工具类公司——虽然与医患资源类公司一样是收集患者的疾病数据,但科研类公司收集数据的形式、应用明显不同,科研机构在数据积累过程中发挥了主导作用。

▍有关数据应用

在医疗大数据版本一的故事里面,之所以是早期,主要还是因为开发利用方式的早期。在这个阶段,虽然关于医疗大数据、人工智能已经有了概念,但在此时能接受这样故事的人毕竟还太少,也太遥远。于是,版本一里面应用医疗大数据的方式基本有这么积累:

服务于医疗本身——长期以来,患者个人是不掌握自己的医疗数据的。互联网医疗出现后,用户可以通过手机来收集自己的健康数据,帮助医生更好的了解自身的健康历史;

服务于医药企业——药企对数据的需求既强烈又多元,包括市场营销需求、新药研发需求、应用反馈需求等。因此,鉴于药企买单欲望强烈,很多数据应用商都主动向药企考虑;

服务于保险公司——这一点中美有些差异,美国保险公司对数据的应用主要是对医疗服务质量和费用的控制,而在我国,保险公司对数据的应用则主要是设计新的保险产品。

  ▍有关应用现状

其实在版本一的故事里,已经有一些有了很好的应用效果,比如药物警戒,用医疗数据来弥补临床数据的缺陷,及时反馈药品不良反应、治疗效果等;再比如保险控费,用医疗大数据控制服务质量和费用,控制和减少保险欺诈行为等。这些领域之所有比较好的应用,主要是因为药企和保险公司的商业驱动力更强。当然,这也仅是在美国。

虽然我们前面罗列了不少有关医疗数据的来源和积累,但实际当中,这些案例都或多或少存在着问题。甚至由于这些问题的存在,版本一里面这些比较浅层次的数据应用都还处于非常遥远的阶段。

数据的完整和有效性——互联网医疗毕竟是新兴事物,用户有接受程度和使用习惯的问题,而且硬件设备也存在功能和精准度的问题。这使得数据收集面临着不完整且缺乏连续性的问题,而且大多数硬件设备没有取得医疗资质,采集的数据也无法做医疗级应用。

数据处于割裂的状态——互联网医疗产品主要收集的是患者在医院的健康数据,而对医院内的数据鞭长莫及。加上医院与互联网医疗无法打通,这导致了医疗数据在院内院外割裂存在的状况。而且由于医院本身信息孤岛的问题,患者在不同医院求医的数据也是碎片化存在。

数据规模仍然非常小——作为大数据应用,目前的医疗数据采集规模根本达不到“大”的程度。一个是很多创业公司的数据都是从头积累,再一个是市场认知度仍然有限,最典型的就是基因检测,很多公司的样本量还处在几十个、几百个的水平。这使得目前的医疗数据基本无法实现商业化。

当然还有一个问题,段院长在他的文章里也指出了,就是医疗大数据并没有被认真对待,或者说挂羊头卖狗肉。我国的大多数互联网医疗公司打的仍然是医院号源的主意,仍然是一种快速变现的心态,也无怪乎令人感叹,“我们多数的移动医疗创新公司还在拼命的靠补贴靠地推在拉用户,在做挂号黄牛的生意,真的令人很失望。”

故 事

版 本 二

关于医疗大数据,最令人兴奋的应用无疑还是在临床方面。比如时下最热门的精准医疗几乎火到没朋友。但精准医疗因为相对初级还跟数据应用关系不大,主要是取决于两点:要么是技术上取得特别重大的突破,要么是概念上找到特别唬人的方法。另外一个医疗大数据在临床上的应用,则是临床辅助诊断,或者更遥远一点,人工智能医生。

在临床上发挥机器的作用,首先需要对临床数据的有效挖掘利用。传统的公立医院在这一点上是完全指望不上的,根本原因在于没有任何激励机制的存在。而早期医疗大数据的应用之所以对医院敬而远之,主要是开发难度太高。

受限于信息化程度,医院往往处于信息孤岛的封闭状态,内部信息系统纷繁复杂标准不一,而且有大量的病例数据以纸质状态存在。数据清洗要实现标准化、结构化的难度非常大,而且还需要打通院内院外数据的流动。

当然,这里还必须提到数据安全。美国已经不止一次爆出医疗数据泄露或受到攻击的案例。而来自Ponemon推出的一份报告《2013年数据泄露成本研究》显示,医疗行业的数据泄露成本最高,平均每个患者的医疗信息泄露带来的信息安全管理成本高达233美元,远高于零售业的78美元。而当大量商业公司在明目张胆的打着靠数据赚钱旗号的时候,临床数据的开发确实需要非常谨慎。

新数据来源

不过临床数据开发的迟滞,仍然是造成我们的医疗大数据推进缓慢的一个重要因素。所以,在版本二的故事里,我们看到了已经有创业公司努力在临床数据上进行探索。(欢迎补充)

临床数据的聚合 ——医院内的医疗数据也是分散的,HIS、LIS、PACS等系统里都储存不同类型的病例数据。因为这些系统来自不同厂商,数据标准不一,医院内部也缺乏完整、连续的数据资料。所以,在医院实现数据聚合成为临床数据开发的一个小前提。已经有创业公司在这方面探索,并得到了资本市场的认可。

临床数据的开放——当然还不是公立医院数据的开放,而且公立医院目前的信息系统也很难支持开放。不过,已经有很多创业公司在尝试临床数据开放,甚至直接开办医院、诊所来重构底层信息系统。再加上很多SaaS模式的诊所管理系统的出现,就为医疗数据的共享以及与智能硬件设备的对接创造了条件。

临床数据去中心——很多人相信,医院只是时代的产物,会逐渐消失,所以医疗数据也未必一定要在医疗机构内产生。随着新技术和数据采集方式的进步,包括诊疗数据、研发数据等,都在逐渐突破医疗机构的边界,进入人们的客厅、日常生活。这种数据采集的量和周期,都是医院内数据采集所无法比拟的。

  ▍应用和问题

这些在临床数据开发方面的努力,为未来人工智能的研发创造了可能。恐怕也还只是限于可能,距离真正的应用还有一段距离。当然,在AlphaGo完胜李世石以后,人工智能所展示出的进步速度让所有人惊艳。说不定五年后,机器人医生就真的出现在社区诊所了。但是眼下的问题恐怕还是必须要克服:

数据解读——围棋棋盘的可能性毕竟是可以穷尽的,但目前的人工智能还无法解决未知因素的问题。尤其是在医疗领域,不仅是未知因素的问题,甚至还有无知因素的问题。很多因素不仅医疗数据的采集范围之外,更是在人类的认知范围之外。不要说癌症这种人类尚未攻克的疾病,绝大多数疾病都存在着相当多的未知因素。

数据规模——医疗数据的应用前提条件是数据规模要足够大。其实,这一点中国的情况要比美国好多了。比如说,中国一家三甲医院的数据量几乎抵得上美国一个州的量。但问题是,有能力、有条件、有机会开发应用这些数据的机会太少。财大气粗的保险公司在医院面前都毫无谈判能力,遑论弱小的互联网医疗公司。恐怕只能指望高瞻远瞩的医院院长,发挥鲶鱼效应。

数据监管——对于政府监管来说,医疗数据的应用是个新问题。起码至今,究竟医疗数据归谁所有的问题都没有明确。而一旦医疗数据被滥用,危害是极大的。一个非常简单的道理,你的银行卡密码可以修改,但你的基因信息能修改么?虽然现在对基因的解读能力有限,但是只要样本成功采集一次,就可以无限检测。所以如果你的基因数据泄露了,后果会是怎样呢?

最后,可能还是野心的问题。如果已经收集到了一批数据,马上就能商业变现,就能挣大钱,有几个人还愿意去搞什么人工智能呢?

====================================分割线================================

本文转自d1net(转载)

时间: 2024-09-18 20:28:13

医疗大数据的“苟且”与远方的相关文章

中软国际抢占医疗大数据风口

中软国际医疗大数据解决方案亮相华为ICT巡展,受到市场广泛关注.在国家大力促进健康医疗大数据应用发展之际,作为国内领先的大数据解决方案开发商及供应商,中软国际积极抢占政策风口,展开产业战略布局.医疗大数据领域正在成为中软国际新的经济增长引擎之一. 国家力推健康医疗大数据 在6月17日举行的国务院政策例行吹风会上,国家卫生计生委副主任金小桃透露,<关于促进和规范健康医疗大数据应用发展的指导意见>(以下简称<指导意见>)已经在国务院常务会议上审议通过.我国将以保障全体人民健康为出发点,

医疗大数据是未来

大数据作为一种技术手段,可以将业务和技术结合起来,使得医院.卫生部门.保险公司以及个人都能从中得到相应的价值.医疗大数据是医疗行业的未来,未来肯定是一个智慧医院,数字化医院. 1. 医疗保健行业面临的挑战 (1) 医疗保健的变革  金融风险转移  扩大覆盖范围(ACA)  新产品  付款人和供应商合作 (2) 慢性病的频率和成本都在上升  II型糖尿病  哮喘  心脏病  肥胖现在也被列为一种病 (3) 人口统计与行为  人口老龄化  护理改进/协调  患者/成员参与 

信息加速累积下 医疗大数据存在的几种潜在变现能力

 医疗行业是典型的数据密集型行业,医疗信息数据一直是医疗健康领域最重要的核心.随着数据生成和共享的速度急速增加,医疗数据加速累积.IDC曾预测截至2020年全球医疗数据量将达到40万亿GB,大约是2010年的30倍之多.可以说,信息化和医疗数据的规模和质量推动了医疗健康的进步和发展. 而医疗大数据产业的发展是由价值医疗驱动的,也就是医疗服务质量与医疗成本的双赢,其潜在的价值空间非常巨大.医疗大数据产生于具体的应用场景,服务于居民.医疗服务机构.科研机构.公共健康管理部门,医疗保险管理机构以及商保

深度丨中科院田捷博士:基于医疗大数据和AI技术的影像组学及其应用丨CCF-GAIR 2017

7月9日,在由中国计算机学会(CCF)主办,雷锋网.香港中文大学(深圳)联合承办的CCF-GAIR 全球人工智能与机器人峰会的第三天,在未来医疗专场上,田捷博士做了"基于医疗大数据和人工智能的影像组学及其应用"的主题演讲. 田捷博士,是中国科学院自动化研究所研究员.Fellow of IEEE,SPIE,IAMBE,AIMBE,IAPR.其主要从事医学影像分析与生物特征识别的研究和应用的工作.田捷博士的很多学术论文.研究成果,均可见自国内外的各学术杂志和学术会议上,学术论文达上百篇.

浅谈医疗大数据面临的技术挑战

医疗大数据的本质是数据.在医疗行业,医生的诊治是一个过程,需要将患者疾病状态或治疗过程记录下来.由于医生对疾病的认识不同,因此所记录的"事实"会有所不同,特别是缺乏经验的医生,经常会忽略记录重要的病历信息,可能因此出现数据丢失,也可能导致所记录的数据没有准确地反映出客观的事实. 医疗大数据 大数据时代,数据来源于外部,不由自己把控.如果获取的是不真实的数据,无法得出有价值的结果,更多情况下可能是误导.所以,一定要认识到,数据并不是越多越好,数据质量非常重要,把握数据的含义也非常重要.

医疗大数据趋热 十大细分产业蓄势待发

11月2日-3日,"首届中国医院能力建设与发展暨健康医疗大数据应用发展大会"在北京召开,本次会议由国家卫生计生委能力建设和继续教育中心主办,主要聚焦中国公立医院院长职业化建设与健康医疗大数据政策设计与制度安排.会议期间,广东省人民医院党委书记耿庆山分享了"基于大数据的未来医学",在其看来,量子计算.人工智能.医疗机器人.3D打印等十大技术领域都将成为未来医学的重要发展方向. 据了解,未来量子计算在医疗领域的应用主要是服务于大数据下的精准医疗发展.耿庆山表示,精准医疗

李克强:发展医疗大数据已迫在眉睫

国务院总理李克强6月8日主持召开国务院常务会议,部署实施健康扶贫工程,提升农村贫困人口医疗保障和健康水平;确定发展和规范健康医疗大数据应用的措施,通过互联网+医疗更好满足群众需求;决定建设福厦泉与合芜蚌两个国家自主创新示范区,引领带动体制创新和科技创新. 在李克强总理的大力推动下,"大数据"正在深入每个老百姓的日常生活.6月8日,李克强总理主持召开国务院常务会议的一个议题,就是确定发展和规范健康医疗大数据应用的措施,通过互联网+医疗更好满足群众需求."我们要发展健康医疗大数据

如何唤醒沉睡的医疗大数据?

本文讲的是如何唤醒沉睡的医疗大数据?[IT168 评论]近年来,很多国家都在积极推进医疗信息化发展,在临床辅助决策.医疗质量监管.疾病预测模型.临床试验分析.个性化治疗等方面的应用,大数据都将发挥巨大的作用.然而随着医疗信息化进程的加快,医疗行业早就遇到了海量数据和非结构化数据的挑战.尽管我国拥有海量的大数据,但缺乏有效的加工分析能力.我国在医疗大数据方面的发展并不乐观,医疗大数据的利用率仍然很低. 由于数据的来源依旧十分复杂,不同地区,不同医疗机构,不同计算平台所提供的数据并不具备完全真实的参

移动医疗大数据,掘金在何方?

ZDNet至顶网服务器频道 05月14日 新闻消息:现有的医疗体系广受诟病,众多互联网巨头纷纷紧盯,用户对医疗业的需求量庞大,移动医疗成为移动互联网重要的入口之一.2014,作为国内移动医疗发展的元年,2015,移动医疗如何落地与规划发展,一瞬间变成了整个互联网行业的焦点.  而对于移动医疗大数据,却是谈得多,见得少.究竟在未来的发展趋势中,它又会扮演几重角色?医疗数据,最重要的是病历和保险报销数据.对这些数据的挖掘正是对医学本身和医疗服务的二次发现和感知,在移动医疗领域,它们的价值正日渐突现.