英国健康医疗大数据平台 care.data为何停摆?

2013年初,在care.data

项目计划发布后,就有一些隐私保护组织发起了“医疗数据保密倡议”,呼吁关注医疗数据使用过程中面临的安全威胁。但NHS并没有表达其与公众进行沟通和咨询的意图,还强调从2013年9月份开始,将正式对集中后的医疗数据进行分析挖掘。

Care.data在实际运作过程中存在三方面的主要问题:首先是管理和沟通方面;其次是过于依赖技术手段;再次是规则方面的准备不足。

今年5月25日,李克强总理在出席贵阳“大数据产业峰会”时,将大数据比作“21世纪的钻石矿、智慧树”。之后不到一个月,国务院就于6月21日对外发布《关于促进和规范健康医疗大数据应用发展的指导意见》,提出“健康医疗大数据是国家重要的基础性战略资源”;发展健康医疗大数据应用,“将带来健康医疗模式的深刻变化,有利于提高健康医疗服务效率和质量,增加有效供给、满足群众需求,促进培育新业态、形成新的经济增长点”。这份《指导意见》被普遍认为吹响了我国发展健康医疗大数据应用的号角。

确实,将大数据技术应用于健康医疗领域,能带来无限的想象空间。例如在美国,IBM人工智能引擎Watson已经学习了超过60万份医学证据报告、150万份病历和临床试验、200万页医学期刊研究成果。目前,享誉世界的纪念斯隆—凯特琳癌症中心(Memorial Sloan-Kettering Cancer Center)的肿瘤医生正借助Watson,根据每位病人的症状、基因、病史等量身定制治疗方案。

在英国,今年7月,打败围棋高手李世石的谷歌人工智能引擎DeepMind宣布与英国Moorfields眼科医院合作,将对超过100万份的眼部扫描文件进行数据分析和挖掘,创造出能更快、更早地探测出眼部病变的计算机算法。据英国国家医疗服务体系(National Health Service, NHS)统计,98%以上的糖尿病视网膜病变所引起的视力受损,能够通过早期的检测和治疗而避免。

有IBM和谷歌等公司强大的技术实力,再加上丰富的医疗健康大数据作为支撑,不难想象在未来人工智能和大数据技术能做出的巨大贡献。《指导意见》将发展健康医疗大数据应用作为“努力建设人民满意的医疗卫生事业”的关键之一,无疑是找对了抓手,切中了要害。

命途多舛的care.data

让我们将目光转向英国。在2012年伦敦奥运会开幕式上,英国人将女作家J·K·罗琳与她的哈利·波特,以及提供全民免费医疗的NHS,作为英国最引以为傲的两项代表。显然,英国人不会错过利用大数据技术改善NHS的机会。

早在2011年,时任英国首相卡梅伦就提出,要将NHS累积的医疗健康大数据运用于研究,不仅病患能更快地享受到更有效的治疗,还能进一步巩固英国医疗行业在全世界的领先地位。卡梅伦期待,通过与产业、研究机构共享NHS的医疗健康大数据,NHS能够成为“引领全球医疗创新的典范”。

2013年,英国启动了医疗健康大数据旗舰平台care.data。care.data集中了最详尽的数据,包括全英国的家庭医生(General Practitioner, GP)和医院记录的病历,以及社会服务信息;数据将用于除“直接医疗”(direct care)之外的目的。NHS期待通过数据资源的统一归口、共享、分析,能够更好地认识病患,研发药物和治疗方式;认识公共卫生和疾病的发展趋势,保障每个人享有高质量的服务;在有限预算中更好地分配医疗资源;监控药物和治疗的安全状况;比较全国各区域的医疗质量。care.data从诞生之日起就被寄予厚望。

然而就在2016年7月6日,英国NHS却决定从即日起停止care.data计划。如果说将大数据技术运用于医疗健康这个大方向没变的话,那到底NHS在运营care.data的过程中遇到了什么问题?中国在发展医疗健康大数据时,又能从中借鉴什么经验教训?在讨论这些问题前,有必要先回顾下从2013年到现在的这三年间,围绕care.data发生的那些事儿。

虽然NHS在2012年提出care.data计划,但其基本逻辑可以追溯到一个世纪前。1911年,家庭医生的病人医疗记录就被英国政府用于集中统计分析,从纸质记录时代到数字化时代,英国一直致力于对医疗数据的集中化和医疗数据分析挖掘,以改善整体医疗水平。2000年,NHS提出了IT计划,拟建设全国集中的医疗保健数据资源库,并允许其数据可被用于科学研究。然而,多年以来,一系列的医疗数据集中化应用的计划并没有取得理想效果,反而引来了众多批评的声音。

2012年英国通过的“医疗和社会保健法案”(Health and Social Care Act)规定,由医疗和社会保健信息中心(Health and Social Care Information Centre, HSCIC)代替之前的NHS信息中心,具体负责所有医疗数据的收集、传输、分析和分享。

2013年,英格兰NHS委员会正式公开了care.data项目的具体实施计划:由英格兰NHS指导HSCIC从公立医疗机构和GP收集医疗数据,并保存在一个国家级数据库。同时,允许NHS和符合条件的私营公司对数据进行研究,并声明研究目的为评估NHS所属医院的安全状况、监控疾病的发展趋势及策划新的医疗服务。

2013年初,在care.data项目计划发布后,就有一些隐私保护组织发起了“医疗数据保密倡议”(medConfidential),呼吁关注医疗数据使用过程中面临的安全威胁。但NHS并没有表达其与公众进行沟通和咨询的意图,还强调从2013年9月份开始,将正式对集中后的医疗数据进行分析挖掘。

2013年8月,家庭医生收到了NHS的通知,要求其在8周内通知他们的病人care.data项目需要收集、分析其数据。该举动立即引起了家庭医生的集体反对。原因是按英国1998年颁布的“数据保护法案”(Data Protection Act)的规定,家庭医生是病人隐私数据的控制者。如果在将其控制的病人数据用于“直接医疗”之外的目的时,必须及时通知到病人并征求同意,否则可能会承担法律责任。

NHS提出的要求让家庭医生感到非常为难。有媒体在对400位家庭医生调查后发现,41%的病人选择退出care.data项目,16%的病人还未做出决定,而且在没有充分时间和资金的情况下,家庭医生很难通知到数量众多的病人。2013年10月,在家庭医生强烈抗议下,NHS表示将投入200万英镑向公众宣传care.data项目内容。

2014年,care.data依旧麻烦不断。首先,NHS的宣传活动仅是在官网发布视频和向公众派发传单。虽然制作、分发传单的花销高达100万英镑,但后续抽样调查中却发现只有不到三分之一的人表示收到过传单,公开宣传的效果大打折扣。

其次,HSCIC承认其向保险公司出售过病人的数据,面临严厉的数据保护审查。HSCIC的数据披露审计报告显示,医疗数据已经被披露给160个组织,其中包括56家私人企业,虽然HSCIC声明数据已经被匿名化处理,但隐私专家强烈质疑其处理过程的有效性,其披露的数据完全可能被保险公司等组织重新识别为个人数据。

2014年2月,NHS表示,家庭医生可延缓6个月上传病人数据,并首次承认care.data项目面临严重的信任危机。随后,NHS宣布于2014年秋天选取4个地区开展新的试点,收集265名家庭医生掌握的200万病人的数据,事实上,直至2015年6月,第一个试点才进行开展。

尽管英国政府推出care.data项目的初衷很好,但其实施过程可谓一波三折、不能令人满意,“混乱之中的care.data”等字眼也频繁出现在各大媒体报道中。2014年11月,英国议会中的跨党派小组(All Party Parliamentary Group)在对care.data项目进行调查后,指责其过程缺乏透明和公共宣传。2015年1月,NHS的监督机构“独立信息治理监督小组”也发布报告,说明care.data项目并未完成其承诺,缺少相关专家,以致在信息治理方面存在责任。

由于执行层面中缺乏对病人隐私保护的足够关注,care.data自始至终没能获得公众的信任。截至今年5月,共有150万人选择退出care.data计划。

care.data的三个问题

总结起来,care.data在实际运作过程中存在三方面的主要问题:首先是管理和沟通方面。在对医疗健康数据集中和统一归口过程中,有关决策和管理人员强行推动计划,却没有充分告知公众,或与各利益相关方沟通。在对隐私保护的担忧日渐发酵时,政府的应对很不及时,也很不充分。

其次是过于依赖技术手段。有关决策和管理人员一遍遍对外强调,收集和共享的数据经过了匿名化或伪匿名化的处理,数据无法回溯到个人,因此不存在隐私泄露的担忧。但实际上,在大数据环境下,数据很可能经过组合、挖掘,重新识别出个人。同时,数据集中存储反而导致遭破坏、窃取、泄露等安全风险的上升,care.data计划的有关决策和管理人员没能向公众提供可信的安全方面的保证。

再次是规则方面的准备不足。care.data计划没能理顺现有规则方面的冲突。一方面家庭医生具有法律义务保护病人数据的保密性和安全性,另一方面又必须按照要求将数据传输至HSCIC。此外,商业机构能够利用care.data的数据并以此获利?现有的法律没有给出答案。

实际上,医疗数据的应用争议不只是英国特有的情况,比如荷兰和奥地利等其他欧洲国家,在尝试集中化处理医疗数据时,也存在大量质疑和反对的声音。可以说,care.data这三年波折的历程,我们清晰地看到随着个人越来越重视隐私保护,随着数据保护法律法规的日益完善,关于医疗健康大数据的收集和处理过程是否有效保护了各方权益的争议也会随之增加。

健康医疗大数据既是惠国惠民、驱动新经济的重要举措,也是国家大数据领域应用的试验田和典范,意义重大。我们很欣喜地看到,国家卫计委副主任金小桃在今年6月17日的新闻发布会中再三强调,“健康医疗大数据的应用发展,最基础的在安全……对于健康医疗大数据的安全和个人健康医疗数据相关的隐私保护,必须予以高度重视,甚至于它决定着我们大数据应用发展的未来”。

但我们也必须承认,健康医疗大数据应用,不只是将已有的数据和安全保护措施转移并集中,而是一个前所未有且极其复杂的过程,涉及法律问题、隐私问题、技术问题、责任问题、信任问题,甚至目前还找不到最佳的实践案例作为参考。因此,要推进好此项工作,迫切需要继续深入剖析国外案例,分析国内现状和存在的问题,研究医疗健康数据的全方位保障体系和保障方案,以预防实施中的各类风险,避免出现英国类似的情形。

====================================分割线================================

本文转自d1net(转载)

时间: 2024-08-07 03:20:08

英国健康医疗大数据平台 care.data为何停摆?的相关文章

两部委牵头 4央企联手设健康医疗大数据平台公司

4月14日,21世纪经济报道记者获悉,中国电子信息产业集团公司.国家开发投资公司.中国联合网络通信有限公司.中国国有企业结构调整基金股份有限公司于近日共同发起设立中国健康医疗大数据产业发展有限公司. 据悉,该平台公司由国家卫生计生委和国务院国资委指导,将整合四家央企相关优势资源,按照"政府主导.市场运作.联合创新.共建共赢"的原则,以股权为纽带加强联合创新,投资运营国家健康医疗大数据中心及产业园:以确保健康医疗大数据安全为目标,投资行业内骨干企业,突破核心技术:以金融手段促进健康产业的

健康医疗大数据领域的政策和法律问题

随着云计算.物联网技术的持续发展,互联网日益加深对医疗健康产业的渗透乃至重塑.在此契机下,医院的信息化建设得到有效推进,移动医疗产业也呈现出迅猛发展的势头.互联网技术与医疗健康产业的日益融合,空前扩大了医疗数据的规模,于是越来越多的企业开始关注并积极探索健康医疗大数据的深度挖据和应用. 在此背景下,2016年10月25日中共中央.国务院印发了<"健康中国2030"规划纲要>."健康中国2030"是我国未来15年推进健康中国建设的行动纲要,其中特别强调发展

英国政府大数据的七大应用

良好的科研基础和技术使英国率先开始大数据国家战略,并将大数据充分地应用于财政.农业.医疗.城市规划.航空等各个领域,不断提升政府职能,服务于民生. 大数据助力政府财政监督 英国财政部注册twitter官方帐号@hmtreasury,第一时间将财政动向在互联网上公布,内容涉及包括政府花费在内的所有财政事务.财政部向它所有关注者公布政府支出消息. 与此同时,财政部还用著名的图片共享网站flickr公布政府财政信息,在英国财政部政府支出指南的基础上,对报告中所涉及的数据又进一步作了深入解读. 大数据助

英国开启大数据时代

在英国,大数据早已不仅仅是一个停留在科学论坛上被热议的新名词,越来越多的政府投入.已经运营的高校大数据研究中心.不断涌现的商业运作成果,明确地展现出英国正在开启一个新的大数据科技时代. 政府将大数据作为"新经济增长点" 近年来,英国经济持续低迷,疲软的经济状况使得政府部门的财政支出捉襟见肘.就在这样严峻的财政背景下,英国政府更加渴望通过扶持新兴高科技技术发展,来增强国家在国际竞争中的科技硬实力,创造新的科技领先领域和经济增长点,从而带动整个经济发展. 大数据概念的提出正好符合英国政府现

DockOne微信分享(九十九):海航生态科技舆情大数据平台容器化改造

本文讲的是DockOne微信分享(九十九):海航生态科技舆情大数据平台容器化改造[编者的话]海航舆情监控系统能够为海航集团内部提供监控网络舆情信息,对负面信息.重大舆情及时预警,研判具体舆情或者某一舆情专题事件的发展变化趋势,生成图标报告和各种统计数据,提高舆情工作效率和辅助领导决策.然而,随着项目的持续运行,许多问题逐渐暴露出来,为了解决这些难题,对整个项目重新规划设计,迁移到Hadoop.Spark大数据平台,引进持续化Docker容器部署和发布,开发和运营效率得到显著提升. 一. 舆情平台

国家大数据平台知多少?八大平台前景可期!

日前,中共中央总书记习近平在主持中共中央政治局第三十六次集体学习时,明确提出"建设全国一体化的国家大数据中心"的必要性,"推进技术融合.业务融合.数据融合,实现跨层级.跨地域.跨系统.跨部门.跨业务的协同管理和服务." 李克强总理也曾多次强调,"建立统一的数据平台,是建设现代化国家的基础性工程,也有利于国家安全." 国务院发布的<促进大数据发展行动纲要>更是明确指出,2018年底前建成国家政府数据统一开放平台,率先在信用.交通.医疗.

支撑EB级规模的大数据平台深度揭秘

编者按: 4月20日,云栖大会走进深圳,由阿里云高级数据仓库专家陈鹏宇(花名:不老)分享的环节内容量巨大,引发现场用户关注.他分享的议题主要围绕阿里云数加平台,这一发布不久的大数据平台对很多人来说还比较陌生,但是这个平台的历史和其上所服务的众多业务,却是耳熟能详的,几个数字,瞬间抓住眼球:   双十一狂欢节,水立方实时直播,万亿级数据计算,3秒钟出结果 蚂蚁小贷利用大数据实现普惠金融,1秒钟放贷,全程自动化决策 菜鸟智能物流骨干网,货.人.车.仓智能调度,目标实现全国24小时送达 阿里集团99.

从存储、实时、安全的角度谈如何建立完整可用的企业大数据平台

要建立一个大数据系统,我们需要从数据流的源头跟踪到最后有价值的输出,并在现有的 Hadoop 和大数据生态圈内根据实际需求挑选并整合各部分合适的组件来构建一个能够支撑多种查询和分析功能的系统平台.这其中既包括了对数据存储的选择,也涵盖了数据线上和线下处理分离等方面的思考和权衡.此外,没有任何一个引入大数据解决方案的商业应用在生产环境上承担的起安全隐患. 1. 计算框架篇 大数据的价值 只有在能指导人们做出有价值的决定时,数据才能体现其自身的价值.因此,大数据技术要服务于实际的用途,才是有意义的.

支撑上万并发毫秒级事务响应!银行大型机负载下移至GemFire+HBase大数据平台的创新(一)

MainFrame大型机行业应用介绍 大型机(mainframe)这个词,最初是指装在非常大的带框铁盒子里的大型计算机系统,以用来同小一些的迷你机和微型机有所区别.虽然这个词已经通过不同方式被使用了很多年,大多数时候它却是指system/360 开始的一系列的IBM计算机.这个词也可以用来指由其他厂商,如Amdahl, Hitachi Data Systems (HDS) 制造的兼容的系统. 近年来,随着国内银行.保险.证券和海关等企事业的处理信息需求量猛增,对处理速度的要求越来越高,要求响应时