【独家】数据助力罕见病诊疗

演讲全文：

本次讲座主要分为以下三个方面的内容：

第一，罕见病的定义和理念。

第二，目前诊断治疗现状。

第三，提高罕见病诊断效率的探索。

首先，罕见病容易让大家觉得它是和常见病对立的，是很不常见的疾病，因此便不去关注和重视。但罕见病并不罕见，它并不是医学的名词，其社会含义大于医学含义。最初，罕见病这个名词被提出是源于患者及其家庭以及患者群体的自救自助行为。

目前已知的罕见病有7000种左右，其中80%为遗传性疾病，是由基因极端变异引起的明显的表型异常。罕见病是病因研究的天然模型，可以为很多常见疾病的发病机制和研究提供重要线索。

此外，罕见病离我们并不遥远，我们每个人都携带一些罕见病相关的有害基因突变，尤其是隐性遗传病致病基因突变，这也解释了为什么没有血缘关系的健康父母却生出不正常的孩子。

因此，每个家庭都有出生罕见病婴儿的风险。随着二胎政策的开放，罕见病带来的挑战越来越大，而相应的技术和流程还在发展过程中。

现在，需要让更多的人了解罕见病和公共健康之间的重要关系，真正地连接需要跨越一条河，需要更多的人参与。

首先，通过对出生缺陷、儿童期发病的严重性疾病、常染色体显性疾病、成年期发病的的表型隐匿的疾病数据进行积累及共享整合，可对出生缺陷的预防、孕期筛查、新生儿筛查及携带者筛查起到重要的参考作用。

第二，成年期发病疾病数据的整合对健康人群的疾病风险预测也是非常有用的。

第三、通过推动孤儿药的研发，药物适应症可能扩展到常见疾病。

罕见病的研究将推动了精准医学的发展，疾病谱的细分也对新治疗方法的探索有帮助。

这张模式图展示了目前大多数罕见病患者艰难的就医经历。导诊和诊前流程的缺乏、专业临床资源缺乏、基因检测行业的鱼龙混杂等现象都会让大多数患者的就医停留在ABC三个阶段。

但我们希望，如果有更多的患者能达到DEF模式，经历遗传咨询和医学建议、产前检测，或得到针对性药物的干预，并在后期接受随访注册，就会让更多的患者找到适合他们的治疗途径。

这是我们2009年做的一项探索，我和一些病友建立了中国共济失调病友协会网站，在2015年10月15日至2015年10月29日期间进行了短期的患者登记，调查患者的社会信息和一些医学信息。

从就医和和治疗上我们可以看出，病人辗转就医的过程非常曲折，治疗方法包括康复锻炼、中药、西药等。

就医花费的统计上，有的患者不愿意提供相关信息，收集到的花费数据信息也从5千以下到10万以上分为不同级别，且大部分的支付方式都是自付。

地域分布颜色的深浅代表患病人数的多少。从这张图可以看出，沿海地区就诊的人数更多，颜色浅的地区为中西部地区，可能由于医疗条件和经济水平的问题，就诊的人数较少。

目前罕见病的主要问题还是能否进行明确诊断，大部分疾病尚缺乏针对性治疗，部分疾病的治疗也主要是长期服药、特殊饮食及生活干预，因此门诊依然是罕见病的主要医疗方式。然而我们在诊治时发现，相当多的患者在来到我们医院之前就有过住院的经历，并且接受了一些非必需的、非常规及非精准的过度医疗。

大多数医疗机构的门诊信息碎片化非常严重，医疗资源浪费严重，信息分散、无序。这是一个患者的门诊病历，其中包含着多家医院多位医生的劳动，也包含着患者及其家人多次就医的过程，但是效率很低。

这是我自己的一些体会，信息、技术的群岛缺乏连接和合作，资源严重浪费。医疗资源分散且碎片化；相关技术之间彼此孤立，缺乏整合；医生、检测机构、患者群体、企业、政府部门及科研院校之间缺乏用于信息交流和共享的平台。

很多罕见病都是遗传性疾病，诊断涉及多个环节，每个环节应该精益求精，各个环节需要无缝衔接。医生掌握临床表型，通过分析推断疾病的分类和遗传模式，之后基于知识库和数据库可检索到这类疾病已知的基因缺陷属于哪一类，从而采用不同的基因检测技术进行检测。

然而图中这四个环节之间存在连接的问题，从左至右是细致的表型采集，从右至左则是基因检测的发展和优化应用，二者连接在一起才能进行更好的基因数据解读。这方面目前还很不完善，没有建立很好的流程，是未来的愿景。

后续的环节连接到临床的最后一公里难以实现完全自动化，可以探索机器学习等辅助方式帮助医生高效的收集表型。

其中客观的制约因素主要有：表型信息采集效率的严重滞后，由于医学发展历史的原因，疾病命名、分类的复杂交叉，疾病表型的变异性及各种环境因素影响下患者病程进展的不可控等。此外，基因检测技术虽然在飞速发展，但我们对基因的认识仍然不足。

提高罕见病诊疗效率的探索，首先是对诊断中临床表型的确认，其次就是基因数据和表型数据的对接，随着二代测序技术推广到临床应用，表型尤其是精准表型的确认在遗传病诊断中显得尤为重要。

医生作为临床一线的核心角色，拥有医学专业背景，能真正了解患者的情况，并将其转化成医学语言，这个环节是非常重要的。

此外，在诊断及干预过程中，医生也需要综合各方面的证据，针对不同患者来制定个性化的方案。医生需要通过终生学习来达到转化医学和精准医学的要求，然而医生也是需要支持的，需要能够帮助其获取更多的知识信息、提高工作效率的平台。

细致可靠的临床表型采集对疾病诊断十分重要，基因数据的积累建立参考数据库需要一个过程，同时还需要的能够将各方面的数据整合在一起的平台。在这方面我们也进行了一些探索。

HPO，即人类表型术语集，是标准化的表型，建立者起初从OMIM等数据库进行词汇抓取。

国内大部分医疗和科研工作者所使用的表型没有统一的标准，且表型数据大多数是自然语言，交流很不方便，后期数据挖掘也十分困难。一些数据机构因为没有汉化的HPO词语难以将自己的系统衔接临床，这一点需要突破。

因此，我们成立了CHPO，中文人类表型标准用语联盟，对HPO的词汇进行翻译，并对其词条进行更新，由国内外华人相关专业人士对其进行专业的编辑优化，建立搜索引擎并提供了词库的免费下载。

CHPO是一个逐步完善的过程。

CHPO将一边推广一边完善。

在此过程中，医生的参与尤为重要。目前的状况是医生提供表型信息给检测机构，但是缺乏统一的标准，质量参差不齐，检测机构基于医生提供的信息归纳核心表型，链接CHPO/HPO，进行生物信息分析和致病性评估，最后是基因检测结果的解读。

未来，需要让医生了解CHPO/HPO，在提供表型的时候进行标准化，这一点对于基因检测结果的解读也会十分有帮助。所以，需要把整个流程整合到一起。

流程的整合就是建立连接的过程，包括链接相关的专业人士、连接表型和基因的数据、连接个体数据与数据库。

目前，医生所掌握的患者个体的表型信息与基因数据相比常常是多样的、模糊的，检测机构得到的个体序列变异数量多而意义未名，各种疾病及生物信息数据库也非常多，HPO可以作为三方的接口，让医生与检测机构或科研机构建立共同语言，使医生收集的表型信息与各种数据库信息的描述方式尽可能统一，此外有助于通过表型连接数据库更好地进行基因变异选点分析。