基于HBase的医疗卫生数据中心构建与异构数据库同步研究
电子科技大学 方诗伟
为确定数据模型,提出以关系数据库的E-R建模基础提出HBase的C-O-R建模思想,然后综合分析卫生部颁布医疗卫生元数据标准和部分医疗卫生机构的实际情况,实现医疗卫生信息的HBase数据中心构建。为实现把各医疗机构的异构关系数据库中的数据透明无差异的同步到数据中心,提出以下方案。首先,在数据格式上提出异构数据库产生的异构数据进行标准化的XML和JSON通用数据格式封装实现屏蔽异构数据库的数据差异;其次是传输协议简单及通用,采用SOA架构设计思想,提出运用Web Service方法实现数据同步传输;在异构数据库的增量数据获取方面揉合时间戳、触发器及日志法为一体的方法;最后,提出通用前置机设计实现对所有异构数据库的读取,实现采用XML文件对异构数据库的差异配置。在构建好HBase中心并拥有数据后,由于HBase对于数据访问只有Row Key的定位及全表扫描两种,为了提高复杂查找效率而提出HBase的列索引构建。本文提出两种索引设计方式:运用Row Key优势和构建索引表。本文索引表的构建是采用MySQL数据库与HBase数据库相结合的双索引体系结构。最后经过模拟测试分析,并同MySQL的相关测试性能进行对比,验证出本文的设计方法可以较好的完成医疗卫生信息中心的构建和异构数据库到数据中心的同步,实现医疗卫生数据共享、监管及业务协同。
基于HBase的医疗卫生数据中心构建与异构数据库同步研究
时间: 2024-11-10 00:15:43