简介
当今的应用程序需要频频与许多不同源和不同格式的信息相结合。因此,应用程序开发人员往往需要调用大量不同 API 和协议来检索每个源中的信息,然后将这些信息合并到应用程序中。
WebSphere Information Integrator 通过提供一个到异构数据源的实时的基于 SQL 的接口,加速了这类场景的应用程序部署,异构数据源包括关系系统(如 DB2 Universal Database (DB2 UDB)、Oracle 和 Sybase)和非关系数据源(如文本文档和非结构化数据),以及新兴技术(如通过 Web Services 访问的 XML 存储库和数据)。Information Integrator 通过透明地管理关系和非关系数据并将其一起引入单个虚拟位置,来满足快速访问完全不同的数据的市场需求。图 1 详细说明了 WebSphere Information Integrator 环境:
图 1. WebSphere Information Integrator 提供单个 SQL API 来访问不同的分布式数据
WebSphere Information Integrator 通过在其自身的编目中存储联邦数据源的元数据,从而在 DB2 UDB 数据库引擎的上下文中构建数据库联邦。因为联邦中的每个数据源一直在自主操作,所以维持联邦数据库与它所联邦的源之间的一致性是一个相当大的挑战。模式定义变更、服务器和网络故障,以及密码过期等事件随时可能发生。这些事件中的每一种都可能使数据源变得不可访问或使其做过的编目不再有效,通过联邦数据库访问这些数据源的应用程序可能因此而中断。
因此,检测此类不一致性和自我管理集成环境的自主功能可以降低数据管理的复杂性。与允许真正虚拟化的环境相结合,Information Integrator 的自动化可以交付能够利用人员、过程和信息之间的资源的随需应变解决方案。
本文首先说明了联邦数据库系统的基本原理,给出了展示该系统的多样性和可扩展性的场景。然后,我们来看一下联邦数据库和它所联邦的源之间出现的实时不一致性。最后我们来看一看联邦健康监控,即在 WebSphere Information Integrator V8.2 中提供的新的自主功能,它是在 DB2 UDB Health Monitoring 组件中实现的。该功能警告系统管理员联邦数据库编目和联邦数据源之间存在不一致性,提出采取纠错措施的建议,并定期发送故障排除通知。
联邦系统的基本原理
WebSphere Information Integrator 联邦系统包括以下组件:
DB2 UDB 引擎
无需移动到中心位置即可访问分布式数据的 Information Integrator 实例
一个或多个数据源
客户机(用户和应用程序)
联邦系统的创建方式是,在 DB2 UDB 引擎上安装 Information Integrator,然后对其进行配置以注册一个或多个异构数据源。联邦数据库系统的用户可以对存储在联邦系统中任意位置的数据进行分布式查询,不管自己的位置在哪里,也不管数据源使用的是哪种 SQL 方言。图 2 说明联邦系统的架构。
图 2. 联邦系统配置的架构