在大型的现代化企业里,信息分布在不同的数据存储系统(例如 IBM Content Manager, FileNet P8, EMC Documentum 等),而不同的存储库又有其独特的实现方式,这就给企业整 合、搜索这些数据上带来了极大困难。IBM Content Integrator(ICI)提供了一种基于企业内 容管理的联合查询服务,在该服务的帮助下,企业能更快捷地开发出基于分散数据的企业应用 ,并能快速地搜索和整合数据。
跨库查询的需求和基于 ICI 的解决方案
在大型企业里,因业务需求可能会存在多个数据存储库。根据存储内容形式可分为结构化内 容存储库如 IBM DB2 和 Informix、MS SQLServer、Oracle 等,非结构化内容存储库如 IBM 的 Content Manager、FileNet 等产品,Microsoft SharePoint,EMC 的 Documentum 等。从 图 1 可以看出,拥有超过一个存储库的企业超过了 82%。
图 1. 拥有存储库的企业百分数图表
在全球业务社区中,大约有 80% 是非结构性数据,而 20% 才是结构性的。大部分的非结构 化数据还不能跨多个存储库进行操作。IBM Content Manager 的总经理 Lee Roberts 在一次采 访中曾表示,90% 的 FileNet 客户同时也是 IBM 的客户。可以看出,很多客户在使用 FileNet 产品时,同时也在使用 IBM 的产品,而 IBM Content Manager 和 FileNet 产品当前 还没有做到完全的融合。IBM 的内容集成产品 IBM Content Integrator (ICI) 具备将 IBM Content Manager 产品和 FileNet 内容产品集成起来的能力,允许用户通过统一的 Java API 实现对存储库的各种操作如访问、创建、更新等,更为出色的是,ICI 能搜索和重用来自多个 存储库的内容,如图 2 所示。ICI 提供两个连接器(Connector)分别访问 IBM Content Mananger 和 FileNet P8 Content Manager,客户端程序通过 ICI 提供的 API 完成相关操作 。
图 2. 客户端程序通过 ICI 连接器操作存储库