系统概述
在Internet飞速发展的今天,越来越多用户的核心业务数据都存储在关系数据库管理系统(RDBMS)中。但传统的关系数据库缺乏对存储在库中的大数据字段的内容进行检索和分析的核心功能,在以关系数据库管理系统为基础平台的门户网站或电子政务应用中,提供快速、精确的内容检索功能已经成为这些应用的重要需求和功能之一,当大量非结构化文档需要在Web上发布、检索和管理时,或者在电子政务应用中用户需要对政务信息的进行全方面比较审查时,提供快速查询和检索成为必然趋势。
大汉全文检索系统充分利用Java的跨平台特性,采用Java语言开发,可运行于Windows和各种UNIX(包括LINUX) 平台,支持非结构化文件和关系数据库的全文检索,可满足各种类型用户对全文检索的需求。
系统构架
系统特点
● 纯Java技术跨平台设计,安装部署方便,不受操作系统条件限制;
● 支持非结构化数据文件格式,如MS OFFICE(Word / Excel / PowerPoint)、HTML、RTF、PDF、TXT和其他文本文件等;
● 支持结构化文件检索,如XML等;
● 支持关系型数据库检索接口,支持ORACLE、MS SQL SERVER、SYBASE、DB2、MySQL等主流数据库系统;
● 内置中文自然语言词法分析处理技术,极大地提高了搜索的准确性和查全率;
● 支持“与、或、非”等多条件逻辑组合检索,支持二次智能检索,支持排序;
● 高效的数据和索引压缩技术,服务器磁盘空间膨胀率低;
● 支持多种语言编码,内核支持GB2312 / GBK / GB18030编码,BIG5编码,UTF8编码;
● 多线程设计,并发访问性能高,系统资源占用率低,对服务器硬件资源要求低;
● 提供规范、开放的应用编程开发接口,满足不同应用开发的需要;
● 完善的备份机制,按时间段定时对索引进行备份,有效的保证了索引数据的安全;
● 支持检索结果输出页面模版自定义,满足表现多样性;
● 可以和大汉版通JCMS无缝集成,对门户站点检索更加得心应手。
运行环境
操作系统 Unix、Linux、Windows
应用中间件 Tomcat、WebSphere 、WebLogic 、Apusic
典型应用
浙江司法门户网站
浙江省审计厅门户网站
南京环保门户网站
济南市政府门户网站