方正智思是什么?
方正智思是中文智能信息挖掘与智能分析处理的系统软件。
方正智思是以方正多年积累的中文信息处理技术和中文自然语言理解技术为基础,融合了最新的人工智能、信息采集、信息检索、文本挖掘的研究成果,经过严格产品化开发的系统软件。
方正智思提供对海量文档等数字化内容进行智能采集、智能检索、智能分析处理的功能。基于方正智思可以方便地进行二次开发,快速构建具有智能信息挖掘与智能分析功能的应用系统。
方正智思应用领域
网络舆情监测和分析
政府领导决策支持
互联网出版信息监管
网上社情民意收集与分析
情报信息搜索与挖掘
政府、企业信息搜索
各类应用系统的信息管理、分析和挖掘
体系结构
方正智思是以中文信息处理技术与数据挖掘技术为核心技术,以智能检索、智能分析和智能处理为核心功能的智能分析处理软件开发平台,其体系结构图如下:
技术特色
优秀的中文信息处理
以方正多年积累的中文信息处理技术为文档特征提取的技术基础,同时支持中文简体(GBK, GB2312)与中文繁体(BIG5),并且支持英文及中英文混合文档。
丰富的软件二次开发接口
方正智思具有良好的模块化与可扩展性,框架设计灵活,可方便地加入或替换某一核心算法;各功能模块采用相对独立的形式存在,开发商可根据具体应用选择性地购买使用。
XML数据交换技术
XML是一种结构化置标语言,针对文档的语义信息进行结构化的标注。具有规范的结构、强大的数据描述能力与易扩展性。
跨平台应用
支持多种操作系统平台,经过严格测试。
主要功能
智能采集
概述
自动、定时地采集互联网信息内容,并对信息进行收集、整理、归类、存储,统一管理获取的信息,把互联网上的海量信息数据转化为可利用的本地信息。
功能
1.模板制作器基于网页源文件(HTML代码和RSS)进行内容获取。
2.管理配置对站点频道集中分组管理,设定优先级以及多服务器管理。
3.分布式采集服务部署于多台服务器上,支持新闻、论坛、博客的信息采集。
应用
网络舆情收集整理,网络新闻采编,建立企业情报信息库,政府行业网站采集,社会化垂直搜索网站数据源。
运行环境
Windows 2000及更高版本,支持多种操作系统。
智能检索
概述
方正智思全文检索以传统的检索与面向海量数据的Web检索为基础,结合自然语言理解技术与数据挖掘技术的最新研究成果,快速检索海量数据,以多种检索方式准确的获取所需信息。
功能
1.文本自动分词,词与词间隔自动标记,自动辨识语素和单字词,合成词和短语。
2.采用字索引与词索引相结合的方式提高查全率与查准率。
3.倒排索引记录词频率TF、文档频率DF、逆向文档频率IDF、位置等信息。
4.采用分段逐层合并的索引组织模式,提高海量数据建索引速度。
5.支持布尔查询、短语检索、范围检索、通配符、邻近查询、同义词、同音词等。
6.综合考虑对文档权重的影响,利用加权法实现对相关度排序。
应用
统一异构数据的查询入口,让用户在最短的时间内获取自己想要的信息。有效地解决海量数据环境的检索查询问题,大大减少了不必要的计算开销,避免了重复计算,提高了计算机系统的响应速度。
运行环境
Windows 2000及更高版本、Linux 7以上版本、Solaris 8以上版本,AIX等操作系统。
智能分析处理
概述
智能分析处理功能包括:自动提取关键词、自动摘要、自动分类、自动聚类、自动消重、相关推荐、主题检测等功能。主要提供给应用开发商进行智能分析处理系统的开发,开发接口简单实用。具有良好的模块化与可扩展性,框架设计灵活,各功能模块采用相对独立的形式存在。
功能
1.通过对少量的样例文档的训练后,自动快速地对大量文档进行分类。
2.利用文档的内在特征信息进行智能分析,判断文档的相似性与重复性。
3.在篇章分析与指代消解技术基础上,对文档自动提取关键词和摘要。
4.采用文档向量空间模型与K-means聚类算法,对文档集自动聚合类别。
5.在各种信息来源中追踪那些与讨论目标主题相关的信息片段。
6.从海量数据中挖掘信息之间的关联关系。
应用
方正智思能够对组织内外部的新闻、邮件、Internet信息、文件等非结构化信息,同时包含数据库、XML等结构信息,按照业界先进的模型算法,通过信息智能理解与处理,将信息依照用户的需求,充分有效的集成为整体。通过前端应用系统,为用户提供所需主题、类别的相关信息,实现信息个性化分析与信息资源共享。
运行环境
Windows 2000及更高版本、Linux 7以上版本、Solaris 8以上版本,AIX等操作系统。
联系方式:
北京方正电子政务技术有限公司
地址:北京市海淀区成府路298号方正大厦4层
邮编:100871
咨询电话:(010)82529034
传真:(010)82529440
网址:www.founderegov.com