Managing Gigabytes for Java 4.0发布 Java搜索引擎

Managing Gigabytes for Java 4.0发布 Java搜索引擎是一个高度17813.html">可定制,高性能,全文的大型文档集合的Java搜索引擎。它提供state-of-the-art功能(如BM25/BM25F)和新的研究算法。

虽然MG4J(Managing Gigabytes for Java)不是一个像Lucene、Egothor和Xapian那样的信息检索库,但是我们相信正在读这本书的每一位软件工程师都应该知道它,因为它对构建Java信息检索库提供了低水平的支持。

MG4J是另一个搜索engine 。与Lucene 主要区别是,它提供了cluster 功能,具有更OO的设计方式。MG4J可以让你为大量的文档集合构建一个被压缩的全文本索引,通过使内插编码(interpolative coding)技术。

Managing Gigabytes for Java 4.0这是一个并行发布DSI Utilities,Sux4J,MG4J,WebGraph等等fastutil版本的一部分。

支持在“big”版本超过2^31次方在数组中(模拟),列表中的元素,术语,文件,节点等。几个改进的语义,以及一些细微的,长期的错误修正。

官方网站:http://mg4j.dsi.unimi.it/

时间: 2024-10-24 17:38:30

Managing Gigabytes for Java 4.0发布 Java搜索引擎的相关文章

Java 1.0和Java 1.1 的IO类的比较_java

Java 1.0 IO系统介绍1 Java IO版本Java库的IO分为输入/输出两部分.早期的Java 1.0版本的输入系统是InputStream及其子类,输出系统是OutputStream及其子类.后来的Java 1.1版本对IO系统进行了重新设计.输入系统是Reader及其子类,输出系统是Writer及其子类.Java1.1之所以要重新设计,主要是为了添加国际化支持(即添加了对16位Unicode码的支持).具体表现为Java 1.0的IO系统是字节流,而Java 1.1的IO系统是字符

YourKit Java Profiler 10.0发布 Java和.NET程序分析工具

YourKit Java Profiler是一个CPU和内存分析工具,也是一个Java和http://www.aliyun.com/zixun/aggregation/13480.html">.NET程序性能分析工具,可以很容易地解决CPU和内存相关的性能问题.它具有自动检漏,内存分配分析的强大工具,对象堆浏览器,全面的内存测试作为JUnit测试过程的一部分,分析的开销非常低,支持透明deobfuscation,并与Eclipse.JBuilder.IntelliJ.IDEA.NetBea

argparse4j 0.1.0发布 Java端口

argparse4j是一个Python argparse命令行参数解析器的Java端口. argparse4j 0.1.0该版本是初始发布版本. 它可以运行在Maven中央资料库: <dependency> &http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; <groupId>net.sourceforge.argparse4j</groupId>   <artifactId

Java MPlayer 2.0发布 Java媒体播放器

Java MPlayer 是一个用于Linux的Java图形化界面6186.html">播放器.它包括一个修补的MPlayer可执行文件. MPlayer定义: MPlayer 是一款开源多媒体播放器.该软件支持各主流作业系统,如Linux和其他类Unix系统.微软的视窗系统及http://www.aliyun.com/zixun/aggregation/12128.html">苹果电脑的Mac OS X系统.MPlayer基于命令行界面,在各系统可选择安装不同的图形界面,

Imixs Workflow 3.0.0发布 Java工作流管理系统

The Imixs Workflow 是一款提供了一个基于Java的BPM工作流框架,用快速和简易的方式建立工作流管理系统(WFMS).它提供不同的组件和分项工程来促成各种Java或Java EE应用程序的工作流解决方案的开发.其目的是提供一个易于使用的Java基于人类的工作流技术.这意味着Imixs Workflow 通常是适用于人对人的工作流应用程序.但它也可以用于技术的企业http://www.aliyun.com/zixun/aggregation/8504.html">流程管理解

jOOQ 2.3.0发布 Java类库

jOOQ 是一款能够高效合并SQL和Java的类库,支持复杂的SQL语句,还包括:类型安全.源码生成.活动记录.预存程序以及高级http://www.aliyun.com/zixun/aggregation/18278.html">数据类型. jOOQ 2.3.0该版本提供了许多有用的API增强,一些新的功能,一些新的语法支持元素,改进的源代码生成,和多个改善的jOOQ控制台.更新后的jOOQ控制台现在允许在服务器端直接过滤传入的陈述,陈述文字和其他功能的使用正则表达式过滤器.这些改进是一

jOOQ 2.2.0发布 Java 类库

jOOQ 是一款能够高效合并SQL和Java的类库,支持复杂的SQL语句,还包括:类型安全.源码生成.活动记录.预存程序以及高级http://www.aliyun.com/zixun/aggregation/18278.html">数据类型. jOOQ 2.2.0该版本增加了对另一个数据库的支持,CUBRID是一个令人惊讶的原始混合物的关系和面向对象的数据库. 软件信息:http://www.jooq.org/ 下载地址:http://sourceforge.net/projects/jo

jOOQ 2.0.0发布 Java类库

jOOQ是一款高效合并了复杂SQL.类型安全.源码生成.活动记录.预存程序以及高级http://www.aliyun.com/zixun/aggregation/18278.html">数据类型的Java 类库. jOOQ 2.0.0版本是一个解决问题的版本,应用户的需求访问的问题已解决. 示例代码: create.select(FIRST_NAME, LAST_NAME, create.count())      .from(AUTHOR)      .join(BOOK).on(Aut

FFMQ 3.0.0发布 Java JMS 1.1的实现

FFMQ 是一款轻巧和快速的原生Java JMS 1.1的实现.主要特点是提供了原始高性能和可靠性,易于配置,并减少依赖性. FFMQ 功能包括: -兼容JMS 1.1-轻量级(全服务器低于600KB)-减少依赖:JRE 1.4+,JMS API,commons-logging(可选:log4j, mx4j)-支持JMX监控-支持SSL远程连接-基于TCP的快速网络协议-支持异步日志持久性存储-轻松配置基于模板的目标定义 FFMQ 3.0.0该版本是 3.x 新分支的第一个稳定版本.主要提供了性