Apache Lucene 5.4.0 发布,Java 搜索引擎

Apache Lucene 5.4.0 发布,此版本包括大量的 bug 修复,优化和改进,现已提供下载:

http://lucene.apache.org/core/mirrors-core-latest-redir.html

更新说明:https://lucene.apache.org/core/5_4_0/changes/Changes.html

Lucene 5.4.0 值得关注的改进:

API 改进

  • Query.getBoost and Query.setBoost are deprecated in favour of the
    new BoostQuery
  • The Filter class is deprecated in favour of FILTER clauses in a
    BooleanQuery
  • DefaultSimilarity has been renamed to ClassicSimilarity to
    prepare for the move to BM25 in Lucene 6

新特性

  • New Serbian token filter
  • New DecimalDigitFilter, to fold unicode digits to latin digits
  • New UnicodeWhitespaceTokenizer, that uses Unicode's whitespace
    definition and splits on NBSP
  • New GeoPointDistanceRangeQuery to search for geo-points within
    a ring
  • Query caching is now enabled by default in IndexSearcher, use
    IndexSearcher.setQueryCache(null) to disable

优化

  • MatchAllDocsQuery got faster
  • Doc values now use less memory for multi-valued fields and
    less disk in case of sparse fields
  • Two-phase iterators got a match cost API so that the costly
    bits can be checked last

Bug 修复

  • PatternTokenizer no longer hangs onto heap sized to the maximum input
    string it's ever seen.

Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。 Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。

Lucene 最初是由Doug Cutting所撰写的,是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎的主要开发者,后来在Excite担任高级系统架构设计师,目前从事 于一些INTERNET底层架构的研究。他贡献出Lucene的目标是为各种中小型应用程式加入全文检索功能。

OSChina 使用 Lucene 实现全文搜索。

在线Javadoc:http://tool.oschina.net/apidocs/apidoc?api=lucene-3.6.0

文章转载自 开源中国社区[https://www.oschina.net]

时间: 2024-11-10 01:37:55

Apache Lucene 5.4.0 发布,Java 搜索引擎的相关文章

Apache Lucene 6.6.0 发布,Java 搜索引擎

Apache Lucene 6.6.0 发布了,值得关注的更新是: 添加一个并发的 SortedSet facets 实现 还包括许多 Bug 修复.改进.优化和其他的更新,详情点此参阅. 下载地址 Lucene 是 Apache 软件基金会的一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎.Lucene 的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎.

Managing Gigabytes for Java 4.0发布 Java搜索引擎

Managing Gigabytes for Java 4.0发布 Java搜索引擎是一个高度17813.html">可定制,高性能,全文的大型文档集合的Java搜索引擎.它提供state-of-the-art功能(如BM25/BM25F)和新的研究算法. 虽然MG4J(Managing Gigabytes for Java)不是一个像Lucene.Egothor和Xapian那样的信息检索库,但是我们相信正在读这本书的每一位软件工程师都应该知道它,因为它对构建Java信息检索库提供了低水

Apache Camel 2.15.0 发布,Java 规则引擎

Apache Camel 2.15.0 发布啦!!!该版本经过 6 个月开发,修复了超过 500 个 bug.但最值得关注的是给我们带来的新特性: 自文档 目录组件 Camel 工具类目录 重用 Camel 命令 Camel Boot / Spring Boot 改进 REST DSL 改进 路由引擎优化 为消息提供更详细信息 XML 中的 endpoints 配置内容允许分行书写 个新的组件 文章转载自 开源中国社区 [http://www.oschina.net]

Apache Solr 5.4.0 发布,全文搜索服务器

Apache Solr 5.4.0 发布,现已提供下载: http://lucene.apache.org/solr/mirrors-solr-latest-redir.html 更新日志: https://lucene.apache.org/solr/5_4_0/changes/Changes.html Solr 5.4 值得关注的改进 新特性 UI 改进 The re-architected Admin UI is now prominently linked to from theexis

Apache Lucene/Solr 3.3发布 基于Lucene的搜索服务器

Solr 是一种可供企业使用的.基于 Lucene 的搜索服务器,它支持层面搜索.命中醒目显示和多种输出格式.在这篇分两部分的文章中,Lucene Java 的提交人 Grant Ingersoll 将介绍 Solr 并向您展示如何轻松地将其表现优异的全文本搜索功能加入到 Web 应用程序中. 一旦用户需要某种信息,就可以立即搜索到这些信息,这种要求再也不是可有可无的了.随着 Google 和类似的复杂搜索引擎的出现,用户希望得到高质量的搜索结果,帮助他们快速.轻易地找到所需的信息.经理对您的h

Apache Jackrabbit v2.2.5发布 Java API版内容存储规范

Apache Jackrabbit是一个完全遵守Java API版的内容存储规范(JCR)的实现.是由 http://www.aliyun.com/zixun/aggregation/14417.html">Apache Foundation 提供的 JSR-170 的开放源码实现. 更新说明: Bug fixes [JCR-2888] Namespace comparison in Namespace.java doesn't work, if a ...  [JCR-2889] Occ

Apache Ant 1.8.4发布 Java构建工具

Apache Ant 是一款基于Java的构建工具,能够更好地支持Java开发应用程序的跨平台问题.Ant是为http://www.aliyun.com/zixun/aggregation/14417.html">Apache项目的所有Java和其他开源Java项目而设计,提供了一个内置的编译.汇编.测试和运行Java的应用程序,它可以有效地用于建立非Java应用程序,例如C++或C++应用程序. Apache Ant 1.8.4是一个安全的错误修正版本,修正了bzip2任务中潜在的拒绝服

Apache Camel v2.8.0发布 非常强大的规则路由及媒介引擎

Apache Camel 是一个非常强大的基于规则的路由以及媒介引擎,该引擎提供了一个基于POJO的 企业应用模式(Enterprise Integration Patterns)的实现,你可以采用其异常强大且十分易用的API (可以说是一种Java的领域定义语言 Domain Specific Language)来配置其路由或者中介的规则. 通过这种领域定义语言,你可以在你的IDE中用简单的Java Code就可以写出一个类型安全并具有一定智能的规则描述文件.这与那种复杂的XML配置相比极大简

YourKit Java Profiler 10.0发布 Java和.NET程序分析工具

YourKit Java Profiler是一个CPU和内存分析工具,也是一个Java和http://www.aliyun.com/zixun/aggregation/13480.html">.NET程序性能分析工具,可以很容易地解决CPU和内存相关的性能问题.它具有自动检漏,内存分配分析的强大工具,对象堆浏览器,全面的内存测试作为JUnit测试过程的一部分,分析的开销非常低,支持透明deobfuscation,并与Eclipse.JBuilder.IntelliJ.IDEA.NetBea