Apache Tika 1.15 发布了,该版本包含许多改进和错误修复。新发布的版本已推送到 Apache 发布网站以及 Maven Central。
Tika 是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了 POI 和 Pdfbox,并且为文本抽取工作提供了一个统一的界面。其次,Tika 也提供了便利的扩展 API,用来丰富其对第三方文件格式的支持。
本次更新内容较多,详情请参阅更新说明、发布主页。
下载地址
- http://www.apache.org/dyn/closer.cgi/tika/apache-tika-1.15-src.zip
- http://repo1.maven.org/maven2/org/apache/tika/
文章转载自 开源中国社区 [http://www.oschina.net]
时间: 2024-10-25 04:55:46