PDFTextStream是一个PDF文本和元数据提取软件,用于Java,Python 和 ">.NET。它支持所有的PDF文档规范版本(包括V1.7,使用Acrobat 8和9),文本提取编码使用双字节字符集(包括中文,日文和韩文),40位解密和128位加密文件,PDF文件(包括表单数据,书签和注释)所提供的所有文档元数据的提取,与Jakarta Lucene易于集成,以及交互的形式更新功能。
PDFTextStream 2.3.2版本发布了多种修复,以确保PDFTextStream能够从PDF文档中提取文本,同时还包括各种性能的增强。
软件信息:http://www.snowtide.com/
下载地址:
For .NET: http://downloads.snowtide.com/bundles/PDFTextStream.NET-2.3.2.zip
For Java: http://downloads.snowtide.com/bundles/PDFTextStream.Java-2.3.2.zip
时间: 2024-10-30 22:09:04