java-JAVA PDFBox 获取PDF文本缩进消失问题

问题描述

JAVA PDFBox 获取PDF文本缩进消失问题
我想做一个获取PDF文件的文本修改一些数据后重新生成一份新的PDF但文本格式要和前一个PDF文件一致,我成功的获取了PDF文件的文本打印出来后发现换行和空格都和PDF文件一致但缩进无法显示。有什么方法吗?

时间: 2024-09-29 01:45:21

java-JAVA PDFBox 获取PDF文本缩进消失问题的相关文章

使用pdfbox实现pdf文本提取和合并功能示例

 这篇文章主要介绍了使用pdfbox实现pdf文本提取和合并功能示例,大家参考使用吧 有时我们需要对PDF文件进行一些处理,提取文本.合并等.以前我们使用A-PDF Text Extractor免费工具,为什么不自己写一个呢?  现在我们可以使用PDFBox-0.7.3这个开源类库. 下载解包后引用:   代码如下: PDFBox-0.7.3.dll IKVM.GNU.Classpath.dll     新建一个项目,代码很简单: 代码如下: public static string Parse

C# 通过pdfbox-1.7.0.dll获取pdf文本,文本乱码

问题描述 根据pdfbox-1.7.0.dll获取pdf文本时产生乱码.我看pdf的属性中文档中使用的字体,编码有Ansi和Identity-H.怎么解决! 解决方案 解决方案二:把pdf的字符集改下解决方案三:引用1楼clxcxx的回复: 把pdf的字符集改下 怎么改?解决方案四:引用2楼tomtodayyesterday的回复: Quote: 引用1楼clxcxx的回复: 把pdf的字符集改下 怎么改? 如果pdf文档没有加密,就尝试着用不同的编码看看解决方案五:哥们我也遇到这个问题了你解决

使用pdfbox实现pdf文本提取和合并功能示例_实用技巧

有时我们需要对PDF文件进行一些处理,提取文本.合并等.以前我们使用A-PDF Text Extractor免费工具,为什么不自己写一个呢? 现在我们可以使用PDFBox-0.7.3这个开源类库. 下载解包后引用: 复制代码 代码如下: PDFBox-0.7.3.dllIKVM.GNU.Classpath.dll 新建一个项目,代码很简单: 复制代码 代码如下: public static string ParseToTxtStringUsingPDFBox(string filename){P

[Java] 利用xpdf库获取pdf文件的指定范围文本内容

[Java] 利用xpdf库获取pdf文件的指定范围文本内容 编写者 日期 关键词 郑昀@ultrapower 2005-8-2 Java PDF xpdf   概述 读取PDF文件的某一部分文本内容,可以使用开源项目xpdf. 从Java中调用xpdf,我们参照了<Java抽取Word,PDF的四种武器>文章最后提到的办法. 总而言之,调用xpdf十分简单,下面讲一下xpdf的配置问题. 系统基础环境要求 下面是对运行xpdf软件服务的计算机的要求: l         您可以从以下位置下载

java 用IText解析pdf 怎么获取表单坐标

问题描述 java 用IText解析pdf 怎么获取表单坐标 java可以用iText解析pdf, PdfReader reader = new PdfReader("pdf文件的url"); PdfStamper ps = new PdfStamper(reader, bos); AcroFields s = ps.getAcroFields(); 可以通过s.getFields().get("jkrxm")之类的对表单进行操作,有没有可以根据表单的key获得表单

java-我想问一下,用Java语言,利用pdfBox将pdf转为图片,怎样才能使图片不失真

问题描述 我想问一下,用Java语言,利用pdfBox将pdf转为图片,怎样才能使图片不失真 我用pdfBox将pdf转成图片的时候,图片中的文字有点不清晰,请问怎样才能使图片不失真,或者提高一下图片的清晰度呢,请问有谁知道的,帮忙解决一下,谢谢了 解决方案 首先用pdf阅读器看下,确认下你的pdf不是扫描件,或者分辨率足够. 如果可以,调整输出分辨率. imageWriter.writeImage(document, imageFormat, password, startPage, endP

Java实现Html转Pdf的方法_java

本文实例讲述了Java实现Html转Pdf的方法.分享给大家供大家参考.具体如下: package test; import java.io.File; import java.io.FileOutputStream; import java.io.OutputStream; import org.xhtmlrenderer.pdf.ITextFontResolver; import org.xhtmlrenderer.pdf.ITextRenderer; import com.lowagie.

Java中一些获取当前日期的方法

记点小东西.获取带格式的当前日期/时间的方法.C#的ToString()果然还是我觉得最有爱的format方 式.不过脚本语言一般也都会提供非常方便的方法,像PHP.Perl和Ruby等等都有相当不错的方法: JavaScript虽然没提供format方法,但自己写一个不废什么事. 我们都知道C/C++里提供了__DATE__和__TIME__宏,不过这两个宏记录的是编译时的日期和时间,而且 无法自定义格式,跟这里讨论的可以说是完全没关系-- ==========================

解析Java中如何获取Spring中配置的bean

本篇文章是对在Java中如何获取Spring中配置的bean进行了详细的分析介绍,需要的朋友参考下   一.什么是Spring?Spring是一个轻量级的控制反转(IoC)和面向切面(AOP)的容器框架 二.如何在程序中获取Spring配置的bean呢?方法一:在初始化时保存ApplicationContext对象代码: 复制代码 代码如下: ApplicationContext ac = new FileSystemXmlApplicationContex("applicationContex