问题描述
求教:我现在需要读取pdf文件每一个段落的内容,用了aspose.pdf。请问如何读取到段落呢?另外,我只需要读取文本,页眉页脚这些需要去掉,请问怎么读取到页眉页脚?我的以下写法总是获取不到想要的:doc.Pages[1].Paragraphs.Count-----总是为0doc.Pages[1].Header----总是为nulldoc.Pages[1].Footer----总是为null谢谢。
解决方案
解决方案二:
Pages从0开始算下标另外也要看pdf文件本身,从有的字处理文件创建的pdf,表面上看是页眉页脚,其实都是正文。
解决方案三:
嗯第一页应该是从0开始。没用过aspose,我比较喜欢免费的来出来PDF文档
解决方案四:
引用1楼devmiao的回复:
Pages从0开始算下标另外也要看pdf文件本身,从有的字处理文件创建的pdf,表面上看是页眉页脚,其实都是正文。
嗯。我知道从0开始,0获取也获取不到的。我的pdf有很多页。请问你用我上面的写法可以获取到正确数据吗?页眉页脚,我用自己生成一个标准的pdf,但还是获取不到啊。
解决方案五:
引用2楼newbie_jerk的回复:
嗯第一页应该是从0开始。没用过aspose,我比较喜欢免费的来出来PDF文档
请问spire.pdf提取pdf内容吗?或者说连图片也提取出来?
解决方案六:
引用2楼newbie_jerk的回复:
嗯第一页应该是从0开始。没用过aspose,我比较喜欢免费的来出来PDF文档
大神,这个免费的好像受限制的吧。
解决方案七:
引用4楼skyandcode的回复:
Quote: 引用2楼newbie_jerk的回复:
嗯第一页应该是从0开始。没用过aspose,我比较喜欢免费的来出来PDF文档请问spire.pdf提取pdf内容吗?或者说连图片也提取出来?
是可以分别提取图片和文本的
解决方案八:
引用5楼skyandcode的回复:
Quote: 引用2楼newbie_jerk的回复:
嗯第一页应该是从0开始。没用过aspose,我比较喜欢免费的来出来PDF文档大神,这个免费的好像受限制的吧。
是有有些限制,有页码限制,还会产生水印。。要是用于其他用途的话,就不能使用免费版了
时间: 2025-01-27 03:10:15