asp.net 读出pdf文件内的文字等信息

问题描述

以asp.net为开发语言,实现从pdf文件中读出信息(不借助第三方软件)。大家以前遇到过相似的开发没有,想听听大家的建议。

解决方案

解决方案二:
真是开眼界啊,原来ASP.net还能读取PDF,是不是真的?
解决方案三:
只能借助第三方插件。自己实现,估计没个把月很难。
解决方案四:
同2楼的观点
解决方案五:
http://csharp-source.net/open-source/pdf-librariesOpenSourcePDFLibrariesinC
解决方案六:
#好像很强。

时间: 2024-11-08 22:30:17

asp.net 读出pdf文件内的文字等信息的相关文章

ASP.NET生成PDF文件在IE中报错

问题描述 如题,今天做打印送货单的功能,参考了几种打印方式,最后选择iTextSharp输出PDF然后打印,在360.火狐.谷歌浏览器中都是可以的,但是在IE中却显示"无法显示XML页."如图:360.火狐.谷歌浏览器中的效果IE中的效果请问各位大神如何解决这个问题?? 解决方案 解决方案二:是否有可能是浏览器的编码设置有问题?解决方案三:引用1楼sundacheng1989的回复: 是否有可能是浏览器的编码设置有问题? 试了,没用解决方案四:你再把第二张图片里的粗体字大声的念一遍,要

捷速PDF编辑器修改PDF文件文字的教程

  PDF文件又叫做不能被修改的文件.不过,有一些网友想将自己手上的pdf文件进行文字修改,这就需要用到一款专业的pdf编辑器.而有一些网友推荐的pdf编辑器有的只能修改数字,却不能修改文字.那么,今天小编就为大家推荐一款可以修改PDF文件文字的编辑器:捷速PDF编辑器,下面,我们就以捷速PDF编辑器为例,来看看怎么修改pdf中的文字. 捷速PDF编辑器 准备工作: 大家需要上网下载一款捷速PDF编辑器,下载完成之后安装即可. 捷速PDF编辑器修改pdf文字步骤: 1.打开安装好的捷速PDF编辑

asp.net 如何将PDF文件转换成EXCEL,WORD??

问题描述 asp.net 将PDF文件转换成EXCEL,WORD?? 有没有做过的? 或转换出来带格式的txt也行, 问题补充:提供可读日文PDF的命令行程序也可.问题补充:我试过很多PDF转换到其他格式文档的工具了,大部分对日文,中文支持不好,可以专成txt的,但又丢掉了内容的格式,无法准确提取信息.找到一款不错的,但不提供命令行功能,而且收费.问题补充:如果要调用命令行工具,现在找一款免费,而支持日文,可以将PDF专成excel的工具,又不好找,还有指点 解决方案 看看这个,也许对你有用ht

体验Word2013预览版阅读和编辑pdf文件

Adobe公司的PDF文件格式是非常流行的文档格式,但pdf文档的阅读和编辑并不是那么方便.微软Office2010在Word软件中提升了对PDF文件的支持,但它只能将文档在本地存储为PDF格式,并不能编辑PDF文件.近日,微软推出了新一代Office预览版,在Word2013预览版中,我们看到了传说中的Pdf文件查阅和本地编辑功能,一起来体验一下. 打开Word2013预览版,在初始界面中我们可以看到左边列出了最近打开过的文档,右边是丰富的模板.我们可以点击"Open Other Docume

PDF文件怎么怎么新增加一个页面?

  PDF文件怎么怎么新增加一个页面?PDF文档是常见的办公文档格式,有时候我们需要对其进行编辑修改.今天我就和大家分享:在PDF文件内新增页面内容的方法. 1.安装以下PDFPDF文档编辑工具,运行后请打开进入软件界面. 2.点击界面上的"文件"按钮,选择"打开"功能选项. 3.选择需要编辑的PDF文档,单击"打开". 4.点击界面上的"插入--幻灯片"按钮. 5.选中第二页空白内容,点击界面上的"插入--来自文件

C#怎么解析PDF文件中的线段之类的图元?

问题描述 各位,我想解析PDF文件中的图形,网上有一大堆都是读取pdf文件里面的文字,或者顶多是图片之类的.但是我想要的是,读取PDF文件里面的CAD图纸:例如一个圆.一个线段.或者一段弧.其实也就是,想把这个PDF文件经过解析,生成同样的CAD文件.现在的问题就是:怎么获取里面线段.圆.圆弧等图元,获取图元的坐标信息,然后写到CAD文件里面(写到CAD这个很简单).说白了,就是这么把PDF文件里面的内容转换成CAD图纸.网上也有一些工具,但是效果不是很好,有的还是破解的.求助啊~~~~~~~~

如何通过WPS 2013 API 将Office(Word、Excel和PPT)文件转PDF文件

原文:如何通过WPS 2013 API 将Office(Word.Excel和PPT)文件转PDF文件 1. 描述 PDF 文件是一种便携文件格式,是由Adobe公司所开发的独特的跨平台文件格式.PDF文件以PostScript语言图象模型为基础,无论在哪种打印机上都可保证精确的颜色和准确的打印效果,即PDF会忠实地再现原稿的每一个字符.颜色以及图象.可移植文档格式,也称为"便携文档格式",是一种电子文件格式.这种文件格式与操作系统平台无关,也就是说,PDF文件不管是在Windows,

ASP生成PDF文件的方法

Adobe PDF格式已经变成很多机构和公司进行跨平台制表的通用媒体格式.尽管我不是这个产品的狂热痴迷者,却不得不接受这样一个事实:用这个格式产生一个协定可能会比用Word还要好.         Adobe PDF格式已经变成很多机构和公司进行跨平台制表的通用媒体格式.尽管我不是这个产品的狂热痴迷者,却不得不接受这样一个事实:用这个格式产生一个协定可能会比用Word还要好.         由于在一家雇用公司工作,我已经把我们所有早期的软件写成能在Internet上运行,这样我们就能和小的子公

巧用ASP生成PDF文件(转)

                          Adobe PDF格式已经变成很多机构和公司进行跨平台制表的通用媒体格式.尽管我不是这个产品的狂热痴迷者,却不得不接受这样一个事实:用这个格式产生一个协定可能会比用Word还要好.          由于在一家雇用公司工作,我已经把我们所有早期的软件写成能在Internet上运行,这样我们就能和小的子公司共享公用数据库了.然而我们遇到的最大的问题就是制表.当一个申请人坐在信息站里在线填写他们的就业申请时,我们如何取得当前的文档(或申请等)?由于