如何利用ABBYY FineReader识别图片中的文本

  作为一款OCR光学字符识别软件,ABBYY FineReader能够快速方便地将扫描纸质文档、PDF文件和数码相机的图像转换成可编辑、可搜索的文本,让电脑处理更具效率,摆脱从前的烦恼,告别耗时费力的手动输入和文件编辑。今天就给大家分享一篇别人使用ABBYY FineReader识别图片中文本的案例,看别人是如何利用ABBYY FineReader提高效率的:

  昨天在微博收藏了几张图片格式的中英文对照的色谱,以后翻译的时候可能会用到,因此想到通过OCR(光学文字识别)识别处理后导入CAT中备用。之前在微博经常看到各位大佬儿推荐ABBYY FineReader,提到它无与伦比的识别效果,今天小试牛刀,兴奋不已,效果确实不错,对中文字符的识别度较高,不啰嗦,上图说明撒。

  准备:找到预先保存的两张jpg格式的图片,安装最新版ABBYY FineReader 12软件。

  目标:提取图片中的英文和中文栏,导出Excel格式的文本。

原始图片


  操作过程1、由于图片中的文本分列显示,因此打开ABBYY FineReader 12后,选择Microsoft Excel项;


  注:在这个窗口可以设置要识别的语言(简体中文和英文),以及色彩模式,这里可以选择全彩色和黑白模式,黑白模式的读取速度要稍快一些。

  2、然后选择“图像或PDF文件到Microsoft Excel”,添加要识别的两张图片,打开后软件自动开始识别;也可以点击“文件”,新建一个文档,然后直接把要识别的图片拖放到软件左列,同样可以打开进行识别;


  3、考虑到图片文字可能会出现模糊,文本歪斜和转向,因此选择取消识别,先对图片进行编辑处理,点击上面工具栏里的“编辑图像”,右侧打开编辑工具列表;


  4、首先,要对图像进行歪斜校正,如扫描的图片不规整,在扫描后会提示对需要进行校正的图片进行歪斜校正,这里可以选定“全部页面”,然后点击“歪斜校正”;若图片是旋转90度或倒转后的图片,可在这里将其旋转或翻转处理;


  5、接下来,也是最重要的,就是调整图片的分辨率,有些图片模糊不清,会影响软件识别效果,这里可将图片的分辨率设为扫描图像的分辨率,即300dpi,这个值基本上都可以正常识别了,也可以自定义分辨率。通过这个选项,可分别单张设置图片的分辨率,也可以选奇数页或偶数页和全部页面,为了不影响识别,这里可以选择“所有页面”;


  6、然后就可以退出图像编辑器;

  7、由于我们只需要中英文对照的两列文本,其他无关的内容可以不进行识别,因此,可选择要识别的区域,即点击中间一栏左上角的“A”按钮,可选择两列要识别的文本;


  8、选定后的文本呈浅绿色,然后点击选中区域,在弹出的工具栏选择按钮“A”,找到里面的“表格”项,这样识别后的文本就成两列对照的文本了;


  9、然后,点击上面工具栏里的“读取”选项,开始识别;


  10、下图为识别后的效果图,最右侧一栏是识别的文本内容,在该栏头部,可对识别的文本格式进行设置,如设置字体,字号、倾斜、加粗等;


  11、识别后的文本中,绿色显示的是可能存在拼写或识别错误或置信度较低的字符,如果未做处理直接导出,可能会影响以后使用。这时,可选择工具栏里的“验证文本”,对绿色标记部分进行编辑确认;


  12、操作过程中,会发现标记为绿色的文本有些并没有拼写错误,可能只是字体设置不当,这种情况下只需要忽略跳过即可,存在识别错误的文字,进行更改替换,FineReader自带的字典会提示可能正确的识别变量,选择正确的文字,点击“替换”或“全部替换”,然后“确认”即可;


  13、上图是验证后的文本,是不是美观多了?

  14、然后输出文本,点击工具栏内的“保存”,即保存为Excel格式的文件,默认状态下,保存好的文件会自动打开;


  15、这是导出后的文件,再次对字体和字号进行调整,使其看起来更加美观。然后就可以把它导入各种CAT(计算机辅助翻译)软件中,以后翻译时,如果出现此类术语,CAT即可自动提示,是不是省去google挨个儿查询的苦恼了?

时间: 2024-10-04 01:37:03

如何利用ABBYY FineReader识别图片中的文本的相关文章

如何利用深度学习识别图片中的电话号码?

总结下最近做的一个项目,只提供一些技术方案,不涉及具体业务和具体实现. 背景 自动识别图片中电话号码,也可以推广到识别字符串,英文等. ---识别---> "18811610168" 当然,背景会有干扰(自然环境),字体也更多变. 要求:全对识别,人工修正的成本过高,如果有一位识别错误,人工修正还不如重新输入方便(人工输入可以支持语音识别的). 保证85%以上的数据是可以全对识别的,最好返回全对识别的概率.当然对于电话号码业务,根据识别的文本结果再加上电话的一些规则,后判断程序也

如何提高ABBYY FineReader的识别正确率?

  在OCR文字识别软件当中,ABBYY FineReader是比较好用的程序之一,那它的识别正确率怎么样呢?用户都喜欢软件的正确率高一些,我们怎样才能提高它的识别正确率呢?很多用户也都提过这样的问题,今天就让我来为大家讲讲如何提高ABBYY FineReader的识别正确率. 1.打开ABBYY FineReader 12主界面,找到"文档语言",在满足条件的情况下选择尽可能少的语言,这样就可以降低识别产生的错误. 2.选定合适的识别区域.区域中保留有效数据就够了,不要包含过多的无效

ABBYY FineReader 12提高OCR速度的功能介绍

  "ABBYY FineReader可以帮助人们在较短的时间内完成事半功倍的任务-无论是处理常规Office文档,还是处理不定期的任务."ABBYY FineReader产品总监谢尔盖波波夫解释道."对于很多专业人士来说,ABBYY软件已经成为持续业务流程的集成部分." ABBYY FineReader提供直观的工具扫描文件,并随时将图像或照片转换成可编辑和可搜索的电子格式PDF文件,节省了手动重新输入的大量时间. FineReader可以转换几乎所有打印的文档类

用ABBYY FineReader将图片文字扫描到word的方法

  ABBYY FineReader 12是一款OCR图文识别软件,可快速方便地将扫描纸质文档.PDF文件和数码相机的图像转换成可编辑.可搜索的文本. 步骤一:首先下载安装ABBYY FineReader 12,具体安装过程请参考ABBYY FineReader 12安装指南; 步骤二:打开ABBYY FineReader 12,点击扫描到Mircosoft Word,打开要扫描到Word的jpeg图片文件; 注意:使用该功能之前,要确保电脑上安装了相应的扫描仪,否则会出现以下提示: 步骤三:打

ABBYY FineReader如何快速将图片文件转换成Word文档

  最近有朋友突然找我,问我有什么方法快速将图像文件转换成Word文档,老板临时布置任务,十万火急,作为天天跟文档资料打交道的我们,谁没遇到过这样的事,谁没因为知识的匮乏而吃过亏呢?好在经历过,也学到了不少知识,我迅速向她推荐了ABBYY FineReader 12OCR文字识别软件,帮她解决了燃眉之急. 是的,ABBYY FineReader 12是一款OCR图文识别软件,能够快速方便地将扫描纸质文档.PDF文件和数码相机的图像转换成可编辑.可搜索的文本,包括Word.Excel等格式. 使用

如何用ABBYY OCR识别技术在电脑上阅读缅甸语

  缅甸联邦共和国,原名缅甸,是东南亚的一个国家,从1962年到2010年,缅甸一直被政变后上台的军政府统治,直至最近5年它才对外界开放,与其他国家建立了贸易与文化联系. 缅甸语由很多方言组成,但所有方言都共享一个核心字母表,该核心字母表主要用于正式文本和印刷媒体,有33个辅音和12个辅助字符,地区方言可能还使用其 他字符,完整列表大约有核心字母表的三倍大.幸运的是,我们的工作是识别使用流行的至少10点大小的缅甸3字体书写的标准缅甸文本,文本图像可以是灰度. 黑白或彩色的,分辨率至少有300dp

ABBYY FineReader 12内置的自动化任务详解

  要使用ABBYY FineReader处理文档,需要完成四个步骤:获取文档图像>识别该文档>验证结果>以选取的格式保存结果.如果需要再三地重复相同的步骤,您可以使用ABBYY FineReader 12内置的自动化任务,这将可以一键执行所需操作,要处理布局复杂的文档,您可以自定义每个步骤,然后单独执行. 启动ABBYY FineReader时,将显示任务窗口,其中列有最常用处理方案的自动化任务.如果看不见任务窗口,请单击主工具栏上的任务按钮. 1. 在任务窗口中,单击左边的选项卡:

office OneNote如何识别图片中的文字

OneNote包含在Office组件中,可以用来记录文本.图像以及视频和音频.通过共享笔记本,可以和其他位置上的其他人员同时添加和编辑笔记,或者只是保持所有人同步且拥有最新信息.还可以随身携带 OneNote 2010 笔记本,以从具有 Internet 连接的任何计算机或一些移动设备中查看和编辑. 借助于OneNote中的图片文字识别这个超实用的功能,学习.工作时可以达到事半功倍的效果!当有图片中的文字需要打出来或是使用时,可以使用OneNote的文字识别功能!在OneNote中打开图片,图片

实现扫描识别车牌号码或者识别图片中的车牌号码的demo?

问题描述 实现扫描识别车牌号码或者识别图片中的车牌号码的demo? 哪位大神有实现扫描识别车牌号码或者识别图片中的车牌号码的demo? 望请发给我一份,要求识别率能达到80%以上,必有重谢. 解决方案 http://m.blog.csdn.net/blog/Linoi/17761655http://download.csdn.net/detail/haowaj/3153245 重谢不需要,如果满意点下右边的采纳就可以了.如果还有问题,可以继续开贴提问 如果采纳本回答,还可以给你一些打包好的源代码