求解调用微软MODI进行OCR识别抛出“OCR running error”问题,求指教!

问题描述

我现在可以进行OCR识别,但有一个问题:当我选择的识别区域较小(或者说文字较少)时,抛出错误信息“OCRrunningerror”,不知道是什么原因,有人说是电脑因素(我的开发环境:VS2008+Office2007+sp2补丁),有的说截取图像要作处理,不知道原因为何、、我想要的效果是:即便选择一个汉字或数字也可以进行识别!我的识别关键代码://创建一个临时文件stringstrFileName=string.Format("{0:yyyy_MM_dd_HH_mm_ss_ffff}",DateTime.Now)+".tif";try{//位图对象保存到一个TIFF文件m_obj.Save(strFileName,ImageFormat.Tiff);//实例化MODI.Document对象MODI.Documentmd=newMODI.Document();md.Create(strFileName);//运行OCRmd.OCR(MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED,true,true);//定义要识别的语言种类//这个字符串将包含文本stringstrText=String.Empty;//获得第一个图片MODI.Imageimage=(MODI.Image)md.Images[0];//获取布局MODI.Layoutlayout=image.Layout;//遍历文字for(intj=0;j<layout.Words.Count;j++){//得到文字MODI.Wordword=(MODI.Word)layout.Words[j];//添加一个空格来分隔文字if(strText.Length>0){strText+="";}//添加文字strText+=word.Text;}//关闭对象layout=null;image=null;md.Close(false);md=null;GC.Collect();GC.WaitForPendingFinalizers();//创建对话框显示文本的文本识别ShowTextst=newShowText();//该对话框的文本st.m_strOCRText=strText;//显示的对话框st.ShowDialog();}catch(Exceptionex){MessageBox.Show(ex.Message.toString());}try{//删除临时文件File.Delete(strFileName);}catch{}

解决方案

解决方案二:
我在XP和win7环境下都作了测试,可是问题还是依然,是不是我还有哪些配置没有设置?求顶!
解决方案三:
把你要识别的图像区域放在一个定尺寸的图像中,比如500*750的尺寸,然后对图像进行处理一下,比如纯色处理,锐化处理,这样可以提高识别度!
解决方案四:
可是我要的是即便选择一个字符也能识别,不是特定范围内的某个尺寸大小。引用2楼的回复:

把你要识别的图像区域放在一个定尺寸的图像中,比如500*750的尺寸,然后对图像进行处理一下,比如纯色处理,锐化处理,这样可以提高识别度!

解决方案五:
看来你没理解,MODI识别失败是因为你输入的图像尺寸过小,为了规避这个问题,你每次给MODI识别的图像要超过一定的尺寸,我没有认真测试过,但是每次识别的图片尺寸在大于500*750的文字图片都是成功的。所以我想你可以这让测试,假定一个带是别的图片只有一个英文字符,把这个图片的尺寸变成500*750的,然后给MODI试试看能不能识别成功!如果成功,那么你的思路就有了!
解决方案六:
可以识别了,可是给客户配置运行环境应该怎么配置呢引用4楼的回复:

看来你没理解,MODI识别失败是因为你输入的图像尺寸过小,为了规避这个问题,你每次给MODI识别的图像要超过一定的尺寸,我没有认真测试过,但是每次识别的图片尺寸在大于500*750的文字图片都是成功的。所以我想你可以这让测试,假定一个带是别的图片只有一个英文字符,把这个图片的尺寸变成500*750的,然后给MODI试试看能不能识别成功!如果成功,那么你的思路就有了!

解决方案七:
共享一下你的代码包!!可以吗???
解决方案八:
引用5楼cjwlz的回复:

可以识别了,可是给客户配置运行环境应该怎么配置呢[Quote=引用4楼的回复:]看来你没理解,MODI识别失败是因为你输入的图像尺寸过小,为了规避这个问题,你每次给MODI识别的图像要超过一定的尺寸,我没有认真测试过,但是每次识别的图片尺寸在大于500*750的文字图片都是成功的。所以我想你可以这让测试,假定一个带是别的图片只有一个英文字符,把这个图片的尺寸变成500*750的,然后给MODI试试看能不能识别成功!如果成功,那么你的思路就有了!

楼主怎么解决的?一个英文字母也能识别么
解决方案九:
你好我遇到和你一样的问题,请问你解决了吗求解
解决方案十:
使用png,不使用tiff格式图像。
解决方案十一:
这尼马,还真是要500x750以上
解决方案十二:
楼主,请问你这样调用ocr识别时,大量图片进行识别时,你有内存泄露的问题吗

时间: 2024-09-07 23:59:48

求解调用微软MODI进行OCR识别抛出“OCR running error”问题,求指教!的相关文章

求解调用微软MODI进行OCR识别出现文字少无法识别的问题

问题描述 求解调用微软MODI进行OCR识别出现文字少无法识别的问题 此图大小为1023X766,为无法识别的图像!求各路大神解答,小女子感激不尽~ 解决方案 文字识别有一定的局限性,或者你用汉王的试试

modi-关于调用MODI 使用OCR识别图片里的文字时遇到内存访问冲突

问题描述 关于调用MODI 使用OCR识别图片里的文字时遇到内存访问冲突 在用OCR识别 某些图片的时候 图片的时候 程序会直接崩溃,只有一些,而且把那些图片用画图打开然后保存关闭 再使用OCR识别 就能正常运行,这种情况是什么问题?有没有什么好的解决办法?

用OCR识别程序将图片转为Word

有时候我们手里会有一些通过扫描仪.数码相机或高清摄像头得到的文字资料图片,这时候,我们可以借助Office自带的OCR识别程序将这些图片转成Word文档,这可比单单看图片方便多了. 1.将文档存为TIFF格式图片 先使用扫描仪或数码相机等设备将文档扫描或是拍摄成图片,如果是用扫描仪扫描的话,直接保存成TIFF格式,如果是拍摄的图片,可以通过系统自带的画图软件将其打开并另存为"TIFF格式". 2.打开Office的OCR识别功能 现在能识别图片文字的软件很多,如果手边没有,不妨试试Of

Office自带OCR识别程序转扫描资料为word

  有时候我们手里会有一些通过扫描仪.数码相机或高清摄像头得到的文字资料图片,这时候,我们可以借助Office自带的OCR识别程序将这些图片转成Word文档,这可比单单看图片方便多了. 1.将文档存为TIFF格式图片 先使用扫描仪或数码相机等设备将文档扫描或是拍摄成图片,如果是用扫描仪扫描的话,直接保存成TIFF格式,如果是拍摄的图片,可以通过系统自带的画图软件将其打开并另存为"TIFF格式". 2.打开Office的OCR识别功能 现在能识别图片文字的软件很多,如果手边没有,不妨试试

求解!!MyEclipse抛出的异常!!

问题描述 descriptionTheserverencounteredaninternalerror()thatpreventeditfromfulfillingthisrequest.exceptionorg.apache.jasper.JasperException:AnexceptionoccurredprocessingJSPpage/denglu.jspatline2522:username=request.getParameter("username");23:pwd=r

【Win10 应用开发】OCR识别

原文:[Win10 应用开发]OCR识别 OCR,即Optical Character Recognition,光学字符识别.以下介绍来自搜索: OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗.亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程:即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软

tesseract ocr 识别身份证号

问题描述 tesseract ocr 识别身份证号 怎么用tesseract ocr识别身份证号呀,识别身份证号的字库需要自己训练吗? 求大神指点给个思路啊!!! 解决方案 tesseract-ocr识别字符 解决方案二: 身份证比较标准,不需要怎么训练就可以用.先对图像二值化,去掉底纹.

OCR识别错误怎么办?

  很多网友都喜欢利用一些OCR软件识别软件将纸质材料扫描称电子文档,不过,使用OCR软件识别使用的时候,有时候会出现一些文字识别错误,比如说,把"引"字识别成"弓1"或"弓i"."弓l".那么,遇到OCR软件识别软件识别错误的时候,该怎么处理呢?下面,小编就给大家分享一下使用金山wps查找跟替换功能来解决这一问题的方法! 查找与替换 哈哈,找到本"砖家"就算找对人了.本"砖家"不客气地

WPS中活用查找替换修正OCR识别错误

  朋友小A在整理一份材料时,经常会用扫描仪将已有的纸质材料转换成电子文档,但是,用OCR软件识别出来的文字,总把"引"字识别成"弓1"或"弓i"."弓l".他使用WPS文字中的替换功能,选使用通配符,用"引"替换"弓*",结果是只替换了"弓"字,而后面的那个字母没有被替换掉,因此向本"砖家"求教. 哈哈,找到本"砖家"就算找对