首页 文章
  • 1 votes
     answers
     views

    发生了'System.Windows.Markup.XamlParseException'类型的未处理异常

    我使用VS 2012来完成这个tesseract代码项目 . 我使用tesseract创建了WPF(C#项目)import tesseractengine3.dll set; 并创建变量: TesseractProcessor test = new TesseractProcessor() ; 然后在调试模式下编译代码(x86,目标.net 4) 它显示错误消息对话框 "An unha...
  • 0 votes
     answers
     views

    Ruby on Rails tesseract-ocr gem path错误

    我在rails上使用ruby来运行一些OCR任务 . 我正在尝试使用tesseract-ocr gem(https://github.com/meh/ruby-tesseract-ocr) . 在我的Gemfile中,如果tesseract-ocr gem列出如下:gem 'tesseract-ocr' 我收到以下错误: C:\Users\Redacted\Desktop\Rails\cx-mas...
  • 4 votes
     answers
     views

    缺少或不兼容的文件:ImportError:DLL加载失败:%1不是有效的Win32应用程序

    问题: 尝试将python-tesseract导入我的项目时出现此错误(OCR功能): ImportError: DLL load failed: %1 is not a valid Win32 application. 我不知道究竟是什么问题 我没有技能和知识来追踪这类问题的根本原因 . 背景: 据我了解,tesseract是一个32位应用程序 . 我正在使用64位python运行W...
  • 1 votes
     answers
     views

    平面图文本识别和OCR

    目标是使用文本识别方法(例如:OpenCV)为美国平面图图像创建边界框,然后可以将其输入文本阅读器(例如:LSTM或tesseract) . 已经尝试了几种已经尝试过cv2.findContours和cv2.boundingRect方法的方法,但很大程度上未能推广到不同类型的楼层平面图(楼层平面图的外观存在很大差异) . 例如,在应用cv2.findContours函数之前,使用灰度,自适应阈值,...
  • 1 votes
     answers
     views

    联系表单7 Wordpress插件无法正确呈现

    我正在使用用于wordpress页面的Contact Form 7插件创建自定义表单:http://dentclaims.com/contact,单选按钮和复选框出现在单独的行中 . 我使用以下内容: Tesseract Wordpress主题v2.1 - Wordpress v4.3.1 - 适用于Mac的Chrome版本46.0.2490.80(64位) 以下是CF7表格中的代码: &l...
  • 9 votes
     answers
     views

    Tesseract - 错误net.sourceforge.tess4j.Tesseract - null

    创建了一个使用Tesseract的java应用程序,以便将给定的图像或pdf转换为字符串格式,当在我的机器上运行它作为使用junit的单元测试时,它运行良好但运行完整系统时这是一个由tomcat运行的restFul API接收图像并运行Tesseract它给我以下错误: 23:22:36.511 [http-nio-9999-exec-3]错误net.sourceforge.tess4j.Tes...
  • 6 votes
     answers
     views

    无法加载库'tesseract':libtesseract.so:无法打开共享对象文件:没有这样的文件或目录

    我已经在我的MBP上运行了tesseract和Tess4J一段时间了 . 今天我开始将我的应用程序迁移到服务器并开始在服务器上安装所有内容 . 在tomcat中运行Tess4J之前,我尝试运行一个简单的java程序,以确保一切都很好,花花公子 . 不是... 我在centOS 64位服务器上 我已经安装了tesseract,它的工作正常 - tesseract myimage.jpg ...
  • 2 votes
     answers
     views

    提高速度pytesseract OCR

    我正在使用pytesseract v.0.1.5和tesseract v.3.02.02来分析大量的jpeg图像 . 质量非常好,但速度有点问题 . 在我的设置(i5-4460,8GB Ram)中,OCR需要大约25秒才能处理100张图像(1900x250) . 在同一台机器上,Matlab 2014b OCR也基于谷歌的tesseract代码,速度提高了30% . 是否有修改OCR的设置(例如删...
  • 20 votes
     answers
     views

    使用OpenCV预处理Tesseract OCR的图像

    我正在尝试开发一个应用程序,它使用Tesseract识别手机摄像头拍摄的文档中的文本 . 我正在使用OpenCV预处理图像以便更好地识别,应用高斯模糊和阈值方法进行二值化,但结果非常糟糕 . Here是我用于测试的图像: 和here预处理图像: 我可以使用其他过滤器来使Tesseract的图像更具可读性吗?
  • 3 votes
     answers
     views

    PyTesseract - 将OCR限制为一组字符

    我有pytesseract的麻烦 . 我知道你可以使用命令行参数将tesseract限制为一组特定的字符: tesseract input.tif output nobatch digits 我发现一些人说他们可以在python中用以下几行来限制tesseract: import tesseract ocr = tesseract.TessBaseAPI(); ocr.Init(".&...
  • 13 votes
     answers
     views

    Pytesseract OCR多配置选项

    我有pytesseract的一些问题 . 我需要将Tesseract配置为配置为接受单个数字,同时也只能接受数字,因为数字零通常与“O”混淆 . 像这样: target = pytesseract.image_to_string(im,config='-psm 7',config='outputbase digits') 非常感谢, 尼尔
  • 1 votes
     answers
     views

    Pytesseract TesseractNotFoundError [Python 3]

    我使用pytesseract得到一个错误 . 我是通过pip install安装的 . 码: import pytesseract from PIL import Image img = Image.open('frame_0000.png') x = pytesseract.image_to_string(Image.open('frame_0000.png')) 错误发生在最后一行 . ...
  • 1 votes
     answers
     views

    使用pytesseract时,TesseractError:( - 1073741819,u'')

    我正在使用pytesseract来包含英语和希伯来语的图像 . 在其中一些它工作正常但在其他人发生以下错误: 回溯(最近一次调用最后一次):文件“C:\ Users \ User \ Desktop \ ocr.py”,第47行,文本= pytesseract.image_to_string(Image.open(filename),lang =“heb eng”)文件“C:\ Python27...
  • 11 votes
     answers
     views

    使用Tesseract OCR进行汉字识别

    我一直在使用Tesseract 3.0.2 OCR SDK进行图像文本提取 . 但是,如果我使用中文文本图像并通过OCR,那么Tesseract不会提供中文字符而不是我获得数字和英文字符 . 但是我需要在我正在使用的图像中显示中文字符 . 我怎样才能做到这一点?有什么方法可以获得汉字而不是任何其他字符吗?
  • 0 votes
     answers
     views

    使用tesseract ocr检测旋转字符(字母)的建议

    作为学生无人机项目的一部分,我们需要在一系列无字体文本的单字符图像上运行OCR . 使用Tesseract OCR大部分都是微不足道的,因为角色是高分辨率且定义明确的,但是我们正在与一个未知的角色挣扎 - 图像中角色的方向是未知的 . 通过分析周围环境,我们可以缩小范围,以便最终得到OCR图像,其中文本基线与图像的顶部,底部,左侧或右侧对齐 . 我们目前的方法是训练Tesseract,如果它识别一...
  • 5 votes
     answers
     views

    使用ImageMagick删除收据图像边框

    我'm using ImageMagick service to pre-process the receipt image before using tesseract-OCR engine to extract texts. I need to remove the background of the receipts. I'已经通过掩蔽去除边框here.但我无法为收据创建掩码 . 但是,我试...
  • 0 votes
     answers
     views

    如何使用python从扫描的文档中提取文本

    我试过这个例子,https://github.com/madmaze/pytesseract import Image import pytesseract print pytesseract.image_to_string(Image.open('image1.png')) 获取错误:文件“/usr/lib/python2.7/subprocess.py”,第1327行,在_execute_...
  • 2 votes
     answers
     views

    使用OpenCV和pytesseract进行实时OCR

    我正在尝试开发基本的实时OCR来读取一个小文本块 . 我使用OCR的文本处理帧捕获帧,删除噪声,添加阈值,复制帧并将其传递给pytesseract以进行文本识别 . OCR的帧处理顺利通过,但是当pytesseract处理帧以提取文本时,它会经历大量滞后 . 我尝试通过为tysseract添加白名单选项来改善结果,但它无法解决性能问题 . 有没有办法绕过滞后?使用OpenCV深度学习文本识别能否...
  • 0 votes
     answers
     views

    在Jupyter中找不到文件

    我刚开始使用Python和Jupyter,所以我提前为一个简单的问题道歉 . 我已经安装了Tesseract,一个OCR,用于从图像中提取文本,我在查找图像时遇到了问题 . 如何指定图像的位置?这是我的代码如下 . import pytesseract from PIL import Image img = Image.open('539_2272.png') pytesseract.pytess...
  • 2 votes
     answers
     views

    使用等高线从图像中提取文本区域 - Opencv,Python

    我一直在使用python中的opencv开发名片的OCR项目 . 直到现在,我已经能够裁剪图像卡 . 我试图使用轮廓检测裁剪图像中的文本区域 . (即,拍摄Canny图像,从这些边缘找到轮廓并将它们扩大以获得连接的组件,这些组件必须是文本区域) . 当我试图检测闭合的连接组件时,一些轮廓覆盖了除文本之外的额外部分(如符号),如this图像 . 因此,在这些文本区域上应用tesseract-ocr...
  • 0 votes
     answers
     views

    使用Kivy App Tesseract OCR

    是否可以将Tesseract-OCR(或Tess-Two)与Kivy应用程序集成?我正在寻找使用Kivy Framework为基于OCR的文本识别创建一个Android应用程序 . 我已经在我的电脑上使用Tesseract API了一段时间,我想知道是否有办法利用它的功能为Kivy应用程序 . 如果不是,还有其他选择吗?
  • 112 votes
     answers
     views

    图像处理,以提高tesseract OCR的准确性

    我一直在使用tesseract将文档转换为文本 . 文档的质量范围非常广泛,我正在寻找有关哪种图像处理可能会改善结果的提示 . 我注意到高度像素化的文本 - 例如由传真机生成的文本 - 对于tesseract来说特别难以处理 - 可能是角色的所有锯齿状边缘都会混淆形状识别算法 . 什么样的图像处理技术可以提高准确度?我一直在使用高斯模糊来平滑像素化图像并看到一些小的改进,但我希望有更具体的技术可以...
  • 68 votes
     answers
     views

    android中最好的OCR(光学字符识别)示例[关闭]

    我想在android中运行OCR的一个例子,我做了一些研究并找到了一个在android中实现OCR的例子 . https://github.com/rmtheis/tess-two并且其中有三个项目文件...... 双眼 tess-two tess-two-test 我通过导入三个项目文件执行了“tess-two-test”项目,但“tess-two-test”不包含任何活动,因此...
  • 0 votes
     answers
     views

    实时文本识别(OCR)

    我想知道是否可以在iPhone实时摄像头模式下操作OCR而无需拍摄照片?字母数字文本遵循可预测的或有时固定的组合(类似于序列号) . 我已经尝试过OpenCV和Tesseract,但我无法想象在现场摄像头上进行一些图像处理的方法 . 我只是不知道我必须认识到我期待的文本!我可以使用其他任何库来完成这一部分吗?
  • 1 votes
     answers
     views

    OCR识别改进

    我正在使用tesseract对某些视频流进行一些识别 . 我需要帮助改进,也可能正在寻找其他图像识别库 . 我有许多具有不同元素的流,因此每个流都必须设计为不同的识别 . 所以目前的流量都在抽搐 . 其中一个问题是,有时抽搐流的质量不同 - 我有720p,480p,360p . 我需要知道的是获胜团队和得分 . 主要问题atm是tesseract无法识别360p流中图像上的字符或字体 . 这是示例...
  • 1 votes
     answers
     views

    Unity3D - OCR号码识别

    我们的初始用例要求在Unity3D中编写应用程序(仅在C#中编写并同时部署到iOS和Android),允许移动电话用户将他们的相机保持到杂志文章的 Headers ,使用OCR来阅读 Headers ,然后我们将在后端处理该 Headers 以获取相关故事 . 由于其快速的原生字符识别,Vuforia对于这个用例来说是最好的 . 在初始应用程序进行了一些演示之后,出现了更多潜在用途 . 任何只需要...
  • 2 votes
     answers
     views

    从圆形边框内提取文本

    我正在尝试使用Python和OpenCV开发一个脚本来检测扫描仪器图上的一些突出显示的区域,并使用Tesseract的OCR功能输出文本 . 我的工作流程首先检测感兴趣区域的一般附近,然后应用处理步骤除去文本块(线条,边框,噪声)之外的所有内容 . 然后将处理后的图像输入Tesseract的OCR引擎 . 此工作流程适用于大约一半的图像,但由于文本触摸边框而导致其余部分失败 . 我将在下面展示一些...
  • 0 votes
     answers
     views

    使用Tesseract增加传真OCR

    各位大家好,感谢您的帮助 . 我正在学习使用Tesseract进行OCR和传入传真的文本提取 . 我试图阅读的许多TIFF文件看起来质量很好(灰度),并且是计算机生成的文档,即没有手写,没有需要旋转等等 . 但是,我只能达到约77%的准确率和我认为应该发生更多错误 . 是否有任何改进识别的最佳实践,请记住,我无法控制入站质量,还要记住我需要从多页文档中提取 . 任何帮助或示例将不胜感激 .
  • 1 votes
     answers
     views

    Tesseract“_OBJC_CLASS _ $ _ G8Tesseract”,引自:

    <<< xcode链接器错误消息>>> “_OBJC_CLASS _ $ _ G8Tesseract”,引自:CalendarViewController.o中的objc-class-ref ld:未找到架构x86_64的符号 <<<导入头文件>>> 导入“TesseractOCRiOS / TesseractOCR / Te...
  • 13 votes
     answers
     views

    数字识别的建议

    我正在编写一个Android应用程序来从图片中提取数独谜题 . 对于9x9 Sudoku网格中的每个单元格,我需要确定它是否包含数字1到9之一或是空白 . 我从像这样的Sudoku开始: 我使用OpenCV预处理数独,以提取各个数字的黑白图像,然后将它们通过Tesseract . 但Tesseract有一些限制: Tesseract很大,包含许多我不需要的功能(即全文识别),并且需要英语培训...

热门问题