首页 文章
  • 1 votes
     answers
     views

    Android项目中的Neuroph OCR-手写识别库

    我正在研究Android Studio中的手写识别项目 . 来自在线资源的Neuroph OCR似乎是最能识别手写字符的人 . 我的输入是x,y坐标列表,并使用opencv drawline函数绘制它们 然后创建一个显示char的图像,可以通过手写OCR识别图像 . 任何人都可以有一些说明或示例或来源我如何使用此库?我只知道它是一个有用的库,但很少找到任何例子
  • 6 votes
     answers
     views

    在OpenCV C中将车牌标准化为OCR

    我正在做一些简单的OCR车牌识别系统 . 我正在使用HaarCascades找到车牌,然后我需要将这个盘子标准化,将其放入我的OCR模块中 . 我正在使用填充来找到车牌的主要轮廓,然后我执行霍夫变换,找到车牌的上下边界: 这是代码的一部分,我执行Hough变换^ HoughLinesP(canny_img, lines, 1, CV_PI/180, 80, 80, 30 ); for...
  • -1 votes
     answers
     views

    从自然图像中检测文本

    我在 tensorflow 中编写代码,使用 convolution neural network 来自图像中的文本 detect . 我使用TFRecords文件来读取街景文本数据集,然后,我将图像的大小调整为 128 的高度和宽度 . 我使用了9- conv layer 和 zero padding 以及三个 max_pool layer with window size of (2×2)...
  • 0 votes
     answers
     views

    日语字符编码问题

    我正在使用第三方OCR库将包含日语字符的图像转换为文本文件 . 当我通过双击打开它时创建的文本文件看起来没问题但是当我使用下面的代码在TextBox中加载它时它变得很奇怪 . this.textBox1.Text = File.ReadAllText(Outpath);
  • 2 votes
     answers
     views

    OCR与Android应用程序

    我想创建一个应用程序,人们可以在其中拍摄任何文本的照片,应用程序识别文本,复制并将其放入可编辑区域 . 文本的语言无关紧要 . 我只想自动识别角色 . 稍后的功能可以是提供文本翻译 . Android应用程序有没有ocr库?我记得google想要为ocr提供api(我在2011年得到的关于它的最新信息) . 因为它似乎还没有api .
  • 0 votes
     answers
     views

    使用tesserocr库使用Python进行文本识别

    我想从an image捕获一个文本,我正在使用下面的这个脚本(script source) import cv2 import numpy as np import tesserocr from PIL import Image # Path of working folder on Disk src_path = "C:/Users/fyunu/OneDrive/Masaüstü/a...
  • 2 votes
     answers
     views

    图像中的文本检测

    我正在使用下面的示例代码,使用coreml和vision在图像(非手写)中进行文本检测 . https://github.com/DrNeuroSurg/OCRwithVisionAndCoreML-Part2 在这里他们使用机器学习模型,它只支持大写和数字 . 在我的项目中,我想要大写,小写,数字和少数特殊字符(如:, - ) . 我没有任何python经验来进行必要的更改并使用列车数据生成所需...
  • 0 votes
     answers
     views

    使用计算机视觉应用程序将图像中的表格按空白分割成行

    由于我缺乏专业知识,我试图解决我所意识到的非常难以解决的问题 . 假设我有一个包含3行和5列的表的图像 . 每行包含文本(现在假设只有英文)或数字(正常的印度 - 阿拉伯数字) . 列之间和每行之间只有空格 . 现在假设所有行和所有列都是对齐的,我的任务是获取一个算法来识别并从文档中提取每一行(不知道我是否足够清楚地表达了这一行) . 有人可以提出一个很好的起点(图书馆,类似的例子,处理类似这样的...
  • 0 votes
     answers
     views

    Android:NullPointer异常

    这是我在Logcat中得到的错误 . 04-23 08:00:07.524: E/AndroidRuntime(1384): FATAL EXCEPTION: main 04-23 08:00:07.524: E/AndroidRuntime(1384): java.lang.RuntimeException: Unable to start activity ...
  • 16 votes
     answers
     views

    PDF的批量OCR程序[关闭]

    以前曾经问过,但我真的不知道这些答案对我有帮助 . 这是我的问题:我得到了一堆(10,000左右)pdf文件 . 有些是使用adobe的打印功能保存的文本文件(所以他们的文本是完美的,我不想冒险搞砸它们) . 有些是扫描图像(所以他们没有任何文字,我将不得不接受OCR) . 文件在同一目录中,我无法分辨哪个是哪个 . 最终我想将它们转换为.txt文件,然后对它们进行字符串处理 . 所以我希望最准确...
  • 0 votes
     answers
     views

    使用不正确的结构OCR从PDF中提取数据

    我有定期流入的发票pdfs . 我从这些pdf中提取数据以进行各种操作和存储 . 这是一个示例部分: 第一步是使用Adobe的OCR . 然后,我使用tika来解析pdf . 在Python中: from tika import parser parsedPDF = parser.from_file("the_file.pdf") 这是预期的输出: ... 001 6 0 6...
  • 0 votes
     answers
     views

    根据标签识别PDF文本分组

    我正在从一大堆PDF文档中提取信息 . 在这些文件中,有多种格式的信息,包括正常段落和更多“结构化”数据,其中信息由空白区域传达 . 例如,有时这些报告中的“表格”将采用以下格式: Key Key Key Value Value 而有时则会是: Key 值 Key 值 Key 值 现在我正在使用PDFMiner来提取文本,但它通常只适用于一种格式(垂直或水平) . 我'm differe...
  • 7 votes
     answers
     views

    具有要由OCR识别的文本的Deblur图像

    我有一个模糊的图像: 这是名片的一部分,它是相机拍摄的一个框架,没有适当的焦点 . 清晰的图像看起来像OCR一样好 . 我试过了: 不同种类的HPF, 拉普拉斯, Canny探测器, 形态操作的组合(开放,关闭) . 我也尝试过: 使用维纳滤波器进行反卷积, deconvolution和Lucy-Richardson方法 . 但要找到合适的PSF(点扩散函数)并不容...
  • 3 votes
     answers
     views

    从屏幕抓取中解析文本

    不确定最好的解释方法,但我会试一试 . 我试图找到一种方法来解析C#或Java中的屏幕抓取中的文本/数字 - 无论哪种方式提供最简单的方法,但最好是java . 一个例子如下 . 您有一个带有文本块的网站/文档/应用程序 . 您可以截取包含此文本的特定区域的屏幕截图 . 截取屏幕截图后,您可以从中提取包含相关字符的字符串 . 任何反馈都表示赞赏 . 谢谢
  • 2 votes
     answers
     views

    使用OpenCV和pytesseract进行实时OCR

    我正在尝试开发基本的实时OCR来读取一个小文本块 . 我使用OCR的文本处理帧捕获帧,删除噪声,添加阈值,复制帧并将其传递给pytesseract以进行文本识别 . OCR的帧处理顺利通过,但是当pytesseract处理帧以提取文本时,它会经历大量滞后 . 我尝试通过为tysseract添加白名单选项来改善结果,但它无法解决性能问题 . 有没有办法绕过滞后?使用OpenCV深度学习文本识别能否...
  • 0 votes
     answers
     views

    在Jupyter中找不到文件

    我刚开始使用Python和Jupyter,所以我提前为一个简单的问题道歉 . 我已经安装了Tesseract,一个OCR,用于从图像中提取文本,我在查找图像时遇到了问题 . 如何指定图像的位置?这是我的代码如下 . import pytesseract from PIL import Image img = Image.open('539_2272.png') pytesseract.pytess...
  • 0 votes
     answers
     views

    TensorFlow DeepOCR无法提供形状值

    我想要照片中的OCR文字 . 阅读this文章我看到了github项目 . 我很想工作 但...我删除了 TFModel 文件夹中的所有文件 . 要重新创建 .当我跑 DeepOCR.py给出以下错误 . ValueError:无法为Tensor'FFIM:0'提供形状值(512,17,704,3),其形状为'(?,18,640,3)' 感谢你们对我的帮助
  • 13 votes
     answers
     views

    数字识别的建议

    我正在编写一个Android应用程序来从图片中提取数独谜题 . 对于9x9 Sudoku网格中的每个单元格,我需要确定它是否包含数字1到9之一或是空白 . 我从像这样的Sudoku开始: 我使用OpenCV预处理数独,以提取各个数字的黑白图像,然后将它们通过Tesseract . 但Tesseract有一些限制: Tesseract很大,包含许多我不需要的功能(即全文识别),并且需要英语培训...
  • 4 votes
     answers
     views

    如何在Android中使用OpenCV Tesseract进行准确的文本识别?

    我正在尝试使用OpenCV(Android)来处理使用相机拍摄的图像,然后将其传递给Tesseract进行文本(数字)识别,但是直到图像非常(几乎没有噪音)才能获得良好的效果 . 目前我正在对拍摄的图像进行以下处理:1 . 应用高斯模糊 . 2.自适应阈值:对图像进行二值化 . 3.反转颜色使背景变黑 . 然后将处理后的图像传递给Tesseract . 但我没有取得好成绩 . 请建议我在进入T...
  • 3 votes
     answers
     views

    使用tesseract在图像上进行OCR之前使用opencv进行图像处理

    我一直在努力训练tesseract引擎到ocr图像,这些图像使用七种数字字体编写 . 并且,在搜索之后,事实证明tesseract将不会分割字体,除非片段以某种方式连接 . 所以,我在图像上使用了侵蚀,这是一个opencv函数来连接段 . http://www.tutorialspoint.com/java_dip/eroding_dilating.htm 然后,在将图像处理到tesserac...
  • 2 votes
     answers
     views

    Tesseract OCR数字分类结果不佳

    我正在进行图像分类任务,我正在使用Tesseract OCR进行数字分类 . 我的主要问题是从单个数字的OCR收到非常糟糕的结果 . 在网上阅读了很多关于提高Tesseract性能的内容之后,我使用以下一般方案使用OpenCV预处理图像: 寻找轮廓 边界框 裁剪到方框以获得个位数 阈值来获取二进制图像 通过添加白色背景填充图像 模糊 . 我得到的东西我很满意,例如: ...
  • 4 votes
     answers
     views

    在Android中使用SSOCR进行7段显示

    我正在尝试识别Android中的数字数字 . 我使用OpenCV进行图像处理,使用OCR引擎进行Tessreact . 但结果仍然很差 . 我找到了关于SSOCR表格this . 因此我想在Android中使用SSOCR(七段光学字符识别) . 它是用C语言编写的 . 任何人都建议我如何在我的Android应用程序中使用SSOCR或者有更好的方法来识别tessreact的数字数字 .
  • 1 votes
     answers
     views

    Applescript或Automator:运行Acrobat X Pro批量处理OCR多个PDF文件,等等

    我正在使用ScanSnap S1500M将所有纸质文档扫描到文件夹/ PDF扫描/ - 我想使用Adobe Acrobat X Professional来OCR文本 . 我想自动化这个过程(每天): 打开Acrobat X Pro 批处理OCR处理/ PDF-scans /中的PDF文件,将"-OCR"追加到文件名在OCR之后 ,将文件移动到/ PDF-ocr /...
  • 20 votes
     answers
     views

    如何知道PDF是否仅包含图像还是已经过OCR扫描以进行搜索?

    我有一堆来自扫描文档的PDF文件 . 这些文件包含图像和文本的混合 . 有些被扫描为没有OCR的图像,因此每个PDF页面都是一个大图像,即使整个页面完全是文本 . 其他人使用OCR进行扫描,并包含图像和可搜索的文本,其中包含文本 . 在许多情况下,甚至图像中的文字也可以搜索到 . 我想使用OCR,使用Acrobat 8 Pro进行自动处理以识别所有扫描文档中的文本,但我不想重新OCR过去已经通过O...
  • 0 votes
     answers
     views

    Adobe acrobat 8命令行切换以识别ocr文本

    我想使用命令行,执行许可的adobe acrobat 8来识别OCR文本已扫描的pdf文档,并使其完全可搜索pdf? 你知道什么是命令行开关,参数? 提前致谢!
  • 0 votes
     answers
     views

    检查PDF是否可搜索

    我写了一个bash脚本,从扫描的PDF文件中提取纯文本 . 我有很多PDF,但有些是扫描的,有些则不是 . 所以现在我的主要目标是通过检查PDF是否已经可搜索来改进我的脚本,因此不需要提取OCR . 我试过了: pdftext -nopgbrk pdf_file.pdf wordlist 在 wordlist 中存储可能的OCR文本,那么我可以检查它是否是可搜索的PDF . 我也试过 pdffon...
  • 2 votes
     answers
     views

    openCV KNN findNearest Error

    我试图实现KNN findNearest函数 . 我的程序应识别图片中的数字,但如果程序使用findNearest,我会收到错误 . 这是代码: `private void searchingData() { img_gray = new Mat(); img_blur = new Mat(); img_thres = new Mat(); Imgproc.cv...
  • 24 votes
     answers
     views

    日本最准确的开源OCR? [关闭]

    根据您的经验,什么是最准确的开源光学字符识别(OCR)库/软件来阅读日文文本? 我刚试过nhocr,即使是非常干净的高清文件,它的错误率也超过了2% .
  • 12 votes
     answers
     views

    使用Android相机的简单OCR应用程序[重复]

    可能重复:android OCR? 我想要构建一个应用程序,它具有使用相机的OCR扫描仪,并从纸张中检测文本并转换为常规文本 . 一个简单的程序 . 我怎么能这样做?什么是最简单的方法?
  • 33 votes
     answers
     views

    字符识别(OCR算法)[关闭]

    我正在开发一个项目,我必须开发OCR算法(我必须从Image中读取文本,然后将其转换为不同的语言) . 所以我的第一个任务是从图像中获取文本 . 完成第一项任务的步骤 . 从给定来源加载任何图像格式(bmp,jpg,png) . 然后将图像转换为灰度并使用阈值(Otsu算法)对其进行二值化 . //完成(如何从输出图像中删除噪声???) 结果 检测分辨率和反转等图像特征 . 这样我们...

热门问题