如何从扫描的文档中提取文本?

信息处理 图像处理 matlab 信号分析 计算机视觉 机器学习
2022-02-23 20:21:14

输入演示图像

我面临的任务是从扫描图像(附加图像)中提取旋转文本(任何角度)。图像上包含一个蓝色标签,需要从中提取文本(打印文本)的方法。贴纸的图案将始终保持不变。

如您所见,方向不稳定,如果有人能提出一种我可以提取文本的方式,我将不胜感激。

可以在这里找到问题的参考,或者技术如何删除文档图像中的文本区域?或从文档图像中提取图像

谢谢

1个回答

我认为您的工作流程应该是这样的:

1)检测矩形。

2)找到矩形的方向。

3)旋转矩形并将其放置在新图像中。

4) 将矩形两次送入 OCR(一次是计算出的方向,另一次是矩形旋转 180 度,因为您不确定它的方向是否正确)。

5) 找出哪个 OCR 输出更有意义。

6)瞧!

更多细节:

1)检查这个OpenCV教程来检测简单的形状(在你的情况下是矩形) http://opencv-code.com/tutorials/detecting-simple-shapes-in-an-image/

2)如果你使用前面的教程,你有矩形的四个边。计算最长边与 x 轴之间的角度。

3)我不知道您的图像处理技能水平,但是旋转矩形的像素并将其放入另一张图像中应该是直截了当的(我建议使用线性插值)。

4)我在OCR方面没有太多经验,但是根据交流中的许多答案,我想您可以使用现成的OCR。