从图像中裁剪所有书面字母以形成网站

数据挖掘 图像预处理
2022-02-27 23:13:04

在此处输入图像描述

  • 上图是手写的印地语 / deavanagari 字母

    图片。
  • 任务是使用 image 从给定的 assignment.jpg 图像中准备数据集

    加工工具
  • 我不清楚我是否可以使用 adobe photoshop 等 Photoshop 编辑工具。

  • 如果图像处理工具意味着 opencv ,是否真的可以从单个图像创建像 emnist 这样的数据集。

  • 我无法想出任何方法来将字母彼此分开

在此处输入图像描述

最后我通过结合自适应阈值、模糊和形态来完成它,检查@Salman 和@Jeru Luke的两部分字母的查找轮廓很有帮助,它真的帮助了我。

2个回答

这可以通过 OpenCV 完成。

在此处输入图像描述

代码需要:

  1. 预处理图像以增强对比度
  2. 使用 OpenCV 识别每个字符的“边界框”
  3. 将每个角色的图像保存为新文件

代码示例:http ://cvisiondemy.com/extract-roi-from-image-with-python-and-opencv/

这是一个简单的问题,当然可以使用任何照片编辑应用程序(如 Adob​​e Photoshop)来解决。这将是大量的体力劳动。

但是,如果您想自动化从这些图像中提取所有字母的过程,我建议您使用 OpenCV 并构建一个轮廓检测器并在图像中找到轮廓,然后裁剪轮廓以提取所有图像。

可以通过将图像转换为黑白或二进制图像或应用一些阈值来提高检测器的准确性。您可以在此处阅读有关 OpenCV 轮廓的更多信息。 这个博客也可能有点方便。