可以关注下,会出代码
这道题整体来说是先对图像进行预处理(形态学去噪、锐化、图像增强等),图像处理也会很影响后续得图像分割效果,这道题其实思路简单,但是操作起来很麻烦,图像中有很多划痕,而且文字角度也不一样,加大了难度。首先基于Train中的图像,根据json的信息,注意下"ann"中的前四个数字是两个对角线点坐标,写代码将每个字体小图像按照坐标范围提取出来,保存为小图像,然后分别对字体图像进行拉伸和旋转得到新的图像,首先同经过该步骤构建字体图像集,之后就是直接可以遍历图像去提取字体了,设置一个相似度阈值,阈值达到一定,则提取字体并记录字体在图像中的两对角线像素坐标。最后提示一些图像处理中用到的函数:imresize(调整图像大小)、rgb2gray(灰度化)、histeq/imadjust/adapthisteq(对比度增强)、imfilter(线性滤波)、conv2(卷积)、medfilt2(中值滤波)