浅谈车牌汉字识别方法-字符识别-人工智能实验室AiLab-中国人工智能网-Powered by AiLab.cn

浅谈车牌汉字识别方法

来源：互联网发布日期：2011-08-17 20:06:32 浏览：12532次

导读： 摘要：针对车牌汉字识别提出了一种基于二值图形变动分析的模糊模板匹配的车牌汉字识别方案。介绍了该方法的具体实现算法和实验流程及结果。字符识别是指对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。在识别并保留字体、字...

　　摘要：针对车牌汉字识别提出了一种基于二值图形变动分析的模糊模板匹配的车牌汉字识别方案。介绍了该方法的具体实现算法和实验流程及结果。

　　字符识别是指对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。在识别并保留字体、字号、风格、版面信息，实现版面恢复所见所得；可识别和恢复表格；自动判别和纠正文件的放置方向，便于成批处理和盲人操作；带有图像管理，允许用户观查、标记和注解文件图像。

　　人类的视觉感知系统是一个鲁棒性很强的、能抵御实际中可能遇到的各种变形和噪声干扰的文字识别系统。人们的认字过程实际上是对汉字整体形象的把握，是对汉字图像全局的处理过程[1]。因而，汉字的整体信息在无笔顺识别中起着无法替代的重要作用。

　　统计模式识别借助概率论的知识，判断或决策对象的特征类别，使得决策的错误率达到最小。基于统计特征的识别方法先抽取识别对象的稳定特征，组成特征矢量，然后在字符集的特征空间中进行特征匹配。基于以上认识，在分析汽车牌照中汉字字符的特点后，采用了有别于结构分析的一种基于字符图像特征统计的模式识别方法进行汉字识别。同时针对统计方法无法区分的相似汉字，提取其微结构信息进行特殊的校正识别。

　　1 特征统计匹配

　　统计决策论其要点是提取待识别模式的一组统计特征，然后按照一定准则所确定的决策函数进行分类判决。汉字的统计模式识别是将字符点阵看作一个整体，从该整体上经过大量统计得到所用特征，用尽可能少的特征模式来描述尽可能多的信息。所采用的方法有：特征统计的方法、整体变换分析法[3]、几何矩特征、笔划密度特征、字符投影特征、外围特征、微结构特征和特征点特征等。网格特征实际是结构模式识别和统计模式识别相结合的产物。字符图像被均匀或非均匀地划分为若干区域，称之为“网格”。具体应用：将尺寸为34×66象素的汉字二值图均匀分成32个正方形的小区域（不考虑外边框的1个象素），统计每个8×8的小区域内目标象素（白色）所占的面积比例，就得到了归一化的32维特征矢量。统计多幅相同汉字的32维特征矢量，取均值作为该汉字的标准网格特征模板。识别时，计算待识别汉字的32维网格特征矢量与模板矢量之间的Euclid距离，求得最小距离值，其对应的汉字即为识别结果。在具体应用中，由于外部原因常常会出现字符模糊、字符倾斜的情况，而网格特征匹配方法对字符模糊和倾斜较敏感，因此鲁棒性不是很强，不适合实际应用。

　　2 模板匹配

　　模板匹配是数字图像处理的重要组成部分之一。把不同传感器或同一传感器在不同时间、

　　不同成像条件下对同一景物获取的两幅或多幅图像在空间上对准，或根据已知模式到另一幅

　　图中寻找相应模式的处理方法就叫做模板匹配。简单而言，模板就是一幅已知的小图像。模板匹配就是在一幅大图像中搜寻目标，已知该图中有要找的目标，且该目标同模板有相同的尺寸、方向和图像，通过一定的算法可以

　　在图中找到目标，确定其坐标位置。以8 位图像（其1 个像素由1 个字节描述）为例，模板T（ m × n 个像素）叠放在被搜索图S（ W × H 个像素）上平移，模板覆盖被搜索图的那块区域叫子图Sij。i，j为子图左上角在被搜索图S 上的坐标。而灰度模板由于色彩、光照等因素影响，难以找到普遍适用的模板形式实现直接的匹配计算。综合以上二方面的问题，在引入统计模式识别思想的基础上，提出了基于二值图形变动分析的模糊模板匹配方案。

　　2.1 基于二值图形变动分析的模糊模板匹配

　　在含有汽车牌照的图像中，将汉字定位并提取出来以后，还要完成规格化、二值化等操作。即使是相同的汉字，由于车牌倾斜、模糊，特别是由于每次定位不可能完全精确一致等诸多因素的影响，导致在二值图中字体的形状、大小都会不同，字体位置也会发生不同程度的偏移。提出了求图形整体变动量的统计方法，其优点是不需要参照标准图形，可以进行客观评价，并构造出用于匹配识别的模糊模板。

　　对每一个车牌的汉字字符，选取n幅质量较好的参考图。将这n幅参考图规格化为17×33的标准大小后进行二值化处理，得到标准参考图fi（x，y）。因此每个车牌汉字字符都有n幅由0、1所组成的二值图像。将这n幅二值图像对齐后叠加，再进行归一化。得到的模糊图形F（x，y）。四个汉字的模糊图形模板（不同方向的视觉效果）如图1所示。

　　同的应用环境下，对匹配区域和实时性要求也不尽相同。光电探测设备需要在视频图像采集周期内（20ms）完成数据实时处理。由于目标在两场视频图像之间的移动量较小、特征变化不大，匹配区域可以大大缩小。匹配区域太小会导致目标动态特性变差，过大又会导致计算量大幅度增加，具体选择需要权衡设备参数来决定。由于CCIR制式视频信号是隔行扫描，系

　　f（x，y）为得到的二值化后的待识别图像，把所有点的置信度平均

　　3 试验结果的进一步校正

　　模板匹配表现的主要是汉字的整体特征，但是有些汉字存在着一定程度上整体的相似性，因此必须对相似的字符进行进一步的校正才能提高识别的正确率。对相似汉字的区分，往往是寻找其特有的笔划结构，这也是在统计模式识别中引入结构方法的必要之处。例如在车牌汉字识别中，“粤”字与其他省份汉字的最大区别是底部的钩状结构。为此对预处理后的17×33二值图像的底部1/4部分作水平和垂直方向的投影，水平投影17个特征值，垂直投影33个特征值，形成50维的微结构投影特征矢量。“粤”字微结构特征及其统计41幅图像后的微结构投影特征直方图如图2所示。经统计平均后作为区分相似汉字的依据。实际校正时，计算微结构特征的匹配距离。若小于预先设定的阈值，则直接返回该汉字作为识别结果。

　　4 实验流程及结果

　　对识别300幅切分后的质量较好的汉字灰度图进行识别，实验流程如图3所示。实验结果表明，外围面积特征匹配法正确率达88％，网格特征匹配法86％，简单模板匹配法91％，改进算法的正确率达到了93％。如果对识别结果进一步校正，正确率将提高到95％。若再进一步增加训练集，完善模板，相信正确率还可以继续提高。