基于数字图像处理的车牌识别研究
姓名:陈永超申请学位级别:硕士专业:控制理论与控制工程
指导教师:李汉强
20060401
武汉理工大学硕士学位论文摘要车牌识别是一项涉及到数字图像处理、计算机视觉、模式识别、人工智能等多门学科的技术,它在交通监视和控制中占有很重要的地位,己成为现代交通工程领域中研究的重点和热点之一。该项技术应用前景广泛,例如用在自动收费系统、不停车缴费、失窃车辆的查寻、停车场车辆管理、特殊部门车辆的出入控制等等。车牌识别一般可以分为车牌的定位、牌照上字符的分割和字符识别三个主要组成部分。本文研究了进行车牌识别的各项关键技术,在分析了近年来一些典型的车牌识别算法的基础上,最终确定一系列有效的算法对车牌进行识别。在车牌定位上,本文根据车牌图像在HsV色彩空间各分量的取值范围规律,首先对符合该取值范围的像素进行色彩过滤,然后利用数学形态学进行处理,形成多个符合车牌颜色特征的连通区域。接下来,分别根据车牌的形状特征和车牌上字符的纹理特征,逐步对得到的连通区域进行分析和排除,从而得到车牌区域。该定位方法优点是可以过滤掉车牌临近区域那些颜色、纹理与车牌特征不符合的干扰纹理,如栅格、边框等。在字符分割阶段,本文在进行了车牌的倾斜矫正和确定了车牌字符的上下边界后,主要借助相关的投影信息和先验知识来确定每个字符的分割位置,并针对断裂和粘连字符进行了简单而有效的处理。对于单个字符的识别问题,我们在进行必要的预处理后采用改进的BP神经网络来进行单个字符的识别。由于在车牌识别中用到的算法一般都比较复杂,直接用高级语言编程很困难,所以本文通过编写vc++与Matlab的接口来实现算法编程,并且最终编写的程序可以脱离Vc++和Matlab平立运行。Matlab的编程高效而灵活,它具有强大、丰富的内置函数,并且其在图像处理方面的应用有着独特优势。通过接口来调用我们在Matlab下编写好的函数,这样做能够使我们从繁琐的编程工作中解脱出来,从而可以集中精力进行车牌识别算法的研究。关键词:车牌识别,数字图像处理,MatIab接口武汉理工大学硕士学位论文AbstractResearchonvellicles’platelicenserecogllitionsys把m(LPRS)协V01Vesandtechnjquessuchasdigitalimageprocessing,computerseeing,pattemanreco印itionanificialintelligcnceetc.LPRSplayssystem,aJlditkinds.callirnpommtr0Ieinintelligem仃a街ccon们lbeappliedinve:hjclemanagementinsituationsofall1eVels趾dallU’RSconsistsofthreemodulesingeneraJ,moseare:licenseplatelocadf培,charactersegmemationandcharacterrecognition.Algorimmsofa11modulesrelatedtoLPRSisdeepIystudiedandaIlalyzedint11ispapetAnd,wefinaUysettledownaseriesofalgorithmsusedinLPRSbasedonOurresearch.Dealwinllicenseplatelocanng,colorsegmentationisappliedatfirstaccordingtothevalucmgeofⅡlemreeelememsinHSVc010rspace.Andtllen,ma_t11哪aticsmoIphologicaloperationisadoptedinordert0getsomecontinuousarcas.Atlast,thesecontinuousareas’sh印eandtexturefeaturesareanalyzedsoastogmduaIlymtratedisturbedareas.ThememodfllIlyconsiders血edi丘brenceofthecolor,shapeaIldtextll]refeaturesbet、ⅣeenlicenseaIldbackground.Sowecatlfommenearby盯easwhosecolorandate姗eseparateplateareaaredi疗erem.Incharactersegmenta廿on,andpre—kIlownkIlowledgeofmewepfoposemetllodwllichisbasedonprojectioncharactcrsizeandthespacebetweencharactersinplate.Also,amcthodisproposedtodealwimtllosec±删ractersmatarebrokcnorcombinedtogemeLInsin甜echaracterofrecognize,、veapplyimproVedBPneuralnetworkstocarriesoutt11elettersandnⅢnbersinthelicenseplate.Since畦lealgorithmsadoptedinLPRSarereco印monverycomplexcommonly'it’sveryusedi茄culttopmgramusingadvancedlaIlguagedirecny.Soweinte壤虻ebeMeencaIlVC++andMatlabtorealizeo砒algorilllIns.ByusmggenerateMatl如compner,weredis订ibutable,stalld-alone印plicationcailthatdoesnotrcquireMatlabatmn-time.The印plicationbemnevenifMatlabisnotinstalledon也eend—user’sboringcomputcrBywhichway,wetoconcen廿atearesavefomt11eprogra删ng.So,、veareableon也estudyofthealgorithmsusedinLPRS.Keywords:Licenseplaterecognition,Digi协1imageprocessin&ManabinterfaceII武汉理工大学硕士学位论文第1章绪论1.1课题概述近年来,我国汽车数量迅猛增加。来自中国汽车工业协会的统计显示,2005年,我国汽车销售总量为590万辆,是2001年汽车销售总量237万辆的2.5倍。根据中国汽车工业协会预计,2006年我国汽车市场仍将保持10%一15%的增长,全年汽车销量将在640万辆至660万辆之间。随着汽车数量的逐年递增,摆在我们面前的是巨大的城市交通压力。如何高效地进行交通管理,越来越成为我们现实生活中的焦点问题。针对此问题,人们运用先进的科学技术,相继研制开发出了各种交通道路监视、管理系统,这些系统一般都包括车辆检测装置。通过这些装置对过往的车辆实施检测,提取相关交通数据,用于达到监控、管理和指挥交通的目的。汽车牌照的自动识别是车辆检测系统中的一个重要环节,它在交通监视和控制中占有很重要的地位,是实现交通管理现代化和智能化的重要前提。汽车牌照的识别问题已成为现代交通工程领域中研究的重点和热点之一。进行车牌识别可以采用IC卡识别技术或条形码识别技术。尽管Ic卡技术识别准确度高,运行可靠,可以全天候作业,但它整套装置价格昂贵,硬件设备十分复杂,不适合用于异地作业,并且需要制定出全国统一的标准。另外,无法核对汽车和Ic卡是否相符,这也是Ic卡技术存在的重大缺点;而条形码识别技术则对于扫描仪要求很高,并且同Ic卡技术一样,必须在全国范围内有统一的标准,这就给车牌识别在近期内推广造成了很大的困难。而基于数字图像处理的车牌识别是一种无源型汽车牌照智能识别方法,这种方法不需要在汽车上安装任何发送车牌号码的车载发射设备,对运动或静止状态车辆的车牌号码可以进行非接触性信息采集并实时识别。与Ic卡识别技术及条形码识别技术相比,采用数字图像处理技术可以节省辅助设各,降低成本,提高识别速度,较好地解决实时性问题,同时还具有良好的异地适应性。其缺点是由于天气、环境、照明、车速以及车辆状况等很多原因,所得到的图像可能存在着大量的噪声和变形,同时还有可能存在车牌被遮挡的情况,从而影响识别率I”。另外,武汉理工大学硕士学位论文利用数字图像处理技术进行车牌识别还有一个十分显著的特点,那就是所采用识别算法的好坏直接影响到识别的正确率和识别速度。所以,研究基于数字图像处理的车牌识别方法,努力提高车牌识别算法的性能具有十分重要的实际意义。1.2研究现状目前,一些发达国家车牌识剐系统在实际交通系统中已经成功应用,而我国的开发应用进展缓慢,基本停留在实验室阶段。这是因为我国的实际情况与国外有所区别。国外车牌比较规范统一,而我国车牌规范不够,较为多样化。不同汽车类型有不同的规格、大小和颜色,所以车牌的颜色多,且字符位数不统一,对处理造成了一定的困难。虽然很多研究人员已对车牌识别进行了较为深入的研究,但目前在车牌定位和字符分割这两个关键环节还存在着有待解决的难题脚。一是当车牌图像的对比度较小、光照不均匀、车牌磨损褪色以及有类似车牌纹理特征的干扰时,有效定位率下降;其次在车牌字符分割时,光照不均、对比度较小、倾斜、污迹、字符粘连和断裂等严重退化的车牌图像的字符分割效果也不理想。而对于车牌字符的识别来说,其识别的准确率很大程度上依赖于车牌定位和字符分割是否成功。车牌字符的识别作为最终对车牌图像的理解,可以借鉴光学字符识别(OcR)的宝贵经验,相对于车牌定位和字符分割来说反而比较容易实现。1.2.1车牌定位目前,主要有下列几种车牌定位方法:(1)直接法:利用车牌的特征来提取车牌的方法。常用的特征有:车牌的边缘特性、投影特性、形状特性以及颜色特性等”)。(2)人工神经网络方法:首先进行神经网络的训练,从而得到~个对车牌敏感的人工神经网络,然后利用训练好的神经网络检测汽车图像,定位车牌。(3)数学形态学的方法:使用一定的结构元素,利用数学形态学中的开运算与闭运算来对图像进行处理,得到多个可能是车牌的区域,然后在处理后的图像中用多区域判别法在多个可能是车牌的区域中找到车牌的正确的位置【41。(4)基于颜色和纹理的定位方法:该算法采用基于适合彩色图像相似性比2武汉理工大学硕士学位论文较的Hsv色彩模型,首先在色彩空间进行距离和相似度计算;然后对输入图像进行色彩分割,只有满足车牌颜色特征的区域,才进入下一步的处理;最后再利用纹理和结构特征对分割出来的颜色区域进行分析和进一步判断,从而确定车牌区域【5】。(5)基于分形盒子维的方法:由于车牌内的字符笔划几乎是随机分布,但又有明显的笔划特征,因此可以采用分形维数来对其进行分析从而达到分割车牌的目的。1.2.2字符分割字符分割的方法主要有基于车牌字符特征的投影法和基于聚类分析的车牌字符分割方法以及气泡法等嘲。投影法首先计算牌照字符的垂直投影,利用投影直方图得到一个闽值,然后再结合车牌字符固定宽度、间距的比例关系等先验知识来分割字符【9】。基于聚类分析的车牌字符分割方法按照属于同一个字符的像素构成了一个连通域的原则,再结合牌照的先验知识来进行字符分割。气泡法是一种适用于二值图像的区域增长法。它把一幅图像分成许多小区域,这些初始的区域可能是小的邻域甚至是单个像素。在每个区域中,对经过适当定义能反映一个物体内成员隶属程度的性质(度量)进行计算。首先给每个区域~组参数来反映这些区域分别属于哪个物体,接下来,对相邻区域的所有边界进行考查,相邻区域的平均度量之间的差异是计算边界强度的一个尺度,经过反复迭代,每一步都重新计算被扩大区域的物体成员的隶属关系,并消除弱边界,当没有可以消除的弱边界时,区域合并的过程结束【lo】。1.2.3字符识别目前,对车牌字符识别的方法主要有结构法、统计法、人工神经网络法。结构方法是字符识别发展最早的一种方法。结构法需要通过结构分析,利用文字的结构关系进行识别。它的基本思想就是把字符图像分割、简化为若干的基元,主要有基于骨架、轮廓和字符笔划等方法。结构法提取的是结构特征,因而这些敏感部位的差异能显现出来,但它对噪声比较敏感,稳定性差。统计方法的特征提取是从车牌字符原始数据中提取与分类最相关的信息,使得类内差距极小化,类问差距极大化,特征对同一个字符类的多种形变应该尽量保持不变3武汉理工大学硕士学位论文m】。统计法依赖于大量的原始样本和数值计算,一经统计,其局部噪声和微小的变形就会被淹没在整体特征中,可以用来区分结构中敏感部位的差异性也随之淹没了。人工神经网络法的主要特征是:大规模的并行处理和分布式信息存储,良好的自适应性、自组织性,很强的学习功能、联想功能和容错功能,其识别率商,抗干扰能力强,灵活性大,可以模拟人类思维,可以对需要处理和解决的问题进行记忆、联想、推理,但学习过程较长【l”。1.3本文主要研究内容和所做的工作本文研究的是复杂环境下的车牌识别问题,我们主要针对车牌识别系统中识别软件部分的相关技术进行研究,不涉及图像采集以及其他硬件相关的问题。假定图像已经采用某种方式采集好,我们的目标是设计一个能够识别图像中存在的车牌号码的应用软件。本文致力于研究车牌识别中所用到的各种数字图像处理算法;寻求一种对车牌的位置、颜色、大小无关的定位算法,该算法要对于外界光线强度和图像对比度的变化有较强的适应能力,并使之在车牌倾斜、变形、磨损褪色以及存在有类似车牌纹理特征的干扰时能够准确地定位:其次在车牌字符分割时,当车牌存在污迹、铆钉等干扰时要能够准确分割,对于字符粘连和断裂的情况,要分别做出相应的分割和合并;给出进行车牌字符识别的方法,为了简化设计,本文只对车牌上的英文字母和阿拉伯数字进行识别。本文所做的主要工作如下:(1)研究了用于车牌识别的多门基础理论如数字图像处理、数学形态学、模式识别、神经网络等;重点研究了常用的数字图像处理算法,包括图像的二值化、灰度变换增强、图像的滤波、边缘检测、色彩空间变换以及纹理分析等。(2)查阅了大量文献和资料,在研究近年来一些典型车牌识别的算法的基础上,确定进行车牌识别的一系列算法。(3)对文中的大部分图像处理算法在Manab下进行编程实现,并进行了仿真试验和结果分析。(4)针对Matlab中循环程序执行效率不高的特点,分析必须要用vc++实现的程序部分,在vc++集成编程环境下编写这部分程序。(5)研究Vc++和Matlab接口的通用方法,选择~种合适的方法编写vc++4武汉理工大学硕士学位论文和Matlab的接口,在基于MFc的框架程序中调用自己在Matlab下编写的m文件函数,最终生成可以脱离vc++和Mauab环境的应用程序。5武汉理工大学硕士学位论文第2章图像预处理2.1引言在车牌图像信号的采集、输入过程中由于受到自然环境的影响,总会使图像的质量下降。给后面车牌图像的定位、字符分割和识别工作带来困难。因此需要对车牌初始图像进行必要的预处理,提高图像质量并突出我们所需要的信息,从而有利于进行各种后续的处理。有的地方还把车牌识别分为预处理、车牌定位、字符分割和字符识别四个组成部分,由此可见图像预处理在车牌识别中占有十分重要的地位。图像预处理是相对于图像分析、图像识别、图像理解而言的~种对图像前期的处理,也可以看作是对初始采集图像的增强。图像增强的目的就是采用一系列技术,改善图像的效果或将图像转换成为一种更适合人或者计算机进行分析处理的形式。主要是指按需要对图像进行适当的变换以突出某些有用的信息,去除或削弱无用的信息,如改变图像的对比度、去除噪声或强调边缘等处理。2.2灰度化与二值化2_2‘1灰度化目前,我们对车牌原始图像的采集大都是通过摄像机、数码相机等设备来拍摄获取的。因此,一般情况下我们得到的都是彩色图像。由于彩色图像包含着大量的颜色信息。它的每个像素都具有三个不同的颜色分量R、G、B,所以其需要占用的存储空间很大,而且在对其进行处理时也会浪费较多的系统资源,会降低系统的执行速度。而对于灰度图像,只需对亮度信息进行处理即可,其计算量是彩色图像的三分之一。因而,我们经常要对图像进行灰度化,将彩色图像转变为占用存储空间相对较小的灰度图像。灰度化最基本方法就是直按取彩色图像月、G、B三分量中最大值或其平均值来代替各个分量。灰度化以后,每一个像素的R、G、B分量都是相等的,所6武汉理工大学硕士学位论文以不存在彩色图像中那样的颜色差异,有的只是亮度上的不同。灰度值大的像素比较亮,反之比较暗。对于有256个亮度级的灰度图像,如果其灰度值为255就代表了白色,灰度值为0就代表了黑色I】”。图像的灰度化还有其它不同的算法,比较常见的就是给像素的只、G、四分量各自增加一个加权系数,然后求其和,经常用到的灰度化公式如下:,=0.229奉R+O.587牛G+O.114唪B(2一1)式中,为灰度值。加权系数的取值是建立在人眼的视觉模型之上的,对于人眼较为敏感的绿色取较大的权值,对人眼较为不敏感的蓝色则取较小的权值。这样可以使得到的灰度图像在视觉上更接近人的主观感觉。2.2.2二值化灰度图像一般是有256个灰度级的单色图像,它能够呈现出较为丰富的明暗度。但我们在识别车牌时,总是希望能把我们的目标从背景中彻底分离出来。为了尽可能地减少背景像素的干扰,而保留或增强目标区的信息,我们常常直接把图像分为目标和背景两部分。这样得到的图像只有两个灰度级:0和l,通常情况是目标区的像素取1,而背景区的像素取O。我们称这样的图像为二值图像,而由灰度图像得到二值图像的过程就称为图像的二值化。为了得到理想的二值图像,一般采用阈值分割技术,它对目标与背景有较强对比的图像的分割特别有效。把所有灰度值大于或等于阈值的像素判决为属于目标,否则这些像素点被排除在外,认为是背景【l“。闽值分割法可以分为全局阈值法和局部阈值分割法。所谓局部阈值分割法是将原始图像划分成较小的图像,并对每个子图像选取相应的阈值。在闽值分割后,相邻子图像之间的边界处可能产生次度级的不连续性,因此需用平滑技术进行排除。局部阈值法常用的方法有灰度差直方图法、微分直方图法。局部阐值分割法虽然能改善分割效果,但存在几个缺点:(1)每幅子图像的尺寸不能太小,否则统计出的结果无意义。(2)每幅图像的分割是任意的,如果有~幅子图像正好落在目标区域或背景区域,而根据统计结果对其进行分割,也许会产生更差的结果。(3)局部阈值法对每一幅子图像都要进行统计,速度慢,难以适应实时性的要求。7武汉理工大学硕士学位论文全局闽值分割方法在图像处理中应用比较多,它在整幅图像内采用固定的阈值分割图像。根据阈值选择方法的不同,可以分为模态方法、迭代式阈值选择等方法。这些方法都是以图像的灰度直方图为研究对象来确定闽值的。另外还有类间方差闽值分割法、二维最大熵分割法、模糊阈值分割法、共生矩阵分割法、区域生长法等等。本文采用的就是全局闽值法,其关键是如何选取合适的阈值。Otsu法是常用的一种选取阈值的方法,该方法属于类间方差闽值法,它是在判别最小二乘法的基础上推导出来的。基本思想是:取~个闽值|】},将图像中的像素按灰度值分为大于等于≈和小于女两类,也就是目标和背景两类。求出两类像素的类内方差叽2、类间方差%2和总体方差听2。然后给定三个分离指标:Ql2孑Q2。等93善(2屯)任取其中~个,这里我们取第一个分离指标Q7,找出使其值最小的七即为最佳闽值。其意义是使类间方差最大,类内方差最小。用P(j)表示图像各灰度级的频数,则阈值的计算步骤为:(1)求出图像中的最大灰度级‰。;(2)令女=0;(3)利用灰度级A把图像像素分为两类,按下列公式求出类内方差和类间方差:吼2=彤砰+%cf22盯。2=叱%(M一^如)2上式(2—3)和(2—4)中,各参数的计算分别如下:(2—3)(2—4)磁=窆P(i)‘智彬智%=芝P(f)2.象。职(2—5)毕粪箐鸩=萎。箐班喜半班笔半(2-z)∽e,碳‘,鼎暇(4)令≈=女+1,重复计算上一步,直到≈取到最大灰度级k。;(5)找出令分离指标Q最小的_】}值,该值即为最佳阈值。8武汉理工大学硕士学位论文2.3灰度变换增强由于车牌图像在拍摄时受各种条件的和干扰,图像的灰度值往往与实际景物不完全匹配。一般成像系统只具有一定的亮度范围,亮度的最大值和最小值之比称为对比度。由于成像系统的亮度有限,常出现对比度不足的情况,使人眼观看图像时视觉效果很差,这将直接影响到图像的后续处理。通过灰度变换可以增强对比度,改善视觉效果。2.3.1灰度变换如果造成对比度不足的原因主要是由于被摄目标的远近不同,使得图像区域和边缘区域的灰度失衡,或是由于摄像头在扫描时各点的灵敏度有较大的差异而产生图像灰度失真,或是由于曝光不足或过度而使得图像的灰度值被在一个很小的范围。这时人们看到的将是一个模糊不清、似乎没有灰度层次的图像。可以采用灰度变换的方法来处理,增强灰度的变化范围、丰富灰度层次,达到增强图像对比度的目的。用一个线性单值函数,对图像内的每一个像素作线性扩展,将有效地改善图像的视觉效果。如果原图像厂(x,y)中,大部分像素的灰度级在一个比较小的范围内,或者我们只对灰度级在某一范围内的像素感兴趣,设这一灰度范围为[口,剀。经过线性灰度变换后,可以将这一灰度范围№,6】扩展到图像g(x,_y)中一个比较太的灰度范围【c,硼,其中g(x,y)为进行灰度变换后的图像,并且有Jd—cpf6一口f。如图2一l所示,厂(x,y)和g(x,y)之间的灰度变换关系如下:/(工,_y)<口g(x,y)=。筹d,y一+口≤,(z,y)<6/(x,y)≥6(2—8,从灰度直方图分析,由于ld—cI>|6一dI,所以对离散图像来说,尽管变换前后像素的个数不变,但是不同像素之间的灰度差变大,图像质量优于变换前。但是,这种两端截取式的变换使小于灰度级口和大于等于灰度级6的像素分别强行变为c和d,将会造成一小部分图像信息的丢失。9武汉理工大学硕士学位论文图2.1线性灰度变换图2.2分段线性灰度变换同理,可以采取分段线性灰度变换,将图像灰度区间分成两段或多段分别做线性变换。分段线性变换的优点是可以根据需要,拉伸感兴趣的灰度范围,相对抑制不感兴趣的灰度范围。分成三段进行线性变换如图2—2所示,变换公式如下:三,(x,y)g(x,y)=0≤,(石,J,)<口(2—9)导兰【,(x,y)一a】+cD一口d≤厂(x,y)<6扫s'厂(x,y)≤聊旦普【厂(Ⅵ)一6】+d删一D图中对灰度范围【日,6】进行了灰度扩展,而对灰度范围[O,口】和[6,m】进行了压缩。通过调整折线拐点的位置和分段直线的斜率,可以对任意灰度范围进行扩展或压缩。用某些非线性函数,例如对数函数、指数函数等作为映射变换函数时,可以实现图像灰度的非线性变换。对数变换~般为:g(x,y):Ⅱ+里坐j:掣D‘ⅡlC(2一lo)其中d、6和c为可调参数.用于调整曲线的位置和形状,它使图像的低灰度区得以扩展,而高灰度区得到压缩。与之相对应的指数变换一般为:g(x,y)=6。‘,‘。’,卜刑一1相反,它使图像的高灰度区进行扩展,而对图像的低灰度区进行压缩。(2一11)其中口、6和c为可调参数,用于调整曲线的位置,它的效果与对数变换的利用对数函数进行灰度变换在实际应用中有重要意义,它能扩展低灰度区,10武汉理工大学硕士学位论文符合人们在视觉上的主观感觉。2.32直方图均衡化一般情况下,在一幅有限行和有限列的数字图像中取不同灰度值像素的数目是不同的。直方图是用于表达图像灰度分布情况的统计图表。其横坐标是灰度值,纵坐标是出现这个灰度值的概率值。尽管灰度直方图不能表示出具有某些灰度级的像素的具体位置,更不能直接显示图像的内容,但是具有统计特征的直方图却能描述该图像的灰度分布特征,使人们从中得到诸如总体明亮程度、对比度、灰度分布概貌等信息。如果图像灰度集中在较窄的区间,从而引起图像细节的模糊,为了使图像细节清晰,并使一些目标得到突出,达到增强图像的目的,可通过改善各部分亮度的比例关系,即可通过对直方图进行调整的方法来实现。这种方法是以概率论为基础的。一幅对比度小的图像,其直方图分布一定集中在某一比较小的范围内,经过均衡化处理的图像,其所有灰度级出现的概率相同,此时图像的熵最大,图像所包含的信息量最大。直方图均衡化又称直方图平坦化,是将一已知灰度概率密度分布的图像,经过某种变换,变成一幅具有均匀灰度概率密度分布的新图像,其结果是扩展了像素取值的动态范围,从而达到增强图像整体对比度的效果。设原始图像总的像素数目为Ⅳ,那么,直方图均衡化的具体计算步骤如下:(1)列出原始图像的灰度级‘,f-O,l,…,£一1,其中£是灰度级的个数;(2)统计各灰度级的像素数目n(r),iIO,l,…,工一1;(3)计算原始图像直方图各灰度级的频数P(‘)=2掣,f=o,1,…,三一1;』V(4)计算用于灰度变换函数r(‘)=∑墨笋,f_o,1,…,£一1;了;川(5)计算映射后的输出图像的灰度级s,=肋1(s。。一smm)丁(‘)+s。。+O.5],f:O,1,…,P一1,尸为输出图像灰度级的个数,州r为取整数运算;(6)统计映射后各灰度级的像素数目n(5,),l_O,l,…,P一1{(7)计算输出图像直方图Q(J,)=芝¥,i_o,1,…,P一1:』V(8)用(和t的映射关系调整原始图像的灰度级,获得直方图近似为均匀分布的输出图像。武汉理工大学硕士学位论文根据原图像的直方图统计值就可算出均衡化后各像素的灰度值。按上述步骤对图像进行均衡化处理时,直方图上灰度分布较密的部分被拉伸,灰度分布稀疏的部分被压缩,从而使一幅图像的对比度在总体上得到很大的增强。直方图均衡化的结果如图2—3至图2—6所示。可以看出直方图均衡化以后的图像对比度得到了增强,它的直方图接近于均匀分布,各灰度级出现的概率基本相同。图2-3均衡化前的灰度图像图2.4均衡化后的图像图2—5均衡化前的直方图图2.6均衡化后的直方图2.4空间域滤波图像的实质是光电信息,因此图像噪声的主要来源有以下几个:在光电、电磁转换过程中引入的噪声;大气层电磁暴、闪电、电压和浪涌等引起的强脉冲的干扰;由不连续性或粒子性所引起的自然起伏性噪声。噪声恶化了图像质12武汉理工大学硕士学位论文量,使图像模糊,甚至淹没和改变图像本身的特征,给图像分析和识别带来困难。为了消除噪声,常采用滤波的方法。另外,采用合适的滤波方法也可以用来对图像进行锐化,增强图像的边缘信息。2.4.1邻域平均法为了消除图像中的噪声,可以直接在空间域上对图像进行平滑滤波。它的作用有两种:一种是模糊:另一种是消除噪声。空间域的平滑滤波一般采用简单平均法进行,就是求邻近像素点的平均亮度值,称为邻域平均法。邻域的大小与平滑的效果直接相关,邻域越大平滑的效果越好,但邻域过大,平滑会使边缘信息损失的越大,从而使输出的图像变得模糊,因此需要合理选择邻域的大小,实际中我们一般采用的邻域窗口大小为3×3。一幅有意义的图像一般是由许多灰度值相近的小块组成,相邻像素间存在很高的空间相关性,而噪声则是的,则我们用像素预定邻域内的各像素的灰度平均值代替该像素原来的灰度值,就可以实现图像的去噪。最简单的局部平滑算法称为非加权邻域平均,它均等地对待临域中的各像索,即把各个像素灰度的平均值作为中心像素的输出值。设有一幅Ⅳ×Ⅳ的图像厂(x,y),用非加权邻域平均法所得图像为g(x,y),则有1g(x,J,)=÷芝:,(f,,)』旧·_忑s一(2—12)上式中,五J,=O,l……Ⅳ-1;J为不包括@,y)的邻域中各像素的集合,即去心邻域;M表示集合J内像素的总数。典型的邻域有两种:四邻域和八邻域,其模板分别为:%3言lLo1『01o]101l叫l甄2iIL11『111]101l1jlQ13)如果图像中的噪声是随机不相关的加性噪声,窗口内各点噪声是分布的,经过上述平滑后,信号与噪声的方差比可提高肘倍。这种算法简单,处理速度快,但它的主要缺点是在降低噪声的同时使图像产生模糊,特别在边缘和细节处。而且,随着邻域的增大,虽然增强了去噪的能力,但同时模糊程度也更严重。为克服简单邻域平均法的弊病,目前已提出许多保持边缘、保细节的邻域平均算法。它们的出发点都集中在如何选取邻域的大小、形状、方向、参武汉理工大学硕士学位论文加平均的像素个数以及邻域中各像素的权重系数等【l”。邻域加权平均法是对非加权邻域平均法的一种改进。邻域加权平均的基本思想是:离中心点越近的点对该中心点的影响越大,因此在求平均值时应赋予较大的权重,它用窗口内像素灰度级加权均值来取代窗口中心像素原有灰度级,公式如下:g(x,y)=芝:∥(f,,)×,(x,y)西(2一14)矿(f,n为加权系数矩阵。邻域平均法实际上是~种空间域的低通滤波。由信号频谱分析知识可知,信号变化较慢的部分在频率域属于低频部分,而信号变化较快的部分在频率域属于高频部分。对于图像雨言,它的边缘和噪声干扰附近的灰度变化较大,属于频域中的高频分量,因此可以采用低通滤波的方法来去除噪声。频域的滤波也就是乘积运算,变换到空间域就成为卷积运算,对一幅灰度图像的空间域滤波实际上是进行二维离散卷积运算。我们把用于二维离散卷积计算的邻域称为冲激响应阵列,又叫做卷积阵列,还有的地方叫做卷积模板。2.4.2高通滤波在进行图像处理时,我们经常要对图像进行锐化以便突出图像的边缘。同样的,可以采用在空间域对图像进行滤波的方法,只不过这时采用的冲激响应阵列与空间域低通滤波时所采用的完全不同。因为图像中的边缘与频域中的高频分量相对应,所以可以采用高通滤波器让高频分量顺利通过,而对低频分量则充分,使图像的边缘变得清晰,实现图像的锐化。但是,对图像进行空间域的高通滤波,在增强图像边缘的同时孤立的噪声点也得到了增强。常用于空间域高通滤波的冲激响应阵列有以下几种:q=|_l『ol一1o]5—1oj马=卜1『一ll一1一1—119—1一lj马=l-2『1l—25—2I1]J(2一15)o—l—1l—2高通滤波的效果也可以用原始图像减去低通图像得到。用原始图像乘以一个放大系数,然后再减去低通图像可以构成一幅高频增强图像,这样的图像恢复了部分高通滤波时丢失的低频成分,滤波后得到的图像与原始图像更为接近,这种方法称为非锐化掩模法。14武汉理工大学硕士学位论文2.4.3中值滤波中值滤波是一种非线性滤波,它也是一种邻域运算,类似与卷积。但中值滤波的计算不是加权求和,而是把它邻域内的所有像素按灰度值进行排序,然后取该组的中间值作为邻域中心像素点的输出值。中间值取法如下:当邻域内的像素个数为奇数时,取像素灰度值排序后的中间值:当邻域内的像素个数为偶数时,取排序后的中间两像素灰度值的平均值。邻域可以选择不同大小和形状的窗口如线状、方形、十字形、圆形、菱形等。不同形状的窗口产生不同的滤波效果,使用中必须根据图形的内容和不同的要求加以选择。从以往的经验看,方形或圆形窗口适宜于外廓线较长的物体图像,而十字形窗口对有尖顶角状的图像效果好。使用中值滤波器去除噪声的方法多种多样,且十分灵活。一种方法是先使用小尺度邻域,后逐渐加大邻域尺寸进行处理;另一种方法是一维滤波和二维滤波交替使用。此外还有迭代操作,就是对输入图像反复进行同样的中值滤波,直到输出不再有变化为至。中值滤波的突出优点是在消除噪声的同时,还能防止边缘模糊。如果图像的噪声多是孤立的点,这些点对应的像素又很少,而图像则是由像素较多、面积较大的块构成,中值滤波效果很好【1”。2.5同态滤波为了有效和快速地对图像进行处理和分析。常常需要将原来定义在空间的图像以某种形式转换到频域空间,并利用频域空间特有的性质方便地进行一定的加工处理,最后再转换回图像空间以得到所需要的效果。在频域中,通过滤波器函数衰减高频信息而使低频信息畅通无阻的过程为低通滤波。图像的边缘和噪声都对应于傅立叶变换中的高频分量,所以频域中的低通滤波可以抑制反映灰度突变特征的高频信息,包括边缘和孤立点噪声,起到了平滑图像、去除噪声的作用。频域中的高通滤波是为了衰减或抑制低频分量,而让高频分量畅通无阻。因为边缘及灰度急剧变化部分与高频分量相关联,在频域中进行高通滤波将使图像得到锐化处理。在实际应用中,还有某些信号不是加性组合,它含有乘法性噪声,是由两个或多个信号相乘而成的,这时就不能用传统的滤波器而需用同态滤波器处理。同态滤波器的思想就是用一系列方法把乘性信号变换成加性组合信号,经过处武汉理工大学硕士学位论文理后再反变换回乘性信号。同态滤波以图像的照明反射模型作为频域处理的基础,它在数字图像处理中有着十分重要的应用。~幅图像,(x,y)可以看成由两个分量组合而成,即,(x,_y)=,(x,,)·,(x,y)(2—16)上式中,f(x,y)为照度分量(入射分量),是入射到景物上的光强度,它变化缓慢,在频谱上其能量集中于低频;,(x,y)为反射分量,是受到景物反射的光强度,它包含了所需要的图像信息,在空间中的变化较快,能量集中在高频部分。若想得到其中一个分量,用传统的滤波器是不可能实现的,这时就需用同态滤波器。进行同态滤波的具体步骤如下【20】:(1)先对式(2一16)的两边同时取对数,获得加性分量,即ln[厂(x,y)]=11l【f(x,y)】+ln[,(x,y)](2)将上式(2一17)两边取傅立叶变换,得F(甜,v)=F【lnf(x,y)】+F[111r(x,y)】=,(“,v)+尺(“,v)(2一18)(2—17)这里F(",v)、j(“,v)和R(“,v)并不直接是,(x,y)、i(x,y)和,(x,y)的傅立叶变换,但由于ln()是单调增函数,可以认为它们分别在频谱低频区和高频区的格局并没有很大变化;(3)为了消除照度起伏,应该压缩,(”,v)分量;为了增强图像本身的对比度,应该增强月(Ⅳ,v)分量。用~个高通滤波器日(“,v)去处理F(“,v),可得到G(“,v)=日(“,v)-,(Ⅳ,v)=日(“,v),(“,v)+日(“,v)只(“,v)(2一19)(4)将上式(2一19)逆傅立叶变换到空间域,得到的图像是由分别和照度分量与反射分量相对应的两部分叠加而成:.Hr(z,y)=E(x,y)+皿(x,y)(5)再将上式(2—20)的两边取指数,最终得到滤波后图像的输出:g(工,y)=exp【—H,(x,,)]=exp{F叫{日(“,v)F[1n,(x,J,)])}(2—20)(2~21)一幅图像得照明分量通常变化较慢,而反射分量则倾向于急剧变换。所以图像取对数后的傅立叶变换的低频部分主要对应照度分量,而高频部分主要对应反射分量。适当的选择滤波器函数将会对傅立叶变换中的低频部分和高频部分产生不同的响应。处理结果会使像素灰度的动态范围或图像对比度得到增强。2.6边缘检测16武汉理工大学硕士学位论文数字图像的边缘检测是图像分割、目标区域的识别、区域形状提取等图像分析领域十分重要的基础。边缘是图像的重要特征,图像理解和分析的第一步往往就是边缘检测。目前,边缘检测已成为计算机视觉研究领域最活跃的课题之一,在工程应用中占有十分重要的地位。车牌的一个重要特征就是在该区域存在大量的边缘信息,所以边缘检测对于我们进行车牌识别来说也是相当重要的。边缘是以图像的局部特征不连续的形式出现的,也就是指图像局部亮度变化最显著的部分,如灰度值的突变、颜色的突变、纹理结构的突变等,同时边缘也是不同区域的分界处。图像边缘有方向和幅度两个特性,通常沿边缘的走向灰度变化平缓,垂直于边缘走向灰度变化剧烈。由于边缘是图像上灰度变化最剧烈的地方,传统的边缘检测就利用这个特点,通过计算图像中像素的梯度值来确定边缘点。2.6.1梯度对于图像厂(x,y),它在点(x,y)处的梯度定义为一个矢量:彭G[,(x,y)1=缸可●_一砂(2—22)式中:箬和;}分别是,(x,y)在x和_y的偏导数。唰掣矢量G【厂(x,y)]的方向是厂(x,y)在(墨y)点变化率最大的方向,其幅度也就是梯度的模为:G[m川】:,惜:+(要)zV傩掣(2_23)对于数字图像,一般用差分来近似微分运算。常用的梯度差分法为:G【/(f,/)]=√【厂(f,J)一,(f+l,/)】2+[厂(f,/)一,(f,.,+1)】2(3—24)可以简化为:(2—24)由于上式在计算机上运行特别耗时,所以实际中常采用绝对差算法,公式G[厂(f,,)]=I,(f,,)一,(f+l,.,)f+I厂(f,,)一,(f,J+1)l公式(2—25)可以通过两个卷积之和来表示:(2—25)G(f,,)=IqI+阿I17(2—26)武汉理工大学硕士学位论文其中,q和瓯分别由如下的模版计算:团2.6_2常见的几种边缘检测算子田∽。,,对梯度进行近似计算还可以采用很多种不同的方法,根据它们所采用模板的大小,其中元素取值的不同,人们提出了许多种不同的边缘检测算子。常用的图像边缘提取算子有Roberts算子、sobel算子、Pre河tt算子、L印Iacian算子等,它们的模板分别如下:(1)R0bens梯度算子:圈(2)Sobel算子圈(2—28)(3)Prewitc算子圈团圈圆(2—29)(2—30)(4)Laplacian算子:值得说明的是前面的几种边缘检测算予都是通过计算一阶导数来检测边缘的,如果所求的一阶导数高于某一个阂值,就可以确定该点为边缘点。这样做会导致检测到的边缘点太多。而L印laciall箅子是一种二阶导数算子。它找出梯度局部最大值所对应的点,并认为这些点才是真正的边缘点。一阶导数的局部最大值对应着二阶导数的零点。通过找出图像强度的二阶导数的零点,就能够找到精确边缘点。对于图像,(五y),其在(x,y)处的拉普拉斯运算为:v2,㈨):祟+尝Ux(2_31)0>在数字图像处理过程中,L印1aciaIl算子也是借助模板来实现的,常用的两种模板如下:18武汉理工大学硕士学位论文田岛(2—32)当La口laciall算子的输出为零时,就认为该点是边缘点。但由于我们是用模板运算来近似某一点的二阶导数,所以要排除所有无意义的点,如灰度值为O的区域中的点。L即lacian算子是不依赖于边缘方向的二阶微分算子。它具有旋转不变,即各向同性的性质。但Laplacian算子对弱边缘比较敏感,检测出来的边缘图像含有过多的干扰信息,所以一般不用Laplacian算子直接进行边缘检测。以上所说的边缘检测算子包括Laplaciall算子对噪声敏感,它们都使噪声成份加强,因此在处理含有较大噪声的图像时,常常先对图像进行平滑操作,然后再进行二阶微分,这就产生了所谓的LOG边缘检测方法。它先用高斯函数对图像进行平滑,然后再用拉普拉斯算子进行计算。利用几个常用边缘检测算子求取车牌区域边缘的效果分别如图2—7至2一lO所示。图2.7Roberts算子图2—8Sobel算子图2—9Prewitt算子图2·10L印laciall算子2.7小结在这一章中我们主要讨论了包括图像的二值化、灰度变换增强、边缘检测、空间域和频域滤波等比较经典的算法。我们虽然把这些算法都归结到图像预处理这一章,但这些算法并不是仅限于在展开车牌识别算法之前应用。它们在以后的车牌定位、字符分割和字符识别中会经常用到,所以应该说这些算法是属于车牌识别算法不可分割的一部分。在合适的场合采用合适的图像增强算法,可以改善退化图像的视觉效果,有利于对图像进行更进一步的处理。19武汉理工大学硕士学位论文第3章车牌定位与字符分割3.1引言车牌识别是一种典型的复杂背景下模式识别问题,其中最关键也最难以解决的问题往往集中在车牌定位过程上。车牌定位的主要工作是从摄入的汽车图像中找到汽车牌照所在的位置,并把车牌从该区域中准确地分割出来,供后续的字符分割使用。在车牌识别系统中,牌照区域的确定是影响系统性能的重要因素之一,牌照的定位准确与否直接影响到字符分割和字符识别的准确率。到目前为止针对车牌定位已提出了多种方法,主要包括投影法、区域生长法、行扫描法、神经网络法以及基于数学形态学与车牌底色分析的方法等。本章给出了一种基于色彩过滤和区域形状、纹理分析相结合的方法来进行车牌定位。该方法首先根据车牌颜色在Hsv空间三个分量取值范围对原始图像进行色彩过滤,利用数学形态学形成多个连通区域,然后再根据车牌的形状特征和车牌字符的纹理特征,对过滤后得到的与车牌底色相符合的连通区域进行分析,从而剔除伪目标区域得到真正的车牌区域。对于字符的分割问题,在经过车牌的倾斜矫正后,我们首先根据车牌字符的水平投影信息来确定字符区域的上下边沿,进行水平切分。然后,再统计字符区域垂直投影信息并结合车牌上字符间隔的先验知识来确定各个字符的最佳分割点。3.2数学形态学3.2.1数学形态学概述数学形态学也称图像代数,表示以形态为基础对图像进行分析的数学工具是一种应用于图像处理和模式识别领域的新的方法。数学形态学是在集合论的基础上发展起来的,它摒弃了传统的数值建模及分析方法,而从集合的角度来刻画和分析图像。数学形态学中基于集合的观点是非常重要的,这意味着它的运算是由集合运算(如并、交、补等)来定义的,并且所有的图像都必须以合理武汉理工大学硕士学位论文的方式转换为集合。这一基于集合的观点决定了形态学算子的性能将主要以几何方式进行刻画,而传统的理论则以解析的方式描述算子的性能。这种显式的几何描述特点更适合于视觉信息的处理和分析,因此,数学形态学与几何的直接关系是它的一个十分吸引人的优点。它将人们从视觉心理角度的“看见”或“看不见”表述为“并集”或“交集”运算。对于所有能看到的东西来说,其理解的结果是它们的“并”,而对于所有因遮挡而不能看到的东西来说,其理解的结果是它们的“交”。因此,集合变换反映着视觉过程。…。从集合论的角度看,数学形态学包含了从一个集合转换到另外一个集合的运算方法。这种转换的目的是要找到原始集合的特定几何结构,而转换后的集合包括了这种结构的信息。同时,这种转换是通过一种称为结构元素的特征集合来实现的。对集合进行分析就是对集合进行变换,以突出所需要的信息,所采用的方法是使主观“探针”与客观物体相互作用。“探针”也是一个集合,它由我们分析的目的来决定。这个“探针”的集合称为结构元素,它携带有我们感兴趣的知识入灰度、形状等。数学形态学的基本思想就是用具有一定形态的结构元素去度量和提取图像中的对应形状以达到对图像分析和识别的目的r261形态学在图像分析与处理方面的应用非常广泛,涉及的领域有模式识别、图像压缩、滤波、匹配、形状分析、边缘检测等。数学形态学最先被用来处理二值图像,其基本理论为二值形态学。现在数学形态学的处理对象也可以是灰度图像,灰度形态学算子是由二值形态学理论推广而来,我们这里不做介绍,其相关运算可以参考文献[27]。3.22二值形态学的基本运算形态学的数学基础和所用语言是集合论,其基本运算有四种:膨胀、腐蚀、开启和闭合。基于这些基本运算,还可以推导和组合成各种数学形态学实用算法。假设用A表示目标物体,B表示结构元素,则二值形态学基本运算及实用算法如下:如果图像彳用结构元素B来膨胀,则记作爿oB,其定义为:彳oB={xI(占):n爿≠o}(3—1)其中,B表示B的映像,膨胀运算首先作B关于原点的映射B,再将其映2l武汉理工大学硕士学位论文像平移x,当爿与B的交集不为空时,B的原点就是膨胀集合的像素,结果是扩张了A的边界。如果图像爿用结构元素口来腐蚀,记作彳@口,其定义为:肿B={xI(B),∈4}包含在4中的工的集合,实际上是收缩了A的边界。(3—2)上式表明图像4用结构元素B来腐蚀的结果满足将占平移后,B仍旧全部膨胀和腐蚀为对称运算,不是逆运算,它们可以级联结合使用。使用同一个结构元素对图像先进行腐蚀然后再进行膨胀的运算成为开启运算,其定义为:一oB=(4@B)0占(3—3)开启运算可以用于平滑边界,去除孤立的小点、切断细长搭接,消除突刺。使用同一个结构元素对图像先进行膨胀然后再进行腐蚀的运算成为闭合运算,其定义为:爿。B=(』40B)0田闭合运算可以平滑边界,连接短的间断,填充小孔。由上述四个基本的运算进行不同的组合,迭代可以衍生出许多非常有用的数字图像处理算法,可以实现对图像的边缘检测、细化、抽取骨架等操作,可以参考文献[27]。本文中主要利用是利用开启和闭合运算的性质。因为汽车图像经过色彩过滤后,会出现许多杂散的孤立点,用开启运算可以排除这些点的干扰。另外,车牌区域还可能出现断裂和小孔,可以通过闭合运算使车牌区域连通,并填充车牌区域内的小孔。(3—4)3.3纹理分析3.3.1纹理概述纹理是描述图像时常用的一个概念,但是关于图像纹理迄今为止仍无一个公认的、一致的严格定义。图像纹理反映了物体表面颜色和灰度的某种变化规律,而这些变化又与物体本身的属性相关。从宏观上看,它是物体表面拓扑逻辑的一种变化模式;从微观上看,它由各种微观微粒组成,任何图像做足够的放大后都将出现一定纹理。纹理不仅反映图像的灰度统计信息,而且反映图像武汉理工大学硕士学位论文的空间分布信息和结构信息。纹理图像在局部区域内呈现了不规则性,而在整体上呈现出某种规律性。习惯上,把图像中这种局部不规则的,而宏观有规律的特性称之为纹理。因此,纹理是由一个具有一定的不变性的视觉基元,通称纹理基元,它是在给定区域内的不同位鼍上重复出现的一种图纹。若纹理是由纹理基元按某种确定性的规律组成的,则称之为确定性纹理:若纹理是由纹理基元按某种统计规律组成的,则称之为随机性纹理。纹理既有局部又有全局内涵,它既可以是图像局部测量的区域特性,也可以是一幅图像的全局特性。纹理的主要特性有:粗糙度、方向性、对比度和规律性。显然只有采用有效描述纹理特性的方法去分析纹理区域与纹理图像,才能真正描述与理解它们128】。对于车牌图像上的字符,由于其有较明显区别于其他纹理的视觉形象。因此可以把字符图像看作是含有特殊纹理信息的图像,通过对连通区域的纹理分析,就可以确定该区域是不是车牌区域。3_3.2描述纹理的方法对纹理图像的描述通常要借助于纹理的统计特性或结构特性进行,对于空间域的性质也可以转换到频域研究,所以常用3种纹理描述方法是:结构法、统计法、频域法。(1)结构法结构描述方法是先确定、提取基本的纹理基元,再研究纹理基元之间的“重复性”的结构关系。纹理基元可能是明确的、直观的,也可能是不明确的,需要根据情况设定。无论怎样确定纹理基元,都需要通过图像的区域分割或边缘、线的抽取来提取纹理基元。对于纹理基元之间的结构关系,可以有不同的分析途径,最简单的方法是分析纹理基元之间存在相位、距离、尺寸等统计特性,也可以考虑用复杂的方法分析,如:利用模型或句法等。(2)统计法统计描述方法是利用纹理的统计特性和规律来描述纹理,它适合于广泛存在的自然纹理,也同样适于描述人工纹理。统计方法是最早在纹理分析中应用的方法之一,目前它较为成熟、实用,在纹理特征提取方法中占主导地位。此类方法通过计算每个点的局部特征,从特征的分布中推导出一些统计量来刻画武汉理工大学硕士学位论文纹理。常采用的具体方法有:灰度宜方图矩、基于灰度共生矩阵的描述法、基于纹理能量、基于对比度、粗细度和方向性、基于重复性、方向性和复杂性等。灰度共生矩阵描述方法是基于在纹理中某一灰度级结构重复出现的情况。这个结构在精细纹理中随着距离而快速地变化,而在粗糙纹理中则缓慢地变化。灰度共生矩阵被定义为从灰度为f的点离开某个固定位置关系占=(n,D。)的点上的灰度为,的概率,其中见和D.,分别为工轴和y轴方向上的距离。灰度共生矩阵用只表示:只(i,,)(j,,=O,1,2…上一1)(3—5)式中,上为图像的灰度级个数;f,,分别表示两个像素的灰度:艿表示两个像素的空间位置关系。不同的d决定两个像素间的距离和方向。它描绘了具有灰度级f、,的两类像素,以多大的频率出现在用间隔距离占定义的区域中。现在,常用四个方向上位置关系来计算灰度共生矩阵:名。(f,-,)=I{【(|j},,),(m,聆)】∈D:七一研=o,『,一”f.J,,(尼,,)=f,,(卅,胆)=驯只,。。(f,‘,)=『{[(☆,,),(研,疗)】∈D:(七一棚=一占,,一以=∞或(t一小=占,,一”=一占),厂(七,,)=f,,(肌,”)=_,)f…、名。。(f,,)=Jf[(☆,,),(m,H)】∈D:It一州I=d,,一n=o,厂(≈,,)=f,厂(m,珂)=n『气。(f,,)=f{[(|j},n(m,开)】∈D:I(.i}一删=万,f一聆=J)或(.i}一聊=一J,f—n=一J),,(|i}.?)=f,厂(m,H)=_,)1由灰度共生矩阵可以计算一组参数,用来定量描述纹理,有对比度、能量、熵、和熵、差熵和逆差矩等,它们的计算可以参考相关文献[15】。由于灰度共生矩阵的大小为上×三,并且我们通常要计算多个方向上的灰度共生矩阵,这样一来,计算量比较大。通常情况下在计算灰度共生矩阵之前,首先要通过灰度直方图的统计分析,在不影响纹理的情况下,进行灰度级合并处理,使灰度级减少到一定范围之内,然后再计算灰度共生矩阵。(3)频域法频域描述方法是基于对功率谱密度函数的频率或变换系数的分析之上的。因为纹理的粗糙度正比于空间周期,所以粗纹理的空间能量集中在低频部分,而细纹理对应的频率分量主要是在高频部分。常用的具体方法为:基于傅立叶变换的纹理描述、基于小波变换的纹理描述等。这里简单介绍一下基于傅立叶武汉理工大学硕士学位论文变换的纹理描述。对于傅立叶变换的能量谱:IF(甜,v)r=F■,v)F。@,v)(3—7)式中,(“,v)表示傅立叶变换的复共轭。容易得知,如果一幅图像的纹理较粗糙,即图像的灰度变化很少或较慢,则在较小的也2+v2处的IF(“,v)12应该有较大的值;如果一幅图像的纹理较细腻,即图像的灰度变化频繁或较快,则在较大的√“2+v2处的lF(“,v)12应该有较大的值。因此一个有用的度量就是IF(Ⅳ,v)12随也2+v2变化的情况。将lF(“,v)12用极坐标表示为lF(p,口)卜则√“2+v2就成为p。『F(p,臼)J‘不仅与户有关,而且与目有关。我们可以利用下式来检测纹理的粗糙性:f(p)=llF(户,口)rdp(3—8)这样,f(p)的峰值位置反映了纹理构成元素或纹理基元的大小。设扁是r(p)的峰值,则岛越小,说明纹理基元越大,纹理越粗糙;岛越大,说明纹理基元越小,纹理越细腻;如果f(p)没有明显的波峰或波峰的数目很多,说明图像中的纹理杂乱无章,或者存在有多种尺度上的纹理。另外,一个与能量谱紧密相关纹理的方向性。假如~幅图像有一条朝向酿的边缘(与x轴夹角为岛),那么沿着此边缘垂直的方向上,即岛±昙的方向上,有可能观察到明显的纹理。这是因为纹理基元一定是靠边缘将其与其它基元或物体分开的。这样的话,图像的傅立叶变换在(“,v)空间的皖±昙方向上应该有较大的分量,即lF(P,臼)n立在铭±要的方向上有较大的值。可以用下式来衡量纹理对方向的敏感度:f(口)=0F(p,口)J2dP(3~9)如果f(p)在岛存在峰值,则说明图像中的纹理上沿着岛±罢方向延伸的。如果不存在明显的峰值或峰值点过多,则说明纹理没有明显的方向性或者纹理排列杂乱。关于以上提到的两个函数我们可以发现,,(p)对方向不敏感而对(“,v)空间频率敏感,f(们对频率不敏感,但对方向敏感。武汉理工大学硕士学位论文3.4色彩空间车牌携带有颜色信息,为了正确识别颜色,需要建立色彩空间。色彩空间是对彩色的一种描述方法,目前有多种表示数字图像色彩信息的色彩空间模型,常见的有RGB、HsV、cMl『K、Lab等。每种模型是针对特定应用问题而提出来的,都有其特定的应用环境。各种色彩空间之间都存在相应的转换关系。3.4.1RGB色彩空间RGB是使用较普遍的一种色彩空间它是用一个单位长度的立方体来表示颜色的。通常将黑色置于三维直角坐标系的原点,红(Red)、绿(Green)、蓝(B1ue)代表可见光谱中的三种基本颜色或称为三原色,分别置于3根坐标轴上。黑蓝绿青红紫黄白8种常见颜色分别位居立方体的8个顶点。对于红、绿、蓝三种颜色按其亮度的不同分为256个等级,所以RGB色彩空间中各个分量的取值范围都是0至255。因此,红绿蓝分量全部组合起来共可表示256×256×256=16777216种不同的颜色,从而产生视觉效果上丰富而广泛的颜色。RGB色彩空间在色彩的处理过程中主要是用来描述像显示器、电视、扫描仪、数字相机等设备的。3.4.2HSV色彩空间HSV色彩空间模型如图3一l所示,是由色调(Hue),饱和度(satI啪tion)和亮度(value)三个颜色分量组成的一类色彩空间。它通常用于选择颜色,更接近人对颜色的主观感知。色调是可见光经过折射后产生的单色光谱,即纯色,它组成了可见光谱,并用360度的色轮来表示。对应于孟塞尔(Mussel)颜色立体模型中水平剖面的周向。其中蓝色位于240度左右。饱和度描述颜色的浓淡程度,各种颜色的最高饱和度为该图3·1HSV模型武汉理工大学硕士学位论文色的纯色,最低饱和度为黑白系列颜色。饱和度对应于孟塞尔颜色立体模型中水平剖面的径向,在色轮上,从中心向边缘饱和度是递增的。色轮中心由黑色到灰色再到白色的一系列颜色的饱和度都为零。亮度表示颜色的明亮程度,对应于孟塞尔颜色立体模型中垂直剖面的中轴线。亮度主要受到光源强弱的影响,它与色彩信息无关。该色彩空间三个分量的相关性较低。所以在选择颜色时,我们通常由RGB色彩空间转换到HsV色彩空间中,然后再作处理。3.4.3RGB到HSv色彩空间的转换进行色彩空间的转换运算之前,需要在RGB空间将每~个色彩分量值先归一化,可以通过对每一个分量除以255来得到。RGB到HSv色彩空间的转换关系如下:矿=堡±堡±堡3(3—10)~s=1一--—;_—=[mitl(月,G,曰)]月+G+口。(3一11)H:。o。~1|]竺:坠竺:皇!3.4.4色彩分割2√(R—G)2+(R—B)(G—B)I『R≠占或G≠丑(3啦)描述颜色相似程度的指标是色差,色差通常用两个点颜色的距离来表示,通常用欧几里德范数表示的广义距离来表征颜色间的接近程度(即欧氏距离)。设有两种色彩c.=H,,s,,¨与c,=H,,S,,¨,其色彩距离的计算公式如下【儿j:、三D(C,c,)=I%(K一_)。+%(S2+s,2—2Sts,cos(q一日『))f2式中Ⅳ0,阡2为加权系数,在实际情况中,量在颜色判别中起到更关键的作用,应该适当加大阡2的值,0.25,件2为2,得到的色彩距离值更利于进行色彩分割。(3—13)由于色调分量和饱和度分可以设定聊为通常的色彩分割是对图像进行扫描,按公式(3.13)计算每一像素与聚类中心的色彩距离值,再把计算得到的色彩距离与所设定的闽值比较从而对像素进行分割,色彩距离的计算是一件比较耗时的过程。通过对大量车牌图像的分析,可以发现对于具有某种目标色的像素,可以直接通过对H、s、v三分量设定一个范围来把它们过滤出来,无需进行较复杂武汉理工大学硕士学位论文的色彩距离计算,这样可以在色彩分割时节省大量的时间。这种过滤对蓝色和黄色车牌特别有效,但对于黑色和白色的过滤效果不是很理想。这是因为对于纯色的黑色和白色,它们的色调和饱和度没有意义,所以和其它颜色相比缺少了两个过虑指标。3.5车牌定位算法一般在复杂环境下采集的彩色汽车图像都包含有大量的边缘信息,尤其是车身正面边缘信息往往比较多。如果采用常规的灰度跳变统计的方法,很难排除干扰边缘,从而导致不能准确定位车牌区域。这里,我们给出一种基于色彩过滤的定位算法。该算法不用对整幅图像进行边缘检测,而是直接寻找图像中颜色、形状及纹理符合车牌特征的连通区域。实验表明,该算法定位效果良好。3.5.1车牌的先验知识我国现行的主流车牌是按照中华人民共和国机动牌照号GA36.92标准制定的,俗称九二式车牌,它具有一定的规格。车牌为矩形,其长度和宽度分别为44cm和14cm。上面按规律分布有8个字符,包括中文汉字、英文字母、阿拉伯数字和圆点分隔符。车牌有四种类型,分别为:蓝色车牌,上有白色字符:黄色车牌,上有黑色字符;白色车牌,上有黑色和红色字符;黑色车牌,上有白色字符。对蓝色和黑色车牌进行二值化以后,字符区域像素的值为1,其它像素的值为0;而对于黄色和白色车牌,其像素取值刚好相反。在以后的字符分割和识别中,需要根据相应情况进行反色处理。在我国,挂有蓝色牌照私家车的总量相当大,并且各种车牌出现的频度由高到低依次为蓝、黄、白、黑,其中出现最频繁的两种车牌都是彩色的。经过对大量的彩色图像的分析我们发现对于车牌图像来说,它的色调、饱和度和亮度值范围如下表3—1:表3—1HSV的取值范围,“\”表示不予考虑的项目。蓝色色调饱和度亮度200—255度0.4~l0-3~1黄色25~55度0,4~1O.3~1白色\O~0.1O.9~l黑色\\0~O.35武汉理工大学硕士学位论文通过对大量车牌图像的分析,可以发现对于具有某种目标色的像素,可以直接通过对H、s、v三分量设定一个范围来把它们过滤出来,无需进行较复杂的色彩距离计算,这样可以在色彩分割时节省大量的时间。这种过滤对蓝色和黄色车牌尤为有效,并且蓝色和黄色的饱和度及亮度分量取值范围相同,可以同时对它们进行过滤。但对于黑色和白色,色彩过滤的效果不是很理想。因为对于纯色的黑色和白色,它们的色调和饱和度没有意义。虽然实际上在原始采集图像经过色彩空间转换后,白色和黑色车牌区域的饱和度、色调有具体的数值,但其取值不规律,很难用色彩过滤的方法把白色和黑色车牌区域和其它伪目标区域区分开。特别是对于黑色车牌,它只有一个亮度信息可以用于过滤,进行过滤时,总是出现车牌区域和大面积的黑色区域重叠的情况。3.5.2算法分析考虑到我国蓝色和黄色车牌在所有车辆中所占的比重很大,其出现频次相当高。我们可以分别做两种定位算法:~种用于定位彩色车牌,另一种用于定位黑白车牌。首先可以假设原始采集图像中的车牌为蓝色或黄色。根据上面表格中车牌颜色的取值规律,车牌区域的像素就可以直接通过对H、s、v三分量设定一个范围来把它们过滤出来。实际操作时可以经过反复试验,进一步缩小表格3.1中的取值范围。过滤后的图像存在许多符合色彩取值范围但不可能是车牌区域的孤立点,删除这些孤立点。然后进行数学形态算,从而得到包含车牌的目标色连通区域和背景色连通区域。接着对目标色连通区域进行分析。考察其面积、形状、最大和最小宽度、长宽比以及区域中单位面积内的边缘点数目等,排除与标准车牌特征差别较大的区域。最后,再对符合车牌区域特征的连通区域进行纹理分析,从而最终确定正确的车牌区域。如果最后所有的连通区域都不符合车牌区域的特征,则可以确定彩色车牌不存在,需要转入黑白车牌处理程序。通过色彩过滤以及色彩连通域形状分析,可以将与车牌底色不符合的区域归并至背景色,并能过滤掉与车牌底色相似的大面积车身区域及该区域所包含的干扰文字。同时也可以滤掉那些与车牌临近区域的干扰纹理,因为这些纹理颜色与车牌底色一般有较大的区别。根据车牌区域内字符的纹理特性,通过利用纹理分析可以剔除掉那些颜色、形状与车牌基本吻合,但内部纹理特性差异显著的区域。武汉理工大学硕士学位论文当发现蓝色或黄色车牌不存在时,就认定需要定位的车牌为黑色或白色。对于黑色和白色车牌有一条重要的规律,那就是在车牌区域的灰度跳变值非常大,这样就解决了求取灰度图像边缘时闽值选择困难的问题。在排除了蓝色和黄色车牌后,我们可以根据车牌出现频度的高低,首先认定车牌是白色的。然后用饱和度和亮度取值范围过滤出符合该范围的像素,再进行数学形态算形成连通区域。取~个较大的边缘闽值在这些连通区域内进行边缘检测,接着进行边缘点统计,根据其在水平方向和垂直方向的投影,从而确定多个连通区域中可能存在车牌的区域。最后采取形状分析和纹理分析,检查是否正确的车牌区域。如果白色车牌也不存在,就只能按黑色车牌的亮度信息进行色彩过滤,然后重复像对白色车牌那样的处理过程。3.5.3算法流程·彩色车牌定位算法具体流程如下:(1)色彩空间转换:在RGB空间将每一个色彩分量值先归一化,通过除以255得到。然后将原始图像从RGB色彩空间转换到Hsv色彩空间。(2)设置颜色取值范围:按表中蓝色和黄色的取值规律对H、s、v三个分量分别设定过滤范围。对于色调分量要首先进行归一化,通过除以360度得到。(3)以设定的取值范围对图像进行色彩过滤,将所有像素归并至目标色与背景色中。得到二值图像,该图像中蓝色和黄色像素取值为1,其它颜色像素均为O。(4)进行孤立点删除:用具有一定大小的结构元素对图像进行开启运算,我们认为面积小于该结构元素的图像块儿是孤立点,将其删除掉。(5)用一个矩形区域对图像进行形态闭合运算,形成连通的区域。(6)对每个连通区域进行面积、形状等特征进行分析,过滤干扰区域。(7)对符合车牌形状特征的区域做纹理特征分析,根据车牌内字符区域的纹理特征进行再次过滤,最终定位有效的车牌区域。(8)对上一步的结果进行判断,检查是否存在有效车牌区域,若是,定位成功,结束流程;否则,跳转至黑白车牌定位程序。●黑白彩色车牌算法具体流程如下:30武汉理工大学硕士学位论文f1)色彩空间转换f2)设置白色S分量和V分量的取值范围:(3)以设定的取值范围对图像进行色彩过滤:f4)删除孤立点,进行形态闭合运算;(5)取一个较大的边缘阈值,在亮度图像中求取边缘;(6)在每个符合色彩过滤条件的区域中进行边缘点统计,根据其在水平方向和垂直方向的投影,确定该连通区域中可能存在车牌的区域。(7)对于上一步得到的多个可能是车牌的区域进行面积、形状等特征进行分析和纹理特征分析,检验是否能够找到有效的车牌区域。若是,定位成功,结束流程;否则,设置黑色V分量的取值范围,重复第(3)至第(7)步,如能找到黑色车牌则定位成功,否则定位失败或图像中不存在车牌图像。3.5.4实验结果进行彩色车牌定位的结果如图3.2至3-8所示。如果原始图像中含有跟车牌颜色相似的多个色彩区域,色彩过滤后的图像仍然可能包含多个伪目标,需要进一步使用车牌形状特征对伪目标进行过滤。通常除了真正的车牌区域外,其它连通域的形状与车牌的形状特征都存在较大差异。我们先用计算比较方便的面积、形状、最大和最小宽度、长宽比以及区域中单位面积内的边缘点数目等指标对伪目标区域进行排除,经过这一步分析排除基本上可以得到车牌区域。如果上述特征还不能排除干扰区域,就需要去考察连通域中的纹理是否符合车牌字符的笔划特征。如经过纹理分析后排除了所有区域,则证明图中不存在彩色车牌,需要转入黑自车牌定位程序。图3—2原始图31图3.3过滤H分量后的图像武汉理工大学硕士学位论文图3.4过滤s分量后的图像图3-5过滤V分量后的图像图3.6并运算后的图像图3.7开启、闭合运算后的图像图3-8车牌位置32武汉理工大学硕士学位论文这种基于车牌颜色信息的定位方法考虑了车牌定位中可能出现的各种不同干扰背景对车牌定位的影响。充分利用了车牌区域的色彩信息,并综合利用车牌的形状特征及纹理特征,逐步过滤干扰区域,最终定位正确的车牌位置。其缺点是对于黑白车牌的定位首先要排除彩色车牌的存在,所以在定位黑白车牌时显得算法繁琐,延长了定位时间。但由于黑白车牌出现的频度相当小,所以总体上对定位的效果影响不大。另外,现在的车牌识别算法一般都只注重车牌上字符的识别,而忽略了对车牌颜色的识别。其实车牌的颜色包含了相当重要的信息,它表明了汽车本身的类型,有时候对于不同的车型我们要区别对待。比如在高速公路收费、对大型车辆实施禁行的场合等。所以车牌的颜色也应该作为车牌识别的内容之一。我们采用色彩过滤的算法不仅可以确定车牌的区域,而且可以在定位阶段就确定了车牌的颜色。3.6车牌的倾斜矫正进行车辆牌照的图像采集时,一般无法保证车牌上下边沿与图像采集设备成像平面的上下边沿平行,也无法保证车牌平面法线与成像平面法线在同一直线上。这样,势必造成了图像中牌照的倾斜和透视变形。目前对透视变形没有有效方法进行处理,因此矫正部分就是矫正牌照的倾斜,使得处理后牌照图像虽不“竖直”但却能保证“横平”。如果在后期的字符分割、字符识别中采用合适的算法,则倾斜度较小的车牌不会影响车牌识别的整体性能,所以这里我们只对倾斜度较大的车牌进行矫正,来弥补倾斜的影响㈣。目前常用的倾斜度矫正的方法主要是基于Hou曲变换的。基本思想是:采用Hough变换来检测车牌区域上下边框两条平行直线倾斜角,然后对车牌进行矫正。具体实践时,可以借助sobel算子检测出车牌区域的边缘,再利用Hough变换来实现。Hou曲变换在待测直线具有小的扰动和断裂、甚至是虚线时,具有很强的检测能力。但是在很多情况下,由于车牌自身磨损或者光照等因素的影响,车牌区域的边框信息并不明显,甚至是很微弱。比如当上下边框出现过多、过长的度断裂时,Hough变换就不能正确的检测出直线。另外,由于我们是采用色彩过滤的方法得到的车牌区域,而边框的颜色一般车牌颜色不符,一般情况下得到的车牌区域不会包含完整的车牌边框。所以本文中采用另外一种测量倾武汉理工大学硕士学位论文斜度的方法。我们首先二值化车牌图像,按照车牌的颜色决定是否进行反色处理。然后排除噪声干扰,滤除孤立点。接着,将车牌平均分为左右两部分,分别统计它们的非零值点所处在纵坐标位置的平均值,如果两个平均值的差在一定范围内则不需要进行倾斜矫正,否则进行倾斜矫正。此时牌照的倾斜角度口可以由两个平均值的差和车牌的长度确定。得到牌照的倾斜角度后,就可以将牌照矫正为标准的矩形了。有时我们将这种图像的几何矫正称之为图像的几何变换。设P为车牌区域的图像,P’是P矫正后的图像。我们首先找出矫正前车牌区域的中心点位置坐标(‰,乩)。由于我们仅对水平方向的倾斜进行矫正,矫正前后横坐标位置不变,假定牌照的倾斜角度为口,则矫正后对于P。中的每一个像素(x,y)的值,我们可以由下面的矫正公式得到:P。也加PP‘∥谚印譬篆:端搿3.7字符的分割p∽字符的分割是指将单个有意义的字符从字符串中提取出来,作为的字符图像。标准车牌照上的字符间隔有一定的规律:一般车牌(军车、警车、教练车、领事馆车除外)上有7个字符,首位为省名缩写汉字,第二位为英文字母,第三位为英文字母或阿拉伯数字,末四位为数字,字符总长度为409衄,其中单个字符统一宽度为45mm,第二、三个字符间隔为34mm,中间的小圆点为10舢宽,小圆点与第二、三个字符间隔分别为12mm。充分利用这些先验知识有助于字符的准确分割。3.7.1去除上下边界牌照的边框对于牌照字符串的切割是一个很大的障碍。由于牌照边框的存在,使得字符串的垂直投影的值全部大于零,从而不能依据投影确定切割点的位置。值得庆幸的是由于我们采用的是色彩过滤的方法,所以定位的车牌图像一般不会包含太多和牌照区域颜色不同的边框。即使这样,也不可能做到刚好定位在字符的上下边沿上,牌照的上下边沿处仍会有许多其他的干扰。这些干扰的来源各式各样,有的是在拍摄牌照由于光照等干扰留下了阴影,还有可能34武汉理工大学硕士学位论文是牌照上铆钉的干扰。这些干扰信息都会对字符的分割产生不利的影响,主要体现在垂直投影信息己经不能正确体现分割的位置。所以,去除这些干扰信息是很重要的。我们采用行扫描的方法来去除上下边界的干扰,其目的是准确定位出车牌字符串的上下边界,为单个字符的分割做准备。如前所述,标准牌照上有7个字符。这样在字符区域,每条水平线所通过的笔划数目至少为7,而在非字符区域,每条水平线所穿过的笔划数目应该不大于7。我们取一个略大于7的数10为闽值,然后统计每行的非零点数目。如果大于10,则认为可能是字符所在行,否则就认为该行不穿过字符区域。具体的算法如下:(1)统计每条水平线上的非零点数目。若大于等于lO,则认为该行可能位于字符区域:小于10,则认为该行可能位于非字符区域;(2)如果所有被认为可能位于字符区域的行是连续的,则这些行中最上面一行为字符的上沿,最下面一行为字符的下沿;(3)如果所有被认为可能位于字符区域的行不是连续的,而是组成了若干个高度不同的块,则比较这些块的高度,认为高度值最大的块为字符区域,该块最上面一行为字符的上沿,最下面一行为字符的下沿。由此,我们就能够准确地确定字符的上下边沿。3.7.2单个字符的切分完成去除上下边界的工作以后,就可以进行单个字符的切割。由于所要处理的对象是已经定位出上下边界的车牌上的字符串,所以这里的字符分割,实际是确定具体每个字符的左右分割线。我们所采用的字符分割算法主要借助标准车牌上字符间隔先验知识和相关投影信息来定位每个字符的分割位置。进行字符分割时,主要的难点在于对断裂、粘连字符的处理上。断裂的字符需要台并,粘连的字符则需要再次切割。对于断裂字符,一般有两种类型的合并方法。一种是切割后根据估计的字符宽度和间隔宽度对字符块进行合并处理。另一种是根据字符识别的结果完成字符块的合并,至于粘连字符的再切割,有两个关键:第一,要能准确地判断出哪些字符块中含有粘连的字符;第二,要能找到粘连字符块的最佳切割点。解决粘连字符的切割方法也能分为两类。一类是基于特征,一类是基于识别结果。本文中,断裂字符的合并和粘连字符的分割都35武汉理工大学硕士学位论文没有采用基于识别结果的方法,这是因为车牌上的字符具有固定宽度和固定间隔。在去除车牌的上下边界后,根据得到的牌照图像大小和牌照的制作标准,可以计算出车牌上的字符宽度。把这个宽度值作为牌照的标准字符块宽度std.width。这样可以很好地排除粘连和断裂字符的干扰。然后,在牌照字符串上下边界确定的范围内进行垂直投影,计算垂直方向上每列的非零点个数,设,(f)表示第巧0的非零点的个数。我们从右向左开始扫描,即从车牌的最后一个字符开始确定每个字符初始的左右边界。』(f)=0时,则认为是该列属于间隔区域,如果』(f)>O,则认为该列属于字符区域。标记字符的左右边界时,取由,(f)=0过渡到』(f)>O的列作为字符的右边界,取由,(f)>0过渡到』(f)=O的列作为字符的左边界。对于由两个,(f)=O和,(,)=O的列所确定的字符块,需要考虑以下几种情况:(1)如果2×o.8×std—Widt}l<If一州Q×1.2×std.width,则此字符块被判断为两字符粘连,需要首先取i和J列的平均值,然后在列平均值附近找出非零点最少的列作为分割点:当3×o.8×std.widtll<If一.,l<3×1.2×std.widtIl时,则此字符块可能是三字符粘连。也是首先找出该块儿的三等分点,然后再在等分点附近寻找非零点最少的列作为分割点。(2)当If一州<o.5×std-widt}1,进一步考察该字符区域内的非零点数目,如果小于某一闽值则认为是噪声,删除该区域;否则我们认为字符出现了断裂,该字符块为必须合并的块。(3)当o.8×std一、聃dtIl<If一,I<1.2×std—widtll,我们认为该字符块儿不必合并,也不必拆分。余下的块都标记为可并可不并的块。合并按照以下的原则进行:当必须合并的块左右邻都为不必合并的块时,此块不合并;当必须合并的块左右邻有一个为必须合并块或可合并块时,合并这两块;当必须合并的块左右邻都为必须合并块或可合并块时,则比较左右字符块的宽度,取较小宽度的块合并。字符分割的结果如图3.9至3.14所示。我们首先对车牌做倾斜矫正处理.然后统计水平方向上各行的非零点个数。根据统计结果可以确定车牌上字符串的上下边沿,得到水平切分后的图像如图3.12。接下来再对水平切分后的图像做垂直方向上的非零点统计,并最终得到分割后的单个字符如图3.14。武汉理工大学硕士学位论文~i。o{…~J●●E)图3,9倾斜矫正前的车牌图3—11水平方向非零点统计图3-13垂直方向非零点统计图3—10倾斜矫正后的车e…1._图3—12水平切分后的车牌瓤■刎。图3.14分割后的字符3.8小结本章主要研究了车牌定位、字符分割相关的关键技术,我们首先分析了数学形态学、纹理描述、色彩空间变换等算法,然后确定了基于色彩过滤的车牌定位算法。该算法首先利用色彩过滤目标颜色像素,排除孤立点的干扰后利用形态学形成闭合连通区域,然后结合车牌的形状特征和车牌字符的纹理分析从而确定车牌区域。字符分割阶段,我们在对严重倾斜的车牌进行倾斜矫正后,根据字符区域投影信息并结合车牌上字符间隔的先验知识来确定各个字符的最佳分割位置。另外,对于断裂和粘连字符,本章也给出了简单而有效的处理算法。37第4章车牌字符的识别4.1字符识别的原理及组成车牌字符的识别作为对车牌图像的理解,是整个车牌识别的最后一步,其目的是为了输出识别后的车牌。车牌字符识别是从属于光学字符识别(0cR)的一个特殊问题,可以利用OcR的原理和方法来进行车牌字符的识别。字符识别的原理如框图4—1所示。图4.1字符识别原理由于我们已经得到了分割出来的单个字符图像,所以这里预处理部分主要是增强分割后字符图像的信息,去除字符图像中的污点等噪声。并根据一定的准则除掉一些非本质信号,对文字的大小、位置和笔划粗细等进行规范,以便简化判断部分的复杂性。特征提取部分是从规范化的信号中抽取反映字符本质的有用信息,供识别部分进行判断及分类。作为特征提取的内容是比较多的,可以是集合特征,如文字线条的端点、折点和交点等。识别判断部分则是根据抽取的特征,运用一定的识别原理,对文字进行分类,确定其属性,达到识别的目的,实际上判断部分就是一个分类器。图中虚线以F是字符识别的学习部分,它的功能是生成计算机特征字典。图中虚线以下是字符识别的学习部分,它的功能是生成计算机特征字典。38武汉理工大学硕士学位论文学习根据已经准备好的多个字符样本,提取出代表每个字符的特征,自动构造或修改字典。4.2字符图像的预处理一般来说,经过字符分割后提取出来的单个字符不能直接进行字符识别,通常都要经过一定的预处理后才可以送到识别器中识别。预处理的主要目的是便于字符特征的提取,字符的预处理主要包括字符的二值化、平滑、规范化、细化等。4.2.1平滑平滑的目的主要是为了突出字符图像中有用的信息并消除噪声的干扰。因此对字符图像平滑化处理的要求有两条:一是不能损坏图像的边缘轮廓及线条等重要信息:二是使图像清晰,视觉效果好。所以对于字符的平滑处理,我们一般不宜采用第2章中的图像平滑化处理方法如临域平均法或在频域进行低通滤波,而需要采用专门针对字符图像进行平滑处理的方法,它要能够去掉噪声、平滑笔划边缘㈨。对一幅二值化的字符图像来说(白像素代表字符或噪声,黑像素代表背景),平滑过程可以表述为:(1)填充由白像素包围的黑像素;(2)填充边缘上的黑像素凹凸:(3)消除孤立点;(4)消除边缘上的白像素凸起。n,n2n,n。pn。In,n6n,图4.2辅助矩阵本文采用改进的unger平滑算法,表述如下:设有3×3的辅助矩阵如图4—2所示,其中P为当前进行平滑的点,H。~",为它的八个邻接点,根据辅助矩阵中各像素的值来确定矩阵中心点的取值,平滑公式如下:p=p-[‰·一·(也+愧)+玛·‰·(,z0+%)】+p‘(以2+珂6)1【(吩+‰+H5)+(no十九l+■)】+(no+‰)-[(ns+H6+一)+(%+n2+飞)](4—1)式中,p’为平滑后矩阵中心点的取值。公式(4—1)的平滑规则可以用语言描述如下:39武汉理工大学硕士学位论文(1)当P为黑色时,孙孙卧‰中至少有三个为白像素时将P改变为白色,否则P不变。(2)当P为白色时,如果能够同时满足下列情况,则P不变,否则P改为黑色。>孙补孙孙H4中至少有一个为白色;≯吩吩~、即%中至少有一个为白色;>啊、n,、珠、脚、‰中至少有一个为白色;≯n。、n,、n0、nl、也中至少有一个为白色;4.2_2规范化为了消除字符由于在大小、位置上对字符特征提取、识别的影响,需要对字符图像进行规范化处理。规范化一般分为位置规范化、大小规范化、笔划粗细规范化。为了消除字符点阵位置上的偏差,需要将整个字符点阵图形移动到固定的位置上,这个过程被称为位置规范化。有两种简单的位置规范化方法。一种是基于质心的位置规范化;另一种是基于字符外边框的位置规范化。基于质心的方法需要首先计算字符的质心,然后再把质心移动到指定的位置上。基于字符外边框的位置规范化需要首先计算字符的外边框,找出其中心,然后再把字符中心移动到指定的位置上。相对而言,质心计算是全局性的,因此抗干扰能力强,各边框搜索是局部性的,易受干扰影响。对不同大小的字符做变换,使之成为同一尺寸的字符,这个过程被称为大小规范化。其目的是为了消除字符大小对识别造成的影响和便于在识别中确定判据和标准,一般在平滑后进行。常用的大小规范化方法也有两种。一种是将字符的外边框按比例线性缩放为规定尺寸的字符,另一种是根据水平和垂直两个方向字符像素的分布进行大小规范化。与位置规范化一样,利用字符外边框的大小规范化对噪声的影响更加敏感。对后一种方法,先计算文字的质心G.和q:日口占RG,=气≮~∑∑c(f,-,)∑∑f·c(f,,)G,=号#卜一∑∑c(f,.,)∑∑J·c(f,,)(4—2)武汉理工大学硕士学位论文式中c(f,,)为1时表示该像素为白像素(即字符像素),为O时表示该像素点为背景,A、B、L、R分别表示字符的上下左右边界。然后计算水平和垂直方向的散度q和q:口月2口拧2q2=型』}可——一q2=型』号可——一(4—3)∑∑c(f,.,)∑∑c(f,/)t=^i。Lt-^|=L∑(∑c(f,埘·(f—Gf)∑(∑c(f,肋-(/一q)最后,按比例将字符线性放大或缩小成规定散度的点阵。4_2.3细化对一幅二值图像,细化就是逐层剥去其笔划边缘上的点,变成笔划宽度只有一个像素的字符骨架图形。细化主要是为了在保留字符原有特征的基础上去除多余的点,以利于字符特征的提取。细化后的字符要保持原有笔划的连续性,不能出现笔划断裂的情况,字符笔划宽度只有一个像素并且该像素应尽量为原来笔划的中心线。细化算法有很多,本文采用SPTA(safe—pointthinningalgorithm),该算法中定义的几个关键术语如下:(1)边缘点:至少有一个四邻接点(指四个像素‰、孙补%)为黑色的白像素点。(2)端点:只有一个白色八邻接点(指‰一月,八个像素)的白像素点。(3)连接点:该点的删除将破坏原有模式连续性的白像素点。sPTA算法的执行基于输入模式已经经过平滑的假设,即认为该模式己经剔除了原始模式所有的不规则部分和噪声。用SPTA算法进行细化包含多轮对模式的检查过程,每轮扫描都有部分白像素点被标记,被标记像素点必须是边缘点,但不能是端点和连接点,而且它的删除不能在模式中引入新的污损。在每轮扫描的最后.算法删除所有被标记的点。如果在某轮扫描结束后没有像素点被删除,即在该轮扫描中没有边缘被标记,算法结束。sPTA算法称未被标记的边缘点为安全点(safepoint),被标记的边缘点为非安全点。算法根据以下的布尔函数来判定边缘点是否为安全点。对于左边缘点(左邻点%为黑像素点),若墨=‰(M+他+%+%)(也+玛)(心+吩)(4—4)如果S。为零,则当前的左边缘点为安全点,否贼,为非安全点。布尔表达41武汉理工大学硕士学位论文式中相应像素为白且未被标记的点的布尔量为l,否则为O。同理,对于右边缘点(右邻点‰为黑像素点),用于判定其是否为安全点的布尔函数表达式为:.写=挖4(%+n6+n2+%)(‰+%)(胛2+%)对于上边缘点(上邻点,z'为黑像素点),表达式为:岛=‰(屿+‰+确+愧)(%+峰)(啊十码)对于下边缘点(下邻点‰为黑像素点),表达式为:(4—6)(4—5)s6=n2(n3+n4+n0+n1)(n4+飞)(no+砩)(4—7)上述方法的正确性可在满足sPTA算法假设的前提下由严格的推理得出。这样,sPTA算法每轮的检查过程实际上由逐行和逐列两次扫描组成。第一次扫描检查所有的左、右边缘点,标记出非安全点;第二次扫描则检查所有的上、下边缘点,标记出非安全点。应当指出的是,先逐列、再逐行扫描也可以,前者称为行方式扫描,后者称为列方式扫描。对相同的输入模式,分别使用两种扫描方式的SPTA算法获得的最终结果略有不同f20】。413字符的识别方法简介同模式识别中的其它问题一样,字符识别方法基本上也分成统计决策识别和句法结构识别两大类,而每一类中又包含有许多具体的方法。然而,无论采取何种识别方法,其中的关键都是特征的选取与提取以及相应的分类算法。与两种识别方法相对应,特征也大体上分为统计特征和结构特征两类。(1)结构法结构方法是发展最早的一种方法,它的基本思想是把字符图像分割化为若干的基元,例如笔划、拓扑点、结构突变点等,然后和模板比较进行判别。由这些结构基元及其相互关系完全可以精确地对字符加以描述。主要的方法有基于轮廓、骨架和字符链码的方法。其主要优点在于对字符变化的适应性强,区分相似字符能力强。但是在实际应用中,面临的主要问题是抗干扰能力差,因为在实际得到的字符图像中存在着各种干扰,如:倾斜。扭曲,断裂,粘连,对比度差等。这些因素直接影响到结构基元的提取,此外结构方法的描述比较复杂,匹配过程的复杂度因而也较高。42武汉理工大学硕士学位论文(2)统计法统计法依赖于大量的原始样本和数值计算,它是从车牌字符原始数据中提取与分类最相关的信息,使得类内差距极小化,类间差距极大化,特征对同一个字符类的形变应该尽量保持不变。统计特征又可以分为全局特征和局部特征。全局特征主要是对整个字符图像进行变换,利用变换系数作为特征,常用的变换包括K—L变换、Fourier变换、Gabor变换、Had锄ard变换、DCT变换、Walsh变换、Rapid变换、小波变换和矩特征变换等多种方法。局部特征是将字符点阵图像分割成不同区域或网格,在各个小区域内分别抽取统计特征,在特定位置对特定大小的窗口内的图像进行变换,如投影特征、细胞特征、计算方向线素特征等。统计特征的特点是抗干扰性强,匹配与分类的算法简单,易于实现。不足之处在于细分能力较弱,区分相似字符的能力差一些。字符的结构特征直接反映了字符的属性,利用了字符自身直观的特点;用字符的统计特征进行识别则是充分利用了计算机处理数字特征能力强的特点。两种特征各有利弊,一般需要结合使用。另外,虽然神经网络方法中主要采用局部特征,其分类机理也与传统的统计方法相同,但是由于它具有很大的灵活性,我们下面将它单独作为一类进行详细讨论。4.4用神经网络识别字符4.4.1神经网络理论概述目前,随着计算机的迅速发展,模式识别技术己经从理论探讨为主发展到大量的实际应用,人们将更多的注意力开始转向那些用于语音、图像、机器人以及人工智能等的模式识别实际问题。解决这些问题的关键是需要进行复杂而庞大的实时数据处理,而现有计算机的存贮容量及计算复杂性的局限,使得实时化的应用受阻。这种面向实时应用的模式识别问题促使人们开始将并行处理的神经网络应用到模式识别中口”。人工神经网络(ArtificialNeuralNetwork)简称神经网络是基于目前人们对自然神经系统的认识而提出的一些神经系统的模型,一般是由一系列被称为神经元的具有某种简单计算功能的节点经过广泛连接构成的一定网络结构,而其网络连接的权值根据某种学习规则在外界输入的作用下不断调节,最后使网43武汉理工大学硕士学位论文络具有某种期望的输出特性。神经网络的这种可以根据输入样本学习的功能,使得它非常适合于用来解决模式识别问题,这也是神经网络目前最成功的应用领域之一。人工神经网络模式识别与传统模式识别方法相比有以下的特点:(1)(2)(3)(4)(5)对复杂的不确定性问题具有适应和自学习能力:具有表示任意非线性关系的能力;具有网络的非线性动力学带来的快速优化计算能力;对大量定型或定量信息的分布存储能力,并行处理能力与合成能力;由并行分布处理结构带来的容错能力。神经网络模式识别的基本方法是,首先用己知样本训练神经网络,使之对不同类别的己知样本给出所希望的不同输出,然后用该网络识别未知的样本,根据各样本所对应的网络输出情况来划分未知样本的类别。神经网络可以处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题,允许样品有较大的缺损、畸变,其运行速度快,自适应性能好。本文中,决定采用BP(Back—Propagation)神经网络来实现车牌字符的识别。因为BP算法已经比较成熟,其实现相对来讲比较简单。并且如果能适当改进BP网络的学习算法,则不会需要太长训练时间。4.4.2BP神经网络学习算法三层的BP神经网络模型结构如图4~3所示:f为输入层节点;,为隐层节点;.i}为输出层节点。层与层之间采用全互连的方式。同一层神经元之间不存在相互连接。网络的每一个输入节点表示字符图像提取特征后特征向量的一个分量数据,输出节点表示分类序号,分类判决可以采用输出最大值法。BP算法由两部分组成:信息的正向传递与误差的反向传输。在正向传输中,输入信息从输入经隐含层逐层计算传向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层没有得到期望的输出,则计算输出层的误差变化值,然后转向反向传播,通过网络将误差信号沿原来的连接通路反传回来修改各层神经元的权值直至达到期望目标。BP网络的实现分为两个阶段的,即学习(训练)阶段和识别阶段。在学习阶段输入要学习的样本,按照网络初始设定的权重、阈值以及传输函数进行计算,得出每一层神经元的输出,这是从底层向上进行的。通过理想输出与输出层之间的误差来决定是否对权重、阈值进行修改,这个修改是从高层向下进行的。武汉理工大学硕士学位论文两个过程反复进行,直到网络收敛为止,此为学习阶段。权重的学习就是不断的调整各个神经元的连接强度,使其能在最小二乘的意义上逼近所对应的输出。七既,盼,,图4—3三层BP网络结构设训练集包含M个样本,对第p个训练样本(p=1,2,…,M),单元,的实际输出为%,它的第f个输入(也即第f个神经元的输出)为o。,则:“。=∑%啡。BP算法中大多选用sigmoid型函数作为输出函数,即:(4—8)定义网络误差函数为:%√∞扩南E=∑E,H‘9’(4—10)(4一11)q=去∑(%一%)2到一组权重,使误差函数极小化。式中,d。。表示对p个训练样本,单元/的期望输出。训练网络的目的是找利用梯度最速下降法,使权值沿函数的负梯度方向改变。若权值的变化量记为△呒,即:△%一熹45(4一12)武汉理工大学硕士学位论文令一誓:%,则:础J,熹:导磐:等%:一%%228(4-13)(4—14)awjIauwaw”a¨w得到:式中,灯为学习速率。△%,=叩勤%玎>o一般地,BP网络学习步骤描述如下:(1)初始化网络,将全部权值与节点阈值设置为一个较小的随机值;(2)提供训练样本,训练网络,直到权值为各类样本均达到稳定。实际应用中,为了保证能正确识别目标,应尽可能使准备的训练样本中包含各类情况。(3)向前传播过程:对给定训练模式输入,计算网络的输出模式,并与期望模式输出比较,若有误差,则执行下一步,否则,返回上一步;(4)向后传播,修正权值:%,(f+1)=阡_O)+,7%00(4—15)误差项d。,有两种情况:f厂’(%)(厶一00)隐层单元输出单元(4—16)%2{,,@∥)∑‰%L^虽然BP网络是目前应用最广泛的神经网络,但它在实际应用中也存在自身的不足,其主要表现在以下几个方面:(1)局部极小值问题BP算法采用的是梯度下降法,它是一种非线性优化算法,这就不可避免地存在局部极小问题。即BP算法可咀使网络权值收敛到一个解,但它并不能保证所求的解为误差超平面的全局最小解,很可能是一个局部极小解。在解决稍复杂问题时,误差函数可能陷入~个局部极小区域,使网络训练无法跳出这一局部极小值,致使学习过程失败。(2)学习算法的收敛速度慢究其原因有三个:一是网络的学习速率太小所造成的;二是网络容易陷入“瘫痪”状态。标准算法均选用Sigmoid非线性函数作为神经元的转移函数,我们把s型函数的值接近O或1定义域两端定义为饱和区,中间为非饱和区,在饱和区,函数值对自变量的变化不敏感。某个神经元处于饱和区时,如果神武汉理工大学硕士学位论文经元的输出不是期望的输出值,而权值调节量又很小,就很难将该神经元的状态调整过来,因而影响了网络的收敛速度;三是标准BP算法采用岛=圭莩(叱一p。)2为误差函数,随着学习次数的增加,1%一。。l越来越小,使函数逼近速度减慢。(3)隐层节点数目及初始权值的选取的问题网络隐层节点数及初始权值的选取对网络的收敛有较大的影响,但它们的确定仅凭经验而缺乏足够的理论指导。4.4.3BP神经网络的改进针对BP网络的局限性,人们对其进行了改进,具体方法如下【28】:(1)附加动量项就是在反向传播的基础上在每一个权值的变化上加上一项正比于前次权值变化的值,并根据反向传播法来产生新的权值变化。带有附加动量项的权值调节公式为:(4—17)哆f(f+1)=%,(f)+叩%%+讲形,(,)一%,(卜1)】其中,口为附加的动量项,l>d>O。附加动量项的引入可以使网络权值的变换不仅反映误差曲线局部的梯度信息,而且反映了误差曲面的变化趋势。实质是将最后一次权值变化的影响,通过一个动量项来传递。以此方式,当增加动量项后,促使权值的调节向着误差曲面底部的平均方向变化,当网络权值进入误差曲面底部的平坦区时,6变得很小,此时彤。O+1)z%(f),从而防止了形。(f)=O出现,有助于使网络从误差曲面的局部极小值中跳出。(2)自适应学习速率学习速率玎也称步长,在标准的BP算法中为常数,然而在实际应用中,很难确定最佳的学习速率。,7取值过大可加快学习速度,但有可能导致学习过程不收敛:若叩取值过小,则迭代次数明显增加,导致学习速度很慢。为了加速收敛47武汉理工大学硕士学位论文的过程,一个较好的思路是自适应改变学习速率,使其该大时增大,该小时变小。改变学习速率的方法很多,下面就是一种方法。设一初始学习速率,若经过一批次权值调整后使总误差增加,则本次调整无效,且可=∥,7(卢<0):若经过一批次权值调整后使总误差减小,则本次调整有效,且=幼(口>O)。自适应学习速率法在训练中可在局部区域获得一个近最优的学习速率,从而得到比标准BP算法更快的收敛速度。但在万很小时,仍然存在权值修正量很小的问题,致使学习速率降低。(3)引入陡度因子为了使网络避免进入“瘫痪”状态,即使神经元输出不进入转移函数的饱和区。就需要在原传递函数中引入一个陡度因子A:咿丙禹1+exp(一—})泔18)当发现△E接近O,而实际输出与期望输出差距仍较大时,可判断网络已经进入“瘫痪”状态,此时令2>l;当退出“瘫痪”状态后,再令兄=1。因为当旯>1时,“。坐标压缩了旯倍,神经元的传递函数曲线的敏感区段变长,从而可使绝对值较大的“。退出饱和值。当五=l时,转移函数恢复原状,对较小的“。具有较高的灵敏度。该方法可以有效提高BP算法的收敛速度。4.4.4利用改进的BP网络识别字符本文为了简单起见,只对数字和英文字母共计34个字符进行识别(不区分数字1、0和字母I、O)。利用多层BP网络进行字符识别时,网络的输入矢量在最简单的情况下可以选用全点阵输入,因为BP网络在用于不变性的识别时,网络隐层完成了特征的提取过程。但是,这样做的一个缺点是:输入矢量的维数太高。我们把车牌上分割出的字符都归一化为36×20个像素大小,那么输入矢量就需要720维,学习和识别时的计算量太大。为了减少计算量,可以选取字符的粗网格特征作为输入矢量。把车牌字符都分为9×5=45块,每块大小为4×4,统计各块内白像素的数量(黑底白字),得到一个以数值表示的45维网格特征。然后在水平方向上的粗网格中,计算从图像左边沿至第一次由黑变白的距离:武汉理工大学硕士学位论文接下来,计算从图像右边沿至第一次由黑变白的距离;最后仿照水平方向网格中的计算,提取垂直方向上的特征。这样共计得到45+9+9+5十5=73个特征。这样就大大降低了输入矢量的维数,确定输入神经元个数为73个。对于网络的输出方式,比较常用的有两种:一种直接用与待区分类别数目相同的输出节点表示。每个输出节点只对~类模式表现高输出,而对其他类别不作响应。这种表示方式称为“局部表达”;另一种以输出结点的特定组合来标识模式的类别,称为“分布表达”Ⅲl。具体到本文,可以对34个待识别字符进行编码,这样就将网络的输出节点由局部表达的34个减少至分布表达的6个。但是综合考虑识别率和识别速度的原因,本文中采用的是局部表达的编码方式,这样就确定了输出神经元的个数为34个。采用这种方式的网络输出解释很简单,网络输出层节点的输出是(O,1)间的实数,其最大值出现的地方就指明了输入模式所属的类别。利用BP网络进行字符识别的实现如下:(1)BP神经网络为三层结构,输入神经元为73个,输出神经元为34个,隐层神经元根据经验公式为√73+34+(1~10)=20个:(2)误差值设为O.001,初始学习速率为O.1,最大训练步长为5000:(3)进行训练时首先用标准的字符样本进行训练,然后每个字符采用lO个非标准样本对网络进行训练:(4)进行网络仿真,得到输出。找出最大值及其所指向的位置,如果最大值大于0.5,输出该位置指向的字符类别;否则,拒识。仿真时,我们利用该网络对分割后的车牌字符进行识别,正确率达到了93%,因为我们用同一个网络来识别数字和字母,所以识别率不是很高。可以考虑把数字和字母分别用两个网络来识别,以提高整体识别效果。4.5小结在识别字符之前,首先要对字符图像做一些基本的预处理,本章给出了进行平滑、规范化和细化的方法。接着,介绍了BP神经网络算法及其改进方法。在利用神经网络对字符进行识别时,如果直接用字符图像的像素点作为神经网络的输入,会使网络的规模过大和识别率降低。因此,本章提取字符的粗网格特征作为神经网络的输入,接着利用改进的BP网络对数字、英文字母进行识别。49武汉理工大学硕士学位论文第5章算法的实现方法5.1引言数字图像一般情况下是一个维数比较高的数值矩阵来表示的,进行数字图像处理就需要经常对这样一个维数很高的矩阵进行各种运算。而现在我们常用的编程语言都没有矩阵这样的数据类型,一般是通过向量来进行处理的。这样的话我们在进行编程时很不直观,不符合人们对图像主观理解。并且在做车牌识别这一具体的数字图像处理应用时,我们需要用到的算法都相当复杂,如图像的频域变换、神经网络、形态算等。如果直接采用高级语言进行编程就会非常繁琐、困难,容易出现各种预料不到的致命错误,并且执行效率不会很高。这样就会大大分散我们的精力,使我们疲于对车牌识别算法编程上,从而忽略了对算法本身的设计和创新。考虑到这种情况,我们可以用№tlab这样的专业数值计算软件来实现所设计的算法。Matlab是当今世界上使用最为广泛的科学计算软件之一,它的所有数据都恰恰是以矩阵的形式进行保存和处理的,这刚好符合人们对图像的理解习惯。另外,Matlab中还有强大、丰富的内置函数和很多专门针对各个领域的工具箱可供使用。这些内置函数和工具箱里的函数都是由专业人士进行编写的.其执行效率特别高。所以采用hfatlab来进行车牌识别算法编程的话会很方便。另一方面,如果我们用Matlab来进行算法编程的话,虽然可以很容易的实现我们的算法并进行仿真试验,但一般我们在Matlab下编写的程序一旦脱离Matlab平台的支持就不能运行。另外,Matlab对循环程序的执行效率低下,而我们在做图像处理时经常要对图像中的每个像素进行单独操作,这样不可避免的要采用循环。为了解决这个令人头疼的矛盾,本文通过编写VC++与Matlab之间接口来实现车牌识别算法编程。把我们的程序分为两类,把需要循环的程序部分交给VC+}来运行,把不需要循环的程序部分在Matlab下进行编程。在vc++生成的框架程序中调用自己在Matlab下所编写的函数。并最终生成可以脱离vc++和Matlab环境的应用程序。这样~来,编程的工作量大大的减少,不但提高了编程50武汉理工大学硕士学位论文效率,而且提高了程序的可靠性。使我们从繁琐的编程中解脱出来,能够潜,l=:进行车牌识别算法的研究。5.2Matlab简介Matlab是MatrixLaboratory的缩写,意为矩阵和实验室的组合。它诞生于20世纪70年代,由cleveMoler博士和他的同事编写的。1984年,cleveMoler和JohnLittle成立了Mathworks公司,正式把Matlab推向了市场。Matlab所使用的语言不同与其他高级语言,它被称为计算机语言。正如第三代计算机语言Fortran和c等高级语言使人们摆脱了对计算机硬件的操作一样,Matlab语言使人们从繁琐的程序代码中出来。它的使用很方便,只需对Matlab所包含的丰富的函数进行简单的调用。Matlab语言的编程比其它诸如basic、c等高级语言更加接近我们书写计算公式的思维方式,所以更加易学易懂。Matlab语言是一种解释执行的语言,它灵活、方便,调试程序手段丰富,调试速度快,需要学习时间少。Matlab长于数值计算,能处理大量的数据,而且效率比较高。Mathworks公司在此基础上开拓了符号计算、文字处理、可视化建模和实时控制的能力,增强了Matlab的市场竞争力,使其成为市场上主流的数值计算软件。Matlab中集成了众多面向具体应用的工具箱和仿真块,包含了完整的函数集用来对通信系统、信号处理、图像处理、神经网络、模糊控制、小波分析、鲁棒控制等特殊应用进行分析和设计。这就极大延伸了Matlab的能力,从而使其在许多学科领域中成为计算机辅助设计与分析、算法研究和应用开发的基本工具和首选平台【”J。特别是Matlab在图像处理方面具有明显的优势:(1)数字图像是以数值矩阵的形式来表示的,在其它高级语言中都没有矩阵这样的数据类型。而在Matlab中,所有的数据都是以矩阵形式存放的,并且它具有强大的矩阵运算功能,在进行一些简单的图像变换时可以避免很多烦琐的计算;(2)图像显示非常方便,Matlab中有专门的灰度及彩色图像显示函数,甚至在调试过程中也能随时观察图形的变化;(3)Matlab中带有丰富的图像处理函数库,如waveletprocessingt001box,imagetoolbox中的函数。由于工具箱中的函数都是由各领域的专家编写,51武汉理工大学硕士学位论文用户不必担心函数的可靠性,直接进行调用就可以。而所有的图像处理算法若用其它高级语言由用户自己重新编写将相当麻烦。基于以上原因,对车牌识别中用到的图像处理算法采用Matlab进行仿真、分析及实现是比较合理可行的。5-3为什么Matlab要与外部程序接口虽然Matl8b是一个完全的编程和数据运算的集成环境,使用它可以方便的做很多工作,但是,许多情况下仅仅依靠Matlab还是不能很好的完成任务,必须要对外部程序和数据进行交互,其主要原因有以下几点:(1)由于 ̄Iatlab是使用行解释的方式来执行代码的,所以当运行程序时就是解释它的命令。这就大大了代码的执行速度,尤其是程序中出现循环特别是多重循环时,Matlab运行起来速度非常慢。进行图像处理时,需要处理的数据很庞大,而且经常要逐像素进行分析,不可避免的要出现循环。对于二维图像,所以至少要用到两重循环。可以考虑由其它高级语言来实现程序的循环部分,然后在Matlab中调用来加快执行速度,解决计算瓶颈问题;(2)Matlab强大的功能只能在其提供的平台下使用,开发者要想在目标机器上使用其开发的Matlab程序,必须在该机器上安装有lliatlab平台,这一点经常很难满足,因此它不利于发布所开发程序。如果其它高级语言和编程环境想要使用Matlab中的某些功能,也必须要提供一种外部程序调用Matlab的方法:(3)用其它高级语言编写的算法程序要移植到Matlab中时,需要一种Matlab调用外部程序的方法,否则就得在Matlab下对算法重新编写。(4)由于Matlab的M文件是ASCII文件,任何人都可以打开显示代码并对其进行修改,不利于隐藏算法和保证开发者的拥有权。由于以上原因,就使得Matlab与其它高级语言和编程环境的交互很有意义。如果结合Matlab和其它高级语言的优点,取长补短,则可以缩短开发周期、取得更好的效果。通过开发Matlab与其它高级语言的接口,就可以把Matlab的强大功能融入各种应用程序中,通过高级语言编译器编译为二进制代码,从而大大提高执行速度,并且能隐藏代码:采用其它高级语言调用Matlab的矩阵运算和数值分析功能来实现核心算法的设计,还可以减少编程工作量,提高程序的可靠性,缩短程序的开发周期。52武汉理工大学硕士学位论文在本文中,就是通过综合使用Matlab和VisualC++集成开发环境来实现车牌识别算法编程的。Visualc++集成开发环境是由Microsoft公司推出的可视化编程工具,它是目前综合性最高、最强大的软件开发工具之一。集成了功能强大的编辑器、编译器、链接器、调试器、AppWizard.ClassWizard.AppStudio等多种多样的可视化编程工具,利用它可以完成各种各样应用程序的开发,从低层软件到直接面向用户的软件。c++语言相对其它高级语言有很高的代码效率,速度比Matlab代码快几倍甚至几十倍,但是在编写~些工程计算程序时,如快速傅立叶变换、Hough变换、小波变换、神经网络等就需要比较复杂的算法,编写得不好就会影响程序的运行速度,并且容易出错。我们通过在Visualc十+中调用Matlab进行图像处理编程,既可以方便的调用№tlab工具箱中的图像处理函数,又精简了源程序代码,还保留了Visualc++面向对象、可视化等windows程序风格和c++语言对数据快速的处理能力。下面我们就讨论一下vc+十和Matlab接口开发的方法。5.4接口的方法5.4.1Matlab调用VC编写的程序对于已经编写好的Vc程序,我们只需在程序中添加代码,再编写一个入口予程序,定义被Matlab调用的VC程序的入口地址、}fIatlab向Vc程序传递的参数和Vc程序向Matlab返回的结果。这样,就建立Matlab与被调用的vc程序之间的通信联系,入口子程序也可以看作是它们之间的通信协议。用mex¥.c命令可以生成动态链接库文件,然后直接在Matlab下调用即可。我们的目标是发布能脱离Matlab平台的应用程序,所以关于Matlab调用Vc程序的接口编写方法,这里不再赘述。5.4.2VC调用Matlab的方法Vc调用Matlab,常用的方法大致有以下几种【4il:(1)Matlab引擎方式:采用客户机朋&务器(clie州server)的计算方式,VC程序作为前端客户机通武汉理工大学硕士学位论文过‰dows的Activex通道与后台Matlab服务器建立连接,实现动态通讯。虽然只要嵌入必要的Matlab引擎库而不需要启动整个Matlab,可以节省系统资源,但Matlab在后台运行,系统必须安装MatIab,程序不能脱离M砌ab,导致程序运行效率相对低下。不利于开发商业的应用程序。(2)Matlab编译器(TheMauabComplier或简写为MCC)方式:现在,Matlab7.O及更高版本中集成的编译器最低版本为4.2,它和Matlab解释器是完全不同的两个概念。MatIab解释器是指在命令提示符下接受Matlab命令,或执行M文件、MEx文件的应用程序。而Mauab编译器则能把M文件转化为可执行的应用程序或是可供VC集成编程环境调用的C或C++的共享库(在windowS平台下为DLL,动态链接库)。Manab编译器产生的可执行文件或是动态链接库文件在运行时只需要一个简化的组件运行环境(MatlabComponemRllndme缩写为McR),而并不需要运行整个Matlab平台,甚至可以在没有安装Matlab的机器上运行。并且这个组件运行环境可以很方便的从MatIab中获得和免费发布。所以,这种方式刚好能够满足我们发布应用程序的要求。在这里需要指出,Matlab编译器只能编译函数M文件,不能编译脚本M文件,但我们可以通过简单的修改将脚本M文件转换为函数M文件以便进行编译。(3)CoM组件生成器(MatlabBuildcrF0rCOM):组件对象模型(简称cOM)是windows对象的二进制标准。为WINDowS提供了统一的、面向对象的、可扩充的通讯协议。这意味着描述一个对象的可执行代码(.dll或.exe文件的代码)可以被其它对象执行。即使两个对象使用不同语言来编写的,他们可以用COM标准来进行通信。№tlab中提供了一个非常有用的工具那就是c0M组件生成器(coMBuildercoM),使用它可以方便将Matlab中的.m函数编译为coM组件,然后供其它支持coM的编程语言调用,从而实现Matlab和其他编程语言的整合。coM组件生成器的操作界面简洁明了,使用非常简单方便。但实际上它在生成coM组件的时候需要调用Matlab编译器的功能,当然我们也可以直接通过带参数的编译命令生成coM组件。所以这种方式应该从属于Matlab编译器方式。武汉理工大学硕士学位论文5.5Matlab接口的具体实现本文是采用Matlab编译器方式来进行接口开发的。我们把需要调用的m文件函数打包成为一个动态链接库,然后提供给Vc++进行调用。下面,我们就来讨论一下这种方法的具体实现步骤。5.5.1VC调用Matlab前的设置在Matlabcomplier和Matlabc伽Builder编译生成共享库(dU文件)和COM组件的时候需要借助于外部的编译器。要实现它们的功能,还要分别进行Matlab和Vc¨6.O集成开发环境的设置。首先进行Matlab编译器和cOM组件生成器所使用外部编译器的设置。首先,在Matlab命令提示符下输入mbuild—setup然后回车,根据实际情况选择高级语言的编译器,这里选择的是MicrosoftVisualc/C++version6.O,然后对所有问题都输入肯定的Y然后回车,就完成了在^latlab中的设置。在VC巾+6.0下要进行如下设置140】:(1)设置Matlab中头文件(十.h)和动态链接库(十.d11)的路径。打开vc6.0集成开发环境中菜单Tools÷Options,选择Directories选项卡,在Showdirectoriesfor:下拉列表中选择Includefiles,然后在Directories栏中加directoriesfor:入:<Matlab7.04安装目录>\Extern\Include;再在show下拉列表中选择Libraryf订es,而后在Directories栏中加入(Matlab7.04安装目录>\Extern\Lib\win32\Microsoft\msvc60。(2)设置运行时动态链接库。打开菜单中Project专Settings,选择c/c++选项卡,在category栏中选择codegeneration,然后在出现的use1ibrary栏中选择DebugMultithreadDLL;run—time5.5.2动态链接库的生成根据前面所述在Matlab完成设置之后,就可以用Matl曲编译器来处理需要调用的函数M文件。被调用的函数M文件可以是Matlab的内置函数,也可以是由我们用Matlab语言来编写的函数。本文采用c++动态链接库的方式调用。假设我们要生成名称为MatlabFun的动态链接库,而我们要调用函数的文件名55武汉理工大学硕士学位论文为filel.m,file2.TIJ……。则应该在Matlab环境中,找到需要调用的函数M文件目录,在该目录下输入命令:mcc—WcD口lib:MatlabFun—Tlillk:libmel.mfile2.m……命令执行完毕后,就会在当前目录中生成c++头文件(MatlabFun.h)、引入库文件(MatlabFunlib)、组件技术文件(MatlabFun.ctf,英文为componentTechn0109yFi1e缩写为cTF)文件、动态链接库文件(MatlabFun.d11)、c++源文件(MatlabFun.cpp)、日志文件(mccExcludedFiles.109)、链接库函数输出文件(MatlabFun.exports)等。其中,前四个文件是进行动态链接库调用时所必需的。我们需要用到的m文件函数都被加密后封装在MatlabFun.ctf中,它其实是一个压缩文件。在程序运行时,首先要对这个压缩文件进行解压缩。5.5_3动态链接库的调用将前四个文件拷贝至Vc++的工程目录下,并用Project÷AddtoProject÷Files…将C++头文件加入到当前Vc++工程中。设置动态链接的引入库文件,打开菜单中Project专Settjngs,选择Link选项卡,在Category栏中选择Input,然后在出现的Object/1ibrarymodules栏中填入mclmcr.1ib和Matlab编译器生成的动态链接库的引入库文件(MatlabFun.1ib)。在当前工程的对话框的头文件中加入#include”MatlabFun.h”与#include’mclmcr.h”。接下来就可以调用动态链接库中的函数,可以分为以下几个步骤:(1)声明所需要调用函数的输入、输出变量:为了和c+十更好的交互,№tlab中专门定义了三种类mwStringmwExceptionclass、class和mwArrayC1ass。其中mWstringclass主要用于进行和字符串相关的操作,mwExceptionclass用于做在调用Matlab编译器产生的c++接口函数过程中所出现的异常处理。mwArrayClass用于传递Matlab编译器产生的C++接口函数的输入和输出参数,它提供了11种构造函数、36种类方法、4种类操作和7种静态方法,可以进行阵列的定义、初始化和操作。这里,要求将所有需要调用函数的输入、输出变量都定义或转变成111WArray类型。(2)进行接口程序的初始化:调用mclInitializeApplication函数,这个函数在mclmcr.h中已经定义武汉理工大学硕士学位论文过了,我们直接调用就可以。测试是否成功,该函数设置了一个全局的McR状态,并且构建McR实例;调用一次MatlabFunInitialize函数,为库创建一个McR实例。如果有多个需要调用的动态链接库,对于每个库都要调用一次自己的Initialize函数。以基于对话框的MFC应用程序工程为例,在对话框初始化时加入如下代码:BOOLCMauab7dllDlg::OnInitDialogO{CDiaJog::OIlImtDiaIogO;//’I‘ODo:Addex扫ramitlalizatiOnherepCallⅡ1emclIIlitializeApplicddonroutine.Makesurematt11eapplicationwasi11itializedproperIybycheckingtheretumstatuS.ThisinitiaJizationhastobedonebeforecallinganyMatlabAPI’sorli㈣胁吐ions.4,{MatIabCompilergeneratedsharedi《!mclInitializeApplication∞ULL,O))notinitializet11eAfkMessageBox(”CollIdexit(1);application.”);)产CalImelibrarymitializationmutineandmal【eSurethatnlelibrary啪si越tia№蜘pmperly.+,if(!MatlabFunInitialize()){A&MessageBox(”Couldexit(1);)notinitialize出elibrary.”);ret啪TRUE;//retumTRUE}(3)函数的调用:u11lessyousetmefocustoacon仃ol在Vc++下调用动态连接库中的函数非常简单,只需要一条命令。其形式为57武汉理工大学硕士学位论文filel(n,outputl,output2…inputl,input2…);其中filel为函数名称,n为输出参数的个数;outputl,output2…和inputl,input2…分别为输出和输入参数。(4)接口程序的注销:首先调用MatlabFunTerminate函数,用于注销与MatlabFun.dll相联系的McR资源。如果调用了多个动态链接库,则应该为每一个调用过的动态链接库都调用一次Terminate函数,用于注销与之相联系的McR资源;然后再调用mclTerminateApplication函数,释放与全局∽R状态相联系的资源。这些工作可以在注销对话框时来完成:VoidCMallab7dllDlg::OnDes廿0y(){CDialog::OnDestroy();pCallthelibrary协期inationro砸ne’,MatlabFunTe珊inate0;MclTerminateApplicationO;}5.5.4应用程序的发布对于调试完成的程序,可以在Vc++下编译链接以生成release版的应用程序。如果我们只调用了MatlabFun.dll,那么将程序发布到目标机器上的时候需要拷贝以下文件才能使程序正常运行:(1)release文件夹下的应用程序,即后缀为exe的文件;(2)Matlab编译器生成的动态链接库文件MatlabFun.dll;(3)与动态链接库对应的组件技术文件MatlabFun.ctf:(4)McRInstaller.exe,这个文件位于<Matlab704安装目录>\toolbox\comp订er\deploy\win32下,大小为102兆。在运行程序之前首先要安装组件运行环境MCR。运行MCRInsta儿er.exe会在当前目录解压缩生成setup.exe文件,然后运行setup.exe就可以进行安装MCR。在安装完McR之后,还要将<McR安装目录>\runtime\win32加入到系统的环境变量path中去。完成上述工作后就可以运行我们编制的程序了。在第~次运行程58武汉理工大学硕士学位论文序时,会首先对 ̄IatlabFun.ctf文件进行解压缩,其中的内容会被解压缩到一个子目录MatlabFun_mcr中。在这个文件夹下面有一个名称为MatlabFun的子文件夹,其中有我们要用到的相关Matlab函数。这些函数虽然后缀都是.m,但这些m文件也是经过加密的,客户不能阅读其内容,也不能在Vc+十或Matlab下运行这些文件。这就隐藏算法和保证开发者的拥有权【42】。5.6需要注意的问题在利用lIlatlab与VC的接口开发图像处理应用程序时,还需要注意以下几个方面的问题:(1)进行图像处理编程时所采用的坐标系和人们的平时习惯有所不同。人们习惯于把图像中的左下顶点作为坐标原点,向右和向上分别为横坐标轴和纵坐标轴方向。而在Matlab和Vc中,坐标原点为图像的左上顶点,向右和向下分别为横坐标轴和纵坐标轴方向。(2)横坐标、纵坐标和^latlab中矩阵的下标容易混淆。在Matlab中,非彩色图像是用二维矩阵来表示的,其下标依次标志了矩阵的行和列。用二维矩阵^硝f,力来表示图像舷力时,行号f与图像的纵坐标J,对应,而列号,则与图像的横坐标x相对应。(3)Matlab与Vc的编程习惯不同。vc对图像中像素排序时总是从O开始,而在l^atlab中是从l开始的。所以在Matlab与Vc有相关参数传递时需要做出相应的改动。(4)Matlab图像显示窗口的隐藏问题。如果VC中调用了Matlab的窗口显示函数,就会在Vc界面下弹出具有lIIatlab风格的图像显示窗口。可以在Matlab中更改图像显示窗口的属性为隐藏,然后把图像显示窗口拷贝到系统的剪贴板,再在VC中把剪贴板的内容显示到客户区。(5)VC调用自编的Matlab函数时,任何在Matlab中的错误提示都会导致Vc程序的致命错误而终止,这就给Vc下的程序调试造成了相当大的困难。所以在编写Matlab函数时,需要考虑各种可能出现的异常情况。59武汉理工大学硕士学位论文5.7小结本章首先简要介绍了Mallab软件环境,分析了用其进行图像处理的优势和缺点。着重研究了Matlab和VC++进行接口的方法,并给出了生成脱离Mauab环境应用程序的具体实现步骤。在车牌识别的算法研究阶段,我们在Matlab平台下编制了大量的m文件,这方便我们对算法进行仿真和结果分析。确定了采用的算法以后,我们把需要的m文件作了相应的修改,主要是定义了需要和Vc+十进行数据交换的输入和输出参数。按照本章中给出的方法对Matlab和Vc十+作了相应的设置,然后应用Matlab提供的编译器生成了名为MaⅡ曲Fun的动态链接库和调用该共享库的一些其它文件。最后,在vc++中生成基于单文档应用程序框架结构的应用程序,并对MatlabFun进行调用。从而使最终的应用程序摆脱了软件环境的,能够在任意的目标机器上运行。武汉理工大学硕士学位论文第6章总结和展望6.1总结本文简要介绍了车牌识别技术的研究现状和发展概况,详细探讨了利用数字图像处理进行车牌识别的各项核心技术。在继承前人研究成果的基础上,本文在车牌的自动定位上提出了新的思路和方法。鉴于蓝、黄色车牌出现的频度相当高,我们把蓝、黄色车牌的定位和黑、白车牌的定位分开来做。这样可以充分利用颜色信息对车牌区域像素进行过滤,免去了复杂的色彩聚类计算,提高了实时性,具有很好的定位效果。另外,本文还研究了Vc++和Matlab接口的开发方法。在基于MFC的框架程序中调用自己在Matlab下编写的m文件函数,通过Vc+十和Matlab接口实现了我们车牌识别算法的编程。最终构建了能够脱离Vc++和Matlab环境的应用程序,该程序能够对车牌区域准确定位,快速、准确的分割字符,并能够识别车牌上的英文字母和阿拉伯数字,有一定的实用性。6.2展望本文虽然在车牌识别原理与方法的探索上作了大量的工作,取得了一定的成果。但是由于时间的,本文的研究还存在许多不足和应该改进的地方,后续研究可以从以下几个方面进行完善:(1)本文简化了车牌字符识别部分的设计,不能识别车牌上的汉字字符,并且用同一个BP神经网络来识别数字和字母,识别率比较低,在字符识别上还存在较大的提升空间。今后,结合神经网络来研究车牌上汉字字符的识别,提高汉字的识别率将是进一步工作的重点。(2)本文仅考虑了采集图像中只有单个车牌的情况,没有考虑一幅图像中多个车牌的识别问题。而这在实际应用中是非常有用的,例如在对多个车道进行监控时,只需要安装~套摄像设备和计算机即可。多车牌图像相对于单车牌图像来说,车牌和字符的清晰度不高、各个车牌的大小不同等多方面原因使车牌61武汉理工大学硕士学位论文识别更加困难。如果能够深入地研究多车牌的识别问题,在同一个图像中准确、快速地识别出多个车牌,将极大地降低成本,提高工作效率。(3)现有识别算法的速度、准确度以及鲁捧性有待于进一步提高。随着国民经济的不断发展,国内的高速公路、城市道路、停车场建设越来越多,车辆在人们工作、生活中占据的地位越来越重要。现代交通飞速发展,车牌自动识别系统的应用范围日益拓宽,这些都给车牌自动识别系统提出了更高的要求。虽然由于受到多方面的,车牌识别技术还存在着一些不足,现阶段车牌自动识别离实用和推广还有一定差距。但是,现代交通监控和管理迫切要求车牌识别技术的迸一步完善,相信随着研究的深入,车牌识别技术定会走向成熟。62武汉理工大学硕士学位论文参考文献[1】尹令.车牌自动识别系统的研究及其在vc++中的实现:[硕士学位论文].湘潭:湘潭大学计算控制技术与控制理论应用,2003[2】刘效静,等.汽车牌照自动识别技术研究.南京航空航天大学学报t1998.30(5):573~576.【3】魏武,等.一种基于垂直字符边界特征的车牌定位方法.中国公路学报t2000.13(4):88~90【4】戴青云,余英林.一种基于小波与形态学的车牌图像分割方法.中国图形图像学报,2000.5(5):411~415【5】张引,潘云鹤.彩色汽车图像牌照定位新方法.中国图像图形学报,2001.6(4):374~377【6】SETcHELLCJ.Applicationsofc唧ut盯Visiontoroad—tr攒icmonitoI{n昏Ph.D.thesis.ofElectficalandEngland:unjV哪ity【7】Coetzeecet.;BothaofBTistol,Facul母ofEn西n嘟ing,Depa衄IentE1ec仃onicEngineering,1997.60~79.C.;WeberD.PCbaSednumberplaterecognnionsystem,Indu嘣a1Electronjcs,1998.Proceedin替.ISIE‘98.IEEEImem撕onalSyInposium,1998.2:605~610[8]付仲良,黄书强,陈眠,陈江平.货车图像车牌区快速定位及字符切割算法.计算机工程与设计,2003.24(1):77~79[9】陈黎,黄心汉.基于聚类分析的车牌字符切分方法.计算机工程与应用,2002.38(6):221~222[10】范春年.汽车车牌自动识别技术研究:[硕士学位论文].南京:南京气象学院系统分析与集成,2004[11】casey’R.GLec01inetE.Asun,eyofmetllodsa11dPanemAnaIysisandMacllineIntelligence,IEEEJuly1996.690~7061恤actiOnsmategiesinchafactersegmen诅tion.on,、,01ume:18Issuc:7,【12】吴大勇,魏平,等.一种车牌图像中的字符快速分割与识别方法.计算机工程与应用,2002.38:232~233f13]Par毗R.;Diclaudio,E.D.;Lucarellj,G;Orl锄di,GNe铆orl(sa11dImagecarPlateRecognitionbyNe涮Processing.ISCAS’98.Proceedingsofthe1998IEEEInlemationalSymposium,1998.v01.3:195~198[14]曹迪铭,宦国荣.神经网络在车辆牌照字符识别中的应用.微型电脑应用,2000.16(6):5~8武汉理工大学硕士学位论文f151胡小峰,赵辉.VisuaIC+“Matlab图像处理与识别案例精选.人民邮电出版社,2004.58~81【16]陶军.车牌识别技术研究与实现:[硕士学位论文].南京:南京理工大模式识别与智能系统,2004【17】袁宝民.汽车牌照自动识别技术研究与系统开发:[硕士学位论文].大连:大连理工大学机械设计及理论,2002【18】张玉蛟,史忠科.一种新的车牌识别预处理算法.西北工业大学学报,2002.20(1):83~86【19]张铁弓.基于DsP的微光视频图像实时处理研究:[硕士学位论文].武汉:武汉理工大学检测技术与自动化装置,2005【20】谢鸣.基于形态学的车牌自动识别系统的研究:[硕士学位论文].武汉:武汉理工大学通信与信息系统,2002【21】金玲玲,廖芹,汪刘.汽车牌照的提取方法.华南理工大学学报(自然科学版),2002.30(7):95~98【22】刘志勇,刘迎建.车牌识别中的图像提取及分割.中文信息学报,2000.4(14):29~34【23]范勇,蒋欣荣,游志胜等.汽车牌照快速定位算法.光电工程,200I.28(2):56~59f24]袁志伟,潘晓露,等车辆牌照定位的算法研究,昆明理工大学学报,2001.26(2):56~60[25J左奇,史忠科.一种基于数学形态学的实时车牌图像分割方法.中国图像图形学报,2003.8(3):281~285f26】冯桂,桂预风,林宗坚.灰度图像边缘检测中的形态学方法.遥感信息,2000.3:12~14f27]Rafblc.Gonzalez;RichardE.w幻ds著,阮秋琦,阮宇智译.数字图像处理.电子工业出版社,2005.421~45l,522~558f28]郑霞车牌照识别关键技术研究:[硕士学位论文].西安:西北大学计算机软件与理论,2004【29]熊军,高敦堂,等.基于字符纹理特征的快速定位算法.光电工程,2003.30(2):60~63.【30】王夏黎,周明全,耿国华.一种基于HsV颜色空间的车辆牌照提取方法.计算机工程,2004.30(17):133~】35[31]杨家辉,王建英.基于色彩分割与体态纹理分析的车牌定位方法。计算机与现代化,2004.11:22~26[32]Yzhong,K.Karu,A.K.Jain,Locatingtemincomplexcolorimages,PattemRec略lition,ofacar1995.28(10):1523~1526【33]EunRyungLee;PyeouilgKceKim;HangJoonKim,Automaticreco驴ition1icenseplateusingcoIorimageprocessing,ImageProcessing,1994.ProceedingS.IEEEICIP一94,Intem“onalConference,1994.2:301~30564武汉理工大学硕士学位论文【34】陈锻生,谢志鹏,刘征凯.复杂背景下彩色图像车牌提取与字符分割.小型微型计算机系统,2002.23(9):1144~1148.[35】周妮娜,王敏,等.车牌字符识别的预处理算法.计算机工程与应用.2003.39(15):220~22l[361周志华,曹存根.神经网络及其应用.清华大学出版社,2004.2~6【37】张宏林,蔡锐.数字图像模式识别技术及工程实践.人民邮电出版社,2003.24~29.422~442【38】飞思科技产品研发中心.Matlab6,5辅助神经网络分析与设计.电子工业出版社,2004.64~69,113~126【39】苏明金,刘宏,刘波.Ma:clab高级编程.电子工业出版社,2005.45~79[40】飞思科技产品研发中心.Mallab6.5应用程序接口编程.电子工业出版社,2003.167~186【41]董维国.Matlab7.X混合编程.机械工业出版社,2006.192~259【421陈永超.李汉强.Matlab7.0与Vc6,0的接口技术.电脑知识与技术,2006,1“29.130,ISSN1009.3044武汉理工大学硕士学位论文致谢值此论文结束之际,我首先要衷心感谢我的导师李汉强教授,本论文是在他的悉心指导才‘能得以顺利完成的。在三年的学习和生活中,他给予了我无微不至的关怀、爱护和帮助,为我们提供了良好的学习环境和广阔的实践空间,使得我能在一个良好的学术氛圃中不断地充实和提高自己。他严谨的治学态度、渊博的知识、高尚的人格将会永远对我产生重要的影响。在今后漫长的人生道路上,我将脚踏实地、努力进取,不辜负老师的殷切期望。感谢我的家人,他们对我的学业给予始终如一的鼓励和支持。最后,对评审论文的各位专家、学者表示衷心的感谢!陈永超2006年4月于武汉理工大学武汉理工大学硕士学位论文作者在攻读硕士学位期间发表的论文[1】陈永超,李汉强.基于模糊.PI复合控制的异步电机矢量控制系统仿真.中国水运,2005,2:31.33,lSSN1006.7973[2】陈永超,李汉强.Matlab7.O与vc6.O的接口技术.电脑知识与技术,2006,1:129—130,ISSN1009.3044【3]陈永超.基于颜色信息的车牌定位研究.计算机科学与实践,2006,7,IssN】729.584X67基于数字图像处理的车牌识别研究
作者:
学位授予单位:
陈永超
武汉理工大学
1.尹令 车牌自动识别系统的研究及其在VC++中的实现[学位论文]硕士 20032.刘效静 汽车牌照自动识别技术研究 1998(05)
3.魏武.黄心汉.MBEDE Jean-bosco.张起森.王敏 一种基于垂直字符边界特征的车牌定位方法[期刊论文]-中国公路学报 2000(4)
4.戴青云.余英林 一种基于小波与形态学的车牌图象分割方法[期刊论文]-中国图象图形学报 2000(5)5.张引.潘云鹤 彩色汽车图象牌照定位新方法[期刊论文]-中国图象图形学报A辑 2001(4)6.SETCHELL C J Applications of computer vision to road-traffic monitoring 1997
7.Coetzee Cet.Botha C.Weber D PC based number plate recognition system,Industrial Electronics 19988.付仲良.黄书强.陈珉.陈江平 货车图像车牌区快速定位及字符切割算法[期刊论文]-计算机工程与设计 2003(1)9.陈黎.黄心汉.王敏.李炜 基于聚类分析的车牌字符分割方法[期刊论文]-计算机工程与应用 2002(6)10.范春年 汽车车牌自动识别技术研究[学位论文]硕士 2004
11.Casey R G.Lecolinet E A survey of methods and strategies in character segmentation 1996(07)12.吴大勇.魏平.侯朝桢.刘永信 一种车牌图像中的字符快速分割与识别方法[期刊论文]-计算机工程与应用2002(3)
13.Parisi R.Di Claudio E D.Lucarelli G.Orlandi,G Car Plate Recognition by Neural Networks and ImageProcessing 1998
14.曹迪铭 神经网络在车辆牌照字符识别中的应用[期刊论文]-微型电脑应用 2000(6)15.胡小峰.赵辉 Visual C++/Matlab图像处理与识别案例精选 200416.陶军 车牌识别技术研究与实现[学位论文]硕士 2004
17.袁宝民 汽车牌照自动识别技术研究与系统开发[学位论文]硕士 2002
18.张玉姣.史忠科 一种新的车牌识别预处理算法[期刊论文]-西北工业大学学报 2002(1)19.张铁弓 基于DSP的微光视频图像实时处理研究[学位论文]硕士 200520.谢鸣 基于形态学的车牌自动识别系统的研究[学位论文]硕士 2002
21.金玲玲.廖芹.汪刘一 汽车牌照的提取方法[期刊论文]-华南理工大学学报(自然科学版) 2002(7)22.刘智勇.刘迎建 车牌识别(LPR)中的图像提取及分割[期刊论文]-中文信息学报 2000(4)
23.范勇.蒋欣荣.游志胜.张建州.郑文琛.冯子亮 汽车牌照快速定位算法[期刊论文]-光电工程 2001(2)24.袁志伟.潘晓露.陈艾.李一民 车辆牌照定位的算法研究[期刊论文]-昆明理工大学学报 2001(2)25.左奇.史忠科 一种基于数学形态学的实时车牌图象分割方法[期刊论文]-中国图象图形学报A辑 2003(3)26.冯桂.桂预风.林宗坚 灰度图像边缘检测中的形态学方法[期刊论文]-遥感信息 2000(3)27.Rafael C Gonzalez.Richard E Woods.阮秋琦.阮宇智 数字图像处理 200528.郑霞 车牌照识别关键技术研究[学位论文]硕士 2004
29.熊军.高敦堂.沈庆宏.都思丹 基于字符纹理特征的快速定位算法[期刊论文]-光电工程 2003(2)30.王夏黎.周明全.耿国华 一种基于HSV颜色空间的车辆牌照提取方法[期刊论文]-计算机工程 2004(17)31.杨家辉.王建英 基于色彩分割与体态纹理分析的车牌定位方法[期刊论文]-计算机与现代化 2004(11)
32.Y Zhong.K Karu.A K Jain Locating text in complex color images 1995(10)
33.Eun Ryung Lee.Pyeoung Kee Kim.Hang Joon Kim Automatic recognition of a car license plate usingcolor image processing 1994
34.陈锻生.谢志鹏.刘政凯 复杂背景下彩色图像车牌提取与字符分割技术[期刊论文]-小型微型计算机系统2002(9)
35.周妮娜.王敏.黄心汉.吕雪峰.万国红 车牌字符识别的预处理算法[期刊论文]-计算机工程与应用 2003(15)36.周志华.曹存根 神经网络及其应用 2004
37.张宏林.蔡锐 数字图像模式识别技术及工程实践 2003
38.飞思科技产品研发中心 Matlab 6.5辅助神经网络分析与设计 200439.苏明金.刘宏.刘波 Matlab高级编程 2005
40.飞思科技产品研发中心 Matlab 6.5应用程序接口编程 200341.董维国 Matlab7.X混合编程 2006
42.陈永超.李汉强 MATLAB7.0与VC6.0的接口技术[期刊论文]-电脑知识与技术(学术交流) 2006(1)
1.学位论文 孙宏琦 基于数字图像处理的车型车牌识别与超速检测系统研究 2007
随着经济的迅速发展,公路建设项目与日俱增,公路交通的安全运营问题显得越来越突出。如何使公路交通管理科学化、现代化、智能化已成为公路交通管理部门的首要问题。本文通过对公路收费监控系统中的车型与牌照识别系统、车辆超速的检测与报警系统和图像的存储、传输系统的深入研究,提出了图像处理与车型、车牌识别的算法与实现方案;分析了车型识别的基本方法,设计了利用红外探测器+压电传感器+车辆称重议的复合式车型识别系统;基于视频的图像检测技术,提出了车辆超速检测的报警算法;设计了公路车辆超速检测与报警系统的硬件和软件构成;在图像处理方面,本文提出了利用弱化图像大范围区域的DCT变换编码与强化图像中车牌部位的小波变换编码,并结合数字识别技术来产生一种具有很高压缩率的混合编码方法。从而解决了硬盘录像机的存储和数字视频的传输处理方面的很多问题。
本文研究的重点是车型、车牌识别系统的设计与实现,车辆超速的检测与报警和数字视频图像的压缩与编码。在车型与车牌识别方面,本文提出了利用模糊模板匹配法对车辆牌照区域进行定位,该方法可以依据牌照区域丰富的边沿特点进行区域搜索和定位。在车辆检测方面,本文利用了数字视频处理技术来实现车辆的超速检测与报警。在图像处理方面,本文分析了数字视频图像的基本处理方法,建立了数字视频特殊区域图像处理的模型与方案;阐明了数字视频图像的基本结构、压缩编码的方法和特殊区域图像的处理方法;提出了在数字视频图像中用于车牌识别的图像处理方法。
2.学位论文 陈扬 基于数字图像处理的车牌识别关键技术研究 2009
随着我国经济的发展,高速公路、城市道路、停车场建设越来越多,对交通控制、安全管理的要求日益提高。智能交通系统已成为当前交通管理发展的主要方向。汽车牌照自动识别技术(LPR)是智能交通系统中的一个重要环节,它不但可以广泛地应用于交通流量检测,而且还可以应用于交通控制与诱导,机场、港口、小区的车辆管理,不停车自动收费,闯红灯等违章车辆监控以及车辆安全防盗等领域。因此,具有广阔的应用前景。本文对图像处理的汽车牌识别系统进行了研究。车牌识别一般可以分为车牌预处理、车牌的定位、车牌的字符分割和字符识别四个主要部分。本文在分析近年来一些典型的车牌识别系统的算法基础上,最终确定了一套有效的车牌识别算法。本文研究的主要内容和创新点包括:
⑴在车牌预处理阶段,本文首先对车牌图像进行图像灰度化和均衡化的处理,然后采用了一种新的去除噪声的方法——基于偏微分方程去除噪声。该方法步骤虽然比较复杂,但是可以很好的解决图像预处理中存在的平滑和保边界细节之间的矛盾问题。
⑵在车牌图像定位和提取方面,本文设计了2种车牌定位方法。基于颜色特征的车牌定位是在传统的投影分析方法的基础上结合HSI颜色空间中的H信息,将此作为车牌的特征,从而截取到车牌。基于灰度跳变特征的车牌定位则是利用车牌中字符的灰度变化来确定车牌位置。
⑶在车牌字符分割过程中,由于车牌字符分割中存在边框、铆钉和车牌旋转等问题,而这些问题又容易造成分割不准确和分割错误等后果。因此,针对这些问题,本文采用了一种新的字符分割方法——数字形态学中的连通区域法进行字符分割,并结合现有方法提出一个完整的、行之有效的字符分割方案。
⑷在车牌字符识别方面,本文首先对切割下来的字符进行特征提取,然后再利用所提取的特征值对神经网络进行训练,最后利用这个训练结果对其它车牌上的字符进行识别。
3.学位论文 周亮 基于神经网络的车牌识别算法研究 2007
随着城市交通管理现代化水平的提高,建立在车辆牌照识别基础上的交通信号白适应控制系统、智能交通监控系统、GPS车辆管理及导航系统、停车场自动收费系统、智能化交通管理系统应用而生。由于汽车牌照是机动车辆管理的主要标志符号之一,因此对车辆牌照识别系统的研究就尤为重要,该研究的核心是提高车牌识别率,这就需要识别算法能够对环境光照条件,拍摄位置和车辆行驶速度等因素的影响有较大的鲁棒性,并能够满足实时性的要求。
本文设计的主要研究内容包括:运用仿真软件对后台图像进行高速,准确的处理。主要工作是对牌照的定位、分割和牌照的字符识别算法方面进行了深入地研究。在牌照的定位之前,本文首先运用不同于当下传统的方法,而是结合当前比较热门的神经网络来对图像进行预处理,得到了比较突出的牌照信息。然后结合牌照自身的一些固有特征,用形态学的方法进行了车牌区域的准确定位;对定位得到的车牌,再次结合牌照内部细节特征,对车牌进行投影,从而得到了车牌较为完整的分割;最后在车牌字符识别阶段,以现今比较流行的神经网络为理论基础,有效的设计出一个改进的神经网络识别算法。仿真结果表明采用本文提出的从车牌定位、分割到最后字符识别的算法能够有效地提高车牌识别率。
本文研究内容的创新性体现在以下三个方面:(1)车牌定位阶段,采用一个改进的自适应PCNN神经网络对图像进行预处理可以得到一个细节丰富,边缘完整的二值图像,随后基于牌照固有特征,结合一种新的形态学方法,可以得到多个车牌候选区域;(2)车牌字符分割阶段,为了满足算法实时性的要求,对畸变车牌进行预处理时,采用字符的行特征来描述本文的倾斜校正算法,之后,基于改进的投影特征图对字符图像分割;(3)字符识别阶段,为了提高算法的识别率,采用改进的BP神经网络。
仿真结果表明,通过对算法进行一系列的创新和改进,可以使识别算法的速度加快,识别率得到提高,效果比较理想。
4.期刊论文 刘倩 智能交通系统中的数字图像处理技术 -科技创新导报2009,\"\"(9)
目前在智能交通系统(ITS)领域中,数字图像处理技术扮演着极其重要的角色.本文主要对智能交通系统(ITS)研究的内容,数字图像处理技术的发展,主要内容及其在车牌识别中的具体应用等做了详细的分析、研究及阐述.
5.学位论文 屠良平 关于汽车牌照的实时识别技术研究 2005
车牌识别技术涉及数字图像处理,计算机视觉,模式识别,人工智能等多个领域,其关键技术包括车牌定位、字符分割和字符识别等,本文致力于车牌识别中若干关键技术的研究.本文基于图像处理的相关理论,结合计算机视觉和模式识别技术对车牌自动识别技术进行了深入研究和分析,总结出图像二值化、最小偏差滤波等图像预处理新方法,很好的消除噪声,强化了车牌区的纹理特征;通过对车牌图像的自身特征分析提出了基于投影法和形态学梯度以及基于形态学Top-Hat变换的车牌定位新方法,这两种方法都能较准确的分割车牌;在此基础上,利用一种超线性BP神经网络识别车牌英文字母和数字.
6.学位论文 史莉琴 车牌识别系统研究 2006
随着国民经济的迅速发展,我国的汽车数量迅速增加。虽然我国在基础设施建设上加快了步伐,高级公路、停车场越来越多,但配套的道路、车辆管理系统却显得相对滞后,仍旧停留在以人工管理为主的水平上。科学、高效的利用好现有交通基础资源成为进一步挖掘我国城市交通能力的有效途径。交通信号自动控制系统、GPS车辆定位及导航系统、智能交通监控系统、智能小区管理系统等智能交通系统
(IntelligentTransportationssystem(ITS))在交通管理中日益发挥重要作用。由于牌照是确定汽车的有效手段,因此,车辆牌照识别
(LicensePlateRecognition(LPR))系统在智能交通管理中发挥着基础性的作用。近年来,电子器件性能和制造工艺的提高以及数字图像处理、模式识别理论的成熟为在道路交通管理中引入计算机提供了条件。
针对当前道路交通管理的现状,研究了汽车牌照自动识别的问题,我设计了一个汽车牌照识别系统,初步实现系统中的关键模块。传统上该问题涉及两个方面:图像采集模块和图像处理模块。图像采集模块主要由硬件构成,寻觅采集图像的时候,实时拍照并将图像传送到图像处理模块。图像处理模块主要由软件实现,为了快速高效的开发出模块原型,该模块主要由Matlab实现。
该设计的主要工作集中在图像处理模块。该模块完成牌照定位和牌照识别的任务。在牌照定位中,我首先对图像进行了预处理,使得牌照信息突出;然后根据车牌区域频率变化的特点,用扫描线方法得出车牌区域的水平定位;再对分割出来的车牌图像所在的水平区域进行垂直投影,以该投影图为基础结合由经验所得到的车牌区域灰度变化的频率信息,再次借助水平扫描线来进行牌照的垂直定位,从而最终完成牌照的完整定位与分割;特征提取部分,我采用了13特征方法进行非汉字字符的有效信息提取;随后的识别部分,则采取了基于人工神经网络(ANN)的技术进行实现,通过有效设计训练网络,良好地建造了非汉字字符的识别系统。
本文划分为八个章节。第一章作为绪论展开课题背景,简要介绍相关的图像处理知识与理论;第二章列出了本系统的模块和主要流程图,给读者一大概的纲要;第三章介绍图象处理模块中的预处理技术;第四章介绍系统中牌照定位模块;第五章为字符分割技术与归一化技术的介绍;第六章介绍特征提取相关技术;第七章针对图像处理中的非汉字字符识别技术进行介绍。第八章为实验数据分析并对系统性能作出了评价,找出不足,提出初步的解决思路。最后是结束语总结了本人的工作。
系统中使用的知识主要涉及到数字图像处理、模式识别、人工智能等领域。
7.学位论文 王大印 基于数字图像处理的车牌识别系统 2003
\"机动车牌照识别系统\"(VLPRS-Vehicle License Plate Recognition System)是北京市交通管理局主持开发的重大技术改造项目,其目的是实现北京市交通的智能管理.该文解决了实现该系统的关键技术问题,为该系统的实现铺平了道路.该文应用线窗口、差分算于、min算子、模糊数学、数学形态学等技术手段完成了车牌的精确定位,应用水平投影、局部最小值等方法完成了车牌字符的分割,应用神经网络感知机等技术解决了字符识别的问题,开发出实用的算法.在实际的车牌识别中,该文所提出的算法具有速度快,识别能力强的优点.该文所提出的粗定位算法大大减少了运算量,从根本上解决了这个问题.针对车牌字符图像的变形、非均匀光照、强噪声干扰等条件,该文提出了一种基于神经网络感知机的字符识别方法,该方法具有网络结构简单,识别速度快,抗干扰能力强,识别率高等诸多优点.
8.学位论文 杨京忠 基于数字图像处理技术的车牌识别算法研究 2006
工业开始以来,交通运输业的飞速发展为人们的生活带来了极大的便利,与此同时,各种交通运输工具特别是汽车数量的剧增也给社会和环境带来了日趋严重的巨大压力,为缓解这些压力,智能交通系统(ITS)应运而生.
智能交通系统(ITS-Intelligent Transportation System)通过对道路交通流信息进行实时监测和了解,依此及时地做出各种交通诱导控制和管理,使相关的交通设施得到充分合理的运用,而车牌识别系统(LPK)则是其关键,车牌识别系统具有对车辆进行自动化监视,验证,登记与报警等强大功能,故而可应用于高速公路管理系统,停车场收费管理系统,小区车辆管理系统与电子系统等领域当中. 本文完成了民用车牌识别系统的算法研究和系统设计工作,主要工作由以下几个部分组成:
(1)全天候车牌定位算法,首先对原始的车辆图像进行预处理,增强图像对比度,然后利用处理后图像的差分图像进行数学空间降维处理,接下来把降维后的数据进行高斯变换与小波变换定位出车牌在车辆中的水平位置,把水平定位出来的车牌图像再次进行数学空间降维和高斯变换,最后进行形态学膨胀与腐蚀处理,从而实现车牌的精确定位;
(2)字符识别算法,采用基于噪声模型训练的二级识别算法,第一级采用基于字符外形特征的分类方法进行粗分类,第二级采用统计特征与噪声模板匹配法进行细分类,与此同时结合中国民用车牌的特征,采用两个基于噪声模型的并行三级神经网络对字符外形特征进行识别实现粗分类,接下来采用统计特征与模板匹配法进行细分类,最终实现字符的准确识别;
(3)车牌识别系统软件平台,搭建了一个基于c/c++语言的算法演示平台,该平台集成了本文算法研究的结果,以及一些通用的数学算法,该平台是完全开放的,可以自由在其基础上增加新的算法并可方便的观察算法结果.
本文提到的算法均已在软件平台上正确实现,以从各种不同环境下采集的具有代表性的531张车辆图像作为算法测试数据源进行测试,车牌定位准确率达95﹪,字符识别率达94.6﹪.
9.学位论文 高勇 车牌识别系统中的字符分割与识别 2007
随着国民经济的迅速发展,我国的汽车数量迅速增加。虽然我国在基础设施建设上加快了步伐,高级公路、停车场越来越多,但配套的道路、车辆管理系统却显得相对滞后,仍停留在以人工管理为主的水平上。科学、高效的利用好现有交通基础资源成为进一步挖掘我国城市交通能力的有效途径。车牌识别技术是计算机视觉与模式识别技术在智能交通领域应用的重要研究课题之一。其目的就是无需为车辆加装其它特殊装置,在不改变车辆的运动状态的情况下实现对车牌的自动识别,从而给交通系统的自动管理提供了极大的方便。因此智能车牌识别系统是推进交通管理智能化的关键技术之一。
本文对车牌识别系统的各阶段的任务及遇到的问题进行了比较详细的说明和分析研究,然后用神经网络中的BP算法,基本完成了车牌识别系统的设计与实现。
本论文所做的主要工作如下:
1.论文首先研究智能车牌识别系统中所用到的一些理论知识,介绍了智能车牌识别系统中的车牌定位,字符分割,字符识别的一些常用的算法。最后给出了我们采用的字符分割和字符识别的详细方法。
2.在车牌的定位阶段,我们通过对水平纹理投影平滑后的峰谷分析,对粗定位的上下边界进行了微调;在字符分割阶段中,我们通过对目标象素的竖直投影平滑后的峰谷分析,并且利用车牌字符的宽、高等先验信息改善了字符分割的效果:这种方法相对于传统的方法,既可以减少工作量,又可以避免对汉字的错误切分。
3.在字符识别阶段,本文根据车牌字符的特殊性,采用一种特征提取与BP神经网络学习算法相结合的分类识别技术,选取字符的粗网格特征作为字符的识别特征,以改进后的归一化字符原始特征直接输入到BP神经网络分类器中进行车牌字符识别研究,有效地提高了字符、数字混合情况下的识别率。
本文的车牌识别系统是模式识别领域的一个典型应用。它的基本思路和具体设计可扩展适用于其他行业的应用中,具有很好的应用前景。
10.期刊论文 陆艺.杨春生.张涛.闫晓茹 图像处理技术在机动车检测行业中的应用 -中国测试技术2003,29(6)
数字图像处理是近年来快速发展的一门学科,本文介绍了图像处理在汽车检测行业中的应用.重点介绍了在机动车前照灯检测仪、汽车车牌识别系统以及汽车车身曲面形状X测量中的应用,这些应用充分体现了图像处理技术精度高、系统可靠性好、快速、灵活等优点.
本文链接:http://d.g.wanfangdata.com.cn/Thesis_Y8311.aspx
授权使用:北京理工大学(北京理工大学),授权号:8e035047-bba1-44be-bdaf-9dbf011e02b7
下载时间:2010年7月26日
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- 517ttc.cn 版权所有 赣ICP备2024042791号-8
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务