第一篇:车牌识别图像处理过程总结
图像处理在车牌图像预处理中的应用
灰度化
车牌图像灰度化 直方图均衡化 灰度拉伸 二值化
全局阈值法和局部阈值法 适用于车牌的二值化方法 边缘检测 图像梯度
几种常见的边缘检测算子 适用于车牌的边缘检测算子
一、车牌识别系统结构
车牌识别系统通常由数据采集(车牌图像摄取),车牌提取,车牌识别几个主要部分
组成,其系统结构如图 1.1 所示:
车牌自动识别系统中:
1.图像摄取主要由硬件部分完成,它提取汽车的前景图像,将摄像头的视频信号转换为数字图像信号送给计算机处理。
2.车牌图像预处理。由于拍摄的自然环境及光照条件的影响,车牌图像中存在许多干扰,对车牌的定位带来不便,为了更好的提取车牌,需要对车牌图像进行预处理以保证车牌定位的质量。
3.VLP 检测。即图 1.1 中虚线环绕的部分,这一部分是系统的核心,它的实现影响着整个系统的性能,主要利用模式识别、数字图像处理、信息论等知识对车牌图像中的车牌进行定位及提取操作。
4.字符分割及识别。当车牌被成功提取后,需要分割其中的字符,并利用先验知识对其进行识别,以得到最终结果。
二、图像处理具体过程
图像处理是人工智能在计算机图形学中的一个重要分支,是车牌识别系统的理论依据。在自然条件下摄取的车牌,除了包含大量噪声外,还具有多样性。为了使系统能够更好的分离车牌,必须对原始图像进行预处理。本章主要讨论车牌图像预处理的一些常用方法,包括图像的灰度二值化、噪声处理、边缘提取等。当摄像机从外界摄入视频图像时,首先把它转换为静态图片,再送入计算机进行处理。由于拍摄环境的多变性,车牌图像中存在噪声和干扰,这些给车牌提取带来困难。系统首先将输入的彩色图像灰度化,并且进行亮度平均,使图像具有较好的对比度;对图像进行边缘提取操作前,往往先要进行噪声抑制操作,以提高边缘提取的质量;二值化则多用于已提取车牌的处理上。车牌图像预处理的难点在于:
1.车牌图像质量不佳,灰度化后会弱化图像中的车牌信息,因而好的灰度化处理非常必要;
2.由于光照的原因,车牌很可能出现过分灰暗或明亮的情况,这种条件下的二值化处理应该分情况讨论,对应特殊的分割阈值;
3.图像中的复杂背景具有丰富的边缘信息,不但会增加系统识别的难度,也会造成系统的误判,怎样去除这些不必要的背景十分关键。实际操作中,因为车牌处于图像的中部偏下位置,所以通常取图像的下半部分进行处理或优先考虑图像中靠下方的位置。
4.车牌中的字符很容易在预处理中发生变形或丢失信息的情况,要注意保持车牌的字符信息。
2.1 灰度化
在计算机中,一幅图像由若干个像素组成,每个像素都带有图像的相关信息(如背景、目标、噪声等),而图像处理技术则通过对这些像素进行处理而得到我们所需要的关键信息。
2.1.1 车牌图像灰度化
一般情况下,输入计算机的视频截取图像为 RGB 格式,即彩色图片。由于这种图像包含大量的颜色信息,它的每个像素都具有三个不同的颜色分量 R(Red)、G(Green)、B(Blue),这样的图片占据的存储空间很大,而且在对其进行处理时也会耗用较多的系统资源,导致系统的执行效率不高。与之相比,灰度图像只含有亮度信息,从而大大减少了系统的工作时间,满足汽车牌照识别系统的实时性要求。因此,在对图像进行其它预处理之前,一般先将彩色图像转换成灰度图像。
最基本的灰度化方法就是直接使用 R、G、B 三分量中的最大值或平均值来代替各个分量。灰度化以后,相同颜色的像素具有相同的亮度,这就形成了以亮度为层次的灰度图片。灰度值大的像素比较亮,反之较暗。通常把灰度值分为 256 等份,0 度表示最暗的级别,即黑色;255 表示最亮的级别,即白色。图像的灰度化转换还有其它不同的算法,比较常见的是给像素的 R、G、B 分量各自增加一个特定的加权系数,相乘后求和,其计算结果作为灰度值,转换公式如下:
I = 0.229 R+0.587 G+0.114 B 式中 I 表示像素的灰度值。
加权系数的取值建立在人眼视觉模型的基础上,对于人眼比较敏感的绿色分量,赋予较大的系数,而对于人眼比较迟钝的蓝色分量则取较小的系数。这样得到的灰度图像在视觉上比较接近人的主观感觉。
2.1.2 直方图均衡化
由于灰度图像建立在彩色图像的基础上,所以在不同的光照条件下,对同一辆汽车所拍摄的图片有着很大的差异。就车牌图像而言,灰度的动态取值范围越广(即图像的对比度越大)越有利于图像分析。
图 2.1-2.4 分别给出了白天和傍晚时相同汽车的彩色车牌图像及灰度图像。从图中我们可以看出,由于白天的光线较好,使得汽车的灰度图像存在较大的对比度,肉眼上更容易识别。而在实际拍摄条件下,影响图片亮度的因素除了天气外,汽车自身的反光现象也是一个原因。
当车牌图像在反光或傍晚拍摄时,图像中的白色或黑色区域较大,使得图像的整体像素灰度值偏向于两个极值。在这种情况下,车牌区域的对比度就被弱化了。因此,我们要使图像的灰度值分布平均化,这就是直方图均衡化的作用。图像的直方图是一个概率函数图像,它表示了图像中各种像素值的出现概率,而直方图均衡化则是通过某种变换,得到一幅具有均匀灰度密度分布的新图像。其结果是扩展了图像的灰度取值范围,从而达到增强图像对比的效果。设原始灰度图像的像素数目为 N,那么,直方图均衡化的具体计算步骤如下:
直方图均衡化的结果如图 2.5-2.8 所示,可以看出经过均衡化处理后图像的对比度得到了增强,直方图中的灰度函数分布基本平均。
2.1.3 灰度拉伸
由于直方图均衡化是对图像中已经存在的像素值进行平均,那么图像中出现较多的像素级就在均衡过程中起到了主要贡献作用。相对灰度级出现较少,图像灰度处于极端的情况而言,我们需要图像的像素值在各个灰度级都有均匀分布(包括原图中不曾出现的灰度级),灰度拉伸可以达到这个效果,从而起到增强图像对比的作用。
如果造成图像的对比度不足,主要原因在于拍摄目标的远近不同,使得图像中央区域和边缘区域的灰度失衡,或是由于摄像头在扫描时各点的灵敏度有较大差异而导致图像失真,或是由于曝光不足(或过度)致使图像的灰度值大小被限制在一个很窄的范围内。这时的图像模糊不清,似乎没有灰度层次。
假设原图像 f(x,y)中,大部分像素的灰度级在一个较窄的范围[a, b] 内,又或者我们只对灰度级在某个范围内的像素感兴趣,经过线性灰度变换后,可以将这一灰度范围[a, b] 扩展到新图像 g(x,y)中一个比较大的灰度范围[c, d]。并且有。f(x,y)和g(x,y)的变换公式如下:
从灰度直方图分析,由于新图像的灰度范围变大,所以对数字图像来说,尽管变换前后像素的个数不变,但不同像素的灰度差变大,增强了图像的对比度。同时,这种两端截取式的变换使小于灰度级a和大于等于灰度级b 的像素分别直接变为c和d,将会造成部分信息的丢失。
因此,可以采用分段线性灰度变换以减少信息的丢失,将图像灰度分成两个以上的区间分别进行线性变换。这种方法的优点在于可以根据需要来拉伸感兴趣的灰度范围,相对抑制不感兴趣的范围。分成三段进行灰度变换的公式如下:
公式对灰度范围[a,b]进行了灰度扩展,而对灰度范围[0,a]和[b,m]进行了压缩。通过调整折线拐点的位置和分段直线的斜率,可以对任意灰度范围进行扩展或压缩。利用某些非线性函数,例如对数函数、指数函数等作为变换函数,可实现图像的非线性变换。对数变化一般为:
其中a、b 和c为可调参数,用于调整曲线的位置和形状,它使图像的低灰度区得以扩展,而高灰度区得以压缩。与之对应的指数变换一般为:
其中a、b 和c同样为可调参数,用于调整曲线属性。它的效果与对数变换的效果相反:扩展了图像的高灰度区,压缩的图像的低灰度区。利用对数函数进行灰度变换在实际应用中有重要意义,它能扩展低灰度区,符合人们在视觉上的主观感觉。
如图 2.9-2.12 所示,可以看出经过灰度拉伸处理后的图像的灰度分布区域由(0,200)变换到另一个区域(128,255),图像的亮度明显增大。
2.2 二值化
一幅灰度图像的亮度信息由 256 个灰度级组成,它能够呈现较为丰富的明暗度。当我们识别车牌时,需要把目标从背景中彻底分量出来。为了尽可能少地减少背景像素干扰,常常直接把图像分为目标和背景两部分。这样我们只能用两个灰度级:0 和 1。通常目标像素值为 1,背景像素值为 0。要得到这种黑白分明的图像,我们需要对图像进行二值化。
设图像二值化前的像素值为 f(x,y),其中(x ,y)表示图像的空间点坐标,变化后的像素值 g(x,y)为:
其中c为我们所说的阈值。
目前,在车牌识别系统中常用的灰度二值化算法主要包括全局阈值法和局部阈值法等。并且出现了一些针对车牌图像的特殊二值化算法。由于上文介绍了图像的灰度化变换,所以下面将逐一介绍基于灰度的三种阈值法算法。
2.2.1 全局阈值法和局部阈值法
顾名思义,全局阈值法就是从图像的整体角度出发,计算图像的单一阈值的方法,主要有迭代法和 Otsu 法等,这里我们介绍 Otsu 法。
Otsu 法是常用的一种阈值选取方法,这是一种类间方差阈值法,它是在最小二乘函数的基础上推导出来的。基本思想是:取一个阈值k,将图像中的像素按灰度值分为大于等于k 和小于k 两类,也就是我们所说的目标和背景两类。求出两类像素的方差
和总体方差
。然后给定三个分离指标:
任取其中一个,这里我们取第一个分离指标Q1,找出使其值最小的 k 即为最佳阈值。其意义是使不同种类的方差最大,相同种类的方差最小。用 P(i)示图像各灰度级的频数,则阈值的计算步骤为:
各参数的计算公式分别如下:
4.令 k = k+1,重复计算上一步,直到 k 取到最大灰度级 maxk ;
5.找出令分离指标
Q 1最小的 k 值,该值为最佳阈值。
局部阈值法则是针对灰度图像中的每一个像素点进行计算的。它将图像分块,为每一块选取一个阈值进行分割,如果某块内同时有目标和背景,则直方图呈明显双峰状态,可定出局部阈值;如果一块内只有目标或背景,那么直方图不呈双峰,但可根据邻近有双峰区域的阈值通过内插而得到这一区域的阈值。局部阈值法的难点之一是判断直方图是否存在双峰。一种较为直观的方法是:如果某一块只有目标或背景,那么它的差分值就比较小。算法设计如下:
由于全局阈值法是从图像的整体角度出发计算单一阈值,因而计算时间较短,适用于目标与背景存在较大对比度的图像;而局部阈值法则是逐个计算图像中的每个像素灰度级,保存了图像的细节信息。相比全局阈值法来说,它的计算时间较长,计算量较大,但适用于背景信息丰富的图像。
2.2.2 适用于车牌的二值化方法
由于车牌图像的特殊性,它包含的信息一般要少于普通的图像,综合考虑全局阈值法和局部阈值法的优缺点,可以得到一种比较适合车牌图像的二值化方法。实际处理中,由于光照不匀、灰度级动态范围太窄和车辆牌照污损等原因影响,致使车牌的质量退化,常存在严重的伪影和模糊的字符边缘,因而极大影响了车牌图像的二值化效果。而将牌照图像的空间分布特征[21]与最大类间方差的统计特征相结合后,不仅能消除不均匀光照引起的伪影,还能减少笔画出现断裂现象的几率,二值化效果较好。
假定牌照图像中字符像素所占比例为 R1,背景像素所占比例为R2,则 0 2.3 边缘检测 数字图像的边缘检测是图像分割、目标识别、区域形状提取等图像分析领域十分重要的基础。边缘是图像的重要特征,图像理解和分析的第一步就是边缘检测。在车牌识系统中,车牌区域存在大量的边缘信息,这是车牌区域不同于其它区域的一个重要特征。因此,边缘检测对于车牌识别非常重要。所谓边缘,就是指其周围像素值的变化呈现阶梯状或屋顶状的像素的集合,它存在于目标与背景、目标与目标、区域与区域、基元与基元之间。边缘反应了空间频率的变化,是图像分割的重要特征,也是纹理信息形状特征的基础。所以,我们要把车牌从图像中分割出来,就要找到车牌区域与其它区域之间的边缘,从而进行图像分割。由于边缘处于两个不同区域之间,所以边缘具有方向和幅度两个特征。沿边缘走向,像素值的变化平缓;而垂直于边缘走向,像素值的变化明显。它的存在相当于函数中的转折点或拐点,因而边缘上像素值的一阶导数较大,二阶导数为零。2.3.1 图像梯度 在介绍边缘提取方法之前,先引入图像梯度的概念。对于图像 f(x,y),它在点(x ,y)处的梯度定义为一个矢量: 综上所述,这一章主要介绍了数字图像处理在车牌预处理方面的一些应用,包括输入图像的灰度化、二值化、噪声处理和边缘提取等。图像预处理是车牌识别系统中非常重要的一个环节,它的好坏直接影响了二值化的质量,对整个系统的精度也有着深远的影响。 近年来,随着机动车辆的不断增加,加油站的数量也在不断增多。目前,各大石油公司旗下的加油站由于自营店和加盟店众多,管理分散,一些早期投入的不能扩容和联网的监控系统已经面临着新的挑战:除了对加油站进出车辆情况、收费情况、设备运行情况以及加油站工作情况要进行实时监视和记录外;鉴于许多城市的加油站位于市内,安全隐患令人忧心,因而相关部门在监控系统与其他系统(如消防报警系统)的联动方面做出的要求更为严格。 利用先进的监控技术,例如高清、智能、车牌识别等技术,构建一套全面防范、重点加强、资源共享的安防系统,有效加强对加油站人员的管理,直观及时的反映重要地点的现场情况,增强安全保障措施,已经成为现阶段加油站建立现代化管理系统的重要选择。 需求分析 根据当前加油站的运行管理和安防报警的要求,加油站联网监控系统需满足以下需求: ·管理人员可以实时了解加油站的工作情况; ·管理人员可以实时了解加油站的交易情况; ·管理人员可以实时监视加油站的各个重点部位,比如油库区和金库等; ·系统需具备报警接口,加油站报警时可以实时传递报警信号到总监控中心,并可以设置多种报警联动机制,实现视频监控与报警的结合; ·监控平台软件需支持语音对讲和广播,能够扩展实时指挥、培训和视频会议等功能。 设计思想 对加油站的监控系统实现半公开管理。一方面,加油站管理人员可以通过前端视频了解加油站进出车辆情况、收费情况、设备运行情况以及加油站工作情况,实现对加油站的远程管理。另一方面,当有警情发生时,相关人员可以即时查看到现场实时视频。 对于重点区域如油库等部位,采用智能分析技术,通过智能跟踪的方式,实现油库区的安全防范监控。 对于加油站进出口管理,可以采取两套解决方案: 1、使用强光抑制型摄像机,保证晚上也能够看清车牌信息; 2、使用高清摄像机,配合LED频闪灯,增加车牌识别功能; 3、该功能可以辅助加油站对加油车辆进行统计分析,方便加油站针对老客户搞一些回馈活动。 报警与监控系统建设以加油站为基本实战单位,在各上级监管单位建立二级报警与监控分中心,在省公司设立总监控中心,实现对前端所有设备和系统的统一管理和控制。各级领导可以通过网络分控对系统进行管理。 监控中心是一个监控系统的核心管理部分,是利用计算机网络多媒体技术开发的整合式集中智能监控管理控制应用平台(包括监控系统管理模块、WEB服务模块、报警模块、数字视频转发模块等),汇接了全省各加油站图像监控系统,将所需的视频、音频、数据以数字形式通过网络进行传输和共享;并根据授权进行远程调阅、查询,由开放的接口实现互联、互通、互控及其它多种应用,为全省各级领导决策、指挥调度、调查取证等,提供及时、可靠的监控图像信息。系统设计 运用先进的计算机技术、网络技术、数字压缩技术、网络传输与安全技术,以加油站为监控网点,加强监控点、网设、监控系统管理应用平台等系统建设以及相关应用机制建设,基本建成覆盖面广、系统完整、功能强大的网络报警和视频监控系统。 系统整体架构 系统整体上划分为三个部分:包括省级监控中心,地市级分控中心和加油站部分。在前端每个加油站采用硬盘录像机作为系统接入的主要设备;在加油站省级管理单位设置集中监控、管理平台;在其他管理单位设分控中心或客户端。 加油站的建设 加油站是各种信息的采集点,是整个系统是否具备实用性的关键所在,只有采集到有效的信息,才能使整个系统发挥作用。根据加油站的防范需求,每个加油站需要建设多个视频采集点,对加油站进出口、加油站加油工作区、加油站便利店、加油站售卡处、加油站财务处(保险柜)、加油站的油库区等部位进行覆盖。 针对上述防范区域,系统将可采用不同的前端设备以满足不同的防范需求:加油站进出口:需要看清进出车辆的车牌号码和进出人员的面部特征;加油站加油工作区:需要看到加油区的整体工作状况;加油站便利店、售卡出、财务处(保险柜):需要看清交易人员的面部特征、交易情况等;加油站的油库区:需要对进入油库区的人和车进行智能跟踪,详细记录油库区内人和车的运行轨迹和各种状态。 加油站点位设计 进出口监控:加油站进出口是外部人员和车辆进出加油站的唯一通道,是加油站防范重点部位。点位设计应该满足人员面部特征和车辆牌照信息能清晰呈现的需求。由于加油站均为24小时运行,需要考虑晚上的光线环境,尤其是进出口处车头灯对摄像机的影响较为严重。 鉴于以上两点,加油站进出口采用日夜型强光抑制彩色摄像机,摄像机具备分辨率高(彩色540TVL、黑白600TVL)、低照度(彩色0.003Lux、黑白0.0003Lux)及强光抑制等特点,能够满足进出口防范需求。 针对加油站出入口,系统还可以采用高清摄像机,配合LED频闪灯,实现车辆牌照识别功能。采用的高清摄像机内置视频触发模块、抓拍模块和拍照识别模块,避免了增加额外的设备,减少工程成本和施工难度。 加油工作区监控:加油工作区是外来人员及车辆的主要活动场所,点位设计应满足该区域的全覆盖。加油工作区一般面积比较大,可以采用枪机对角安装进行大面积覆盖,再加装球型摄像机对枪机盲点进行补充。同时,球机可以对加油区的工作细节进行捕获。枪机采用低照度彩色摄像机,球机采用智能中速球。 便利店、售卡处、财务处(保险柜):以上三个地方均是发生钱物交易的地方,点位设计需满足清晰记录交易人员特征及交易情况的需求。便利店、售卡处、财务处均为室内安装,采用高解彩色半球摄像机,外观美观,分辨率高(540TVL),满足监控点需求。 油库区:油库区为加油站防范的重中之重,油库区一旦发生问题,后果不堪设想。 点位设计采用智能分析技术,能够对进入油库区的人员和车辆进行跟踪捕获,清晰地展现人员及车辆的运行轨迹及各种状态。 油库区采用自动跟踪高速智能球,通过智能分析技术,清晰完整的记录油库区的人和车。并要求球机具备自动跟踪、运转速度快(水平540°/s、垂直400°/s)等特点。 加油站报警设计 本监控系统设计预留报警接口,可在加油站重点防范部位加装报警探头或者报警按钮,实现报警信息的自动采集或手动触发。 报警点位设计:财务室、保险柜安装三鉴探测器和手动报警按钮;售卡处和便利店安装手动报警按钮;同时支持视频检测报警。 加油站中心设计:加油站中心主要是前端摄像机的汇聚中心,系统采用硬盘录像机作为汇聚核心设备。通过硬盘录像机对前端视频进行编码存储及网络上传。同时,硬盘录像机也可以接入前端报警信号,实现报警联动及报警上传等功能。 监控中心建设 监控中心是整个系统的管理核心,能够对前端设备和用户进行统一的管理和控制。监控中心设在省级销售管理公司,主要是系统平台软件、承载服务器及应用客户端的部署。 分控中心建设 分控中心为系统的区域管理中心,能够对区域内的前端设备进行管理和控制。区域监控中心设在各地市销售公司,主要是系统应用客户端和承载计算机的部署。 系统平台建设 本系统平台是一套定位于监控专网环境下的网络集中监控系统。整个软件平台按分布式系统方式设计,各组件各司其职、相对独立,又构成一个有机的整体。由中心服务模块、存储服务模块、流媒体服务模块、电视墙服务模块、报警服务模块、客户端模块(分配置和操作两类)组成。各服务模块的物理承载形式为Server,构成中心服务器、存储服务器、流媒体服务器、电视墙服务器和报警服务器,客户端模块的物理承载形式为高性能PC,构成配置客户端和操作客户端。 本系统中的控制、管理、服务均由中心服务器、存储服务器、流媒体服务器、电视墙服务器和报警服务器实现,形成报警与监控管理控制应用平台。远程网络监控采用B/S(浏览器/服务器)和C/S(客户端/服务器)模式。其中,监控中心、分控中心采用C/S模式,在计算机上安装客户端软件,可根据权限划分,实现对其管辖范围内的前端设备远程管理设置、图像浏览录像和回放;领导和有关人员电脑访问采用B/S模式,使用IE浏览器登录服务器,能远程浏览图像、控制设备。 平台构成 监控平台软件分管理中心(ServerControl)、监控中心(ControlCenter)与控制中心(即客户端)三部分。 监控中心提供视频安防监控系统的功能服务,包含集中存储服务、高清解码服务、流媒体服务、报警服务等。控制中心是一个用户进行监控交互的客户端软件。加油站监控报警联网系统的建设方案浅析 2011/7/4/9:7来源:安防知识网 管理中心包含一个服务程序和一个数据库,对各监控中心服务模块、控制中心用户、前端设备(高清IP摄像机)实施有效管理,管理数据记录在数据库中。 监控平台软件支持分布式组网,可组建多个监控中心。监控中心之间可形成一个树形结构,最高级别的监控中心可以管理各个分监控中心,上级监控中心可以按权限实时监看下级监控中心管理的监控点。 系统管理功能 管理中心是整个系统的核心,各监控中心必须得到管理中心的授权才可以接入系统。同时,管理中心还对监控中心的各类服务器(电视墙服务器、存储服务器、流媒体服务器)、接入的前端编码设备(高清网络摄像机)、控制中心的操作用户进行管理。 彩色图像基础知识普及篇 ⑴ 图像采集的原理 数码相机,摄像机等都是通过传感器来获取图像的,传感器阵列是由横竖两个方向密集排列的感光元件(CCD或CMOS)组成的一个二维矩阵,它收集入射能量并把它聚焦到一个图像平面上,与焦点面相重合的传感器阵列产生与每一个传感器接收光总量成正比的输出。数字或模拟电路扫描这些输出,并把它们转换为信号,由成像系统的其他部分数字化。 ⑵ BAYER矩阵 传感器阵列的排列方式可以有很多种,现在最常用的是Bayer矩阵模式的排列方式,即每个CCD就对应一个像素。其中R感应红光、G感应绿光、B感应蓝光,而在Bayer模式中G是R和B的两倍(因为我们的眼睛对绿色更敏感)。以下是Bayer阵列的一种排列方式: RGRGRGRGRG GBGBGBGBGB RGRGRGRGRG 以中心绿色的G为例,此像素只有G,缺少R与B,R就等于上下两个R的平均值,B就等于左右两个B的平均值。其他的R与B都是一样的,每个像素补齐RGB三色就可以。此种插值算法是最简单最高效的,当然在一些图像的边界之处其影像效果最会有一些折扣。 ⑶ 伽马校正 数码相机拍摄出的彩色图像,以及我们把一幅图像在显示器上显示出来都要进行相应的伽马校正。数码RAW格式的拍摄是采用线性的gamma(即gamma 1.0),可是人的眼睛对光的感应曲线却是一“非线性”的曲线。所以RAW Converter会在转换时都会应用一条Gamma曲线到Raw数据上(简单的理解,就是相当于对原始数据进行一个f(x)的变换,并且注意,f(x)并不是一次的线性函数),来产生更加接近人眼感应的色调。同理,显示器的强度(Intensity)并非与输入讯号成正比(非线性关系),这种非线性特性称为Gamma特性。 各参数简述如下: ① Image_gamma:为输入影像的γ值,一般订为γNTSC=2.2,γPAL=2.8,γRGB=1,γMAC=1.8; ② Display_gamma:因制造技术的关系,每一制造厂生产出来的显示器γ值都会不一样,所以制造厂需提供显示器γ值,一般订为γCRT=2.5,γLCD=1.6; ③ Viewing_gamma:为最后我们用眼睛去看的结果,理想状况为1,即为看到的影像为原 始影像,一般会因外在环境的影响,γ值从1至1.5变化。 ④ LUT_gamma:伽马参数的LUT表。 输入讯号经γ修正器与显示器后,最后希望看到的是与原输入影像一样的画面,即没有失真。 ⑷ RGB和YUV图像 在计算机中使用最多的 RGB 颜色空间,分别对应红、绿、蓝三种颜色;通过调配三个分量的比例来组成各种颜色。一般可以使用 1、2、4、8、16、24、32 位来存储这三颜色,不过现在一个分量最大是用 8 位来表示,最大值是 255,对于 32 位的颜色,高 8 位是用来表示透明度的。彩色图一般指 16 位以上的图。灰度图有一个特殊之处就是组成颜色的三个分量相等;而一般灰度图是8 位以下。 在彩色电视机系统中,通常使用一种叫 YUV 的颜色空间,其中 Y 表示亮度信号,也就是这个 YUV 空间解决了彩色电视机和黑白电视机的兼容问题。对于人眼来说,亮度信号是最敏感的,如果将彩色图像转换为灰度图像,仅仅需要转换保存亮度信号就可以。 从 RGB 到 YUV 空间的 Y 转换公式为: Y = 0.299R+0.587G+0.114B 在 WINDOWS 中,表示 16 位以上的图和以下的图有点不同; 16 位以下的图使用一个调色板来表示选择具体的颜色,调色板的每个单元是 4 个字节,其中一个透明度;而具体的像素值存储的是索引,分别是 1、2、4、8 位。16 位以上的图直接使用像素表示颜色。 ⑸ 彩色图转换为灰度图 灰度图(GrayScale)是指只含亮度信息,不含色彩信息的图像。灰度化处理是把含有亮度和色彩的彩色图像变换成灰度图像的过程。灰度化处理在许多图像处理中是很重要的一步,他的结果就是后续处理的基础。所以,寻求一种正确有效的灰度化处理方法尤其重要。 那么如何将彩色图转换为灰度图呢? 常用的色彩系统有RGB、YIQ、YUV。 1)YIQ色彩系统属于NTSC电视广播制式系统。Y是亮度,即图像的灰度值,I和Q则是指色调。它与RGB的关系为: 2)YUV属于PAL电视广播制式系统。Y也是亮度,U和V也是色调。它与RGB的关系为: 灰度图中有调色板,首先需要确定调色板的具体颜色取值。我们前面提到了,灰度图的三个分量相等。当转换为 8 位的时候,调色板中有 256 个颜色,每个正好从 0 到 255 个,三个分量都相等。当转换为 4 位的时候,调色板中 16 个颜色,等间隔平分 255 个颜色值,三个分量都相等。当转换为 2 位的时候,调色板中 4 个颜色,等间隔平分 255 个颜色,三个分量相等。当转换为 1 位的时候,调色板中两个颜色,是 0 和 255,表示黑和白。 将彩色转换为灰度时候,按照公式计算出对应的值,该值实际上是亮度的级别;亮度从 0 到 255 ;由于不同的位有不同的亮度级别,所以 Y 的具体取值如下: Y = Y/(1<<(8-转换的位数)); 最后一点需要注意,得到 Y 值存放方式是不同的;分别用对应的位数来存储对应的 Y 值。在计算 Y 值的时候,使用的整数除法,这是有误差的,为了消除误差,需要采用误差扩散的算法,也就是将该误差值向其邻近的像素点扩散,当然按照一定的比例来分配;例如:整除之后,余数是 5,采用 3/2/3 的策略,就是,右边像素和正下面的像素各占 3/8,而右下角的像素占 2/8。 2.图像格式转换的算法描述 ⑴ BAYER矩阵转换为RGB格式图像的算法描述 我们通常采用插值算法(Interpolation)把BAYER矩阵中的像素的颜色值转换为一个像素的RGB的数值。我们通常以3×3的插值算法来计算BAYER矩阵的像素的RGB值,该插值算法中某个位置像素的RGB分量的值只取决于以该像素为中心的3×3的邻域中同样分量的均值。 ⑵ RGB格式图像转换为灰度图像的算法描述 我们进行图像处理通常都是在微机上进行的,因此以微机的Windows系统为例来介绍如何将RGB格式图像转换为灰度图像。 Windows系统中使用的是设备无关位图(DIB) DIB即Device_Independent Bitmap。目前,Windows处理的DIB通常是以BMP文件存在。BMP文件文件有如下的四个部分; 1)位图头文件:BITMAPFILEHEADER,它是一个位图标志 2)位图信息头:BITMAINFOHEADER 它定义了图像的大小,长宽等信息,长度固定为40个字节。 3)调色板(Palette) 它用来存放位图的颜色,如果是真彩色图,则不需要调色板。其定义为: 所谓调色板就是在16色或256色的显示系统中,将图像中频率出现最高的16或256种颜色组成颜色表。对这些颜色按0至15或255进行编号,每一个编号代表其中的一种颜色。这种颜色编号就叫做颜色的索引号,4位或8位的索引号与24位颜色值的对应表叫做颜色查找表。使用调色板的图像叫做调色板图像,它们的象素值就是颜色在调色板查找表中的索引号。 4)实际的图像数据 对于用到调色板的位图,图像数据就是该像素颜色在调色板中的索引值,对于真彩色图,图像数据就是实际上的红(R)、绿(G)、蓝(B)的值。由前面介绍的原理可知,知道图像某点的R、G、B值,要得到亮度信息,则可由下式计算出: Y=0.299*R+0.587*G+0.114*B(1) 而在用BMP表示的灰度图中,其红(R)、绿(G)、蓝(B)三个分量的值相等,即有 R=G=B(2)式 把(2)式代入(1)式中,可得:I=Q=0,即图像没有了色彩信息。 同理,对YUV颜色空间也一样。 为了把彩色图像转换为灰度图像,首先要找出彩色图像的颜色值:R、G、B。然后,通过(3)式计算,即可得出亮度值Y。再令:R=G=B=Y,则得到的新的图像,即灰度图像。 对于24位或32位的真彩色图像而言,找出每点的RGB值相对容易。前面介绍了,24位或32位真彩不需调色板,它的图像数据就是实际的RGB的值。RGB三个分量分别占有一个字节,即容易取得RGB的值。 而对于16位位图言,它的一个点用两个字节来表示。它也不用调色板。要取得RGB的值,就需要了解R、G、B在这两个字节中的位置。它们所占的位置是这样的: R占高5位,B占低5位,G占中间6位。 取出相应的RGB值后,都转变为八位(低位补0)。再通过(1)式,即可得到该点的亮度值Y。然后,写回新的256色位图时,令R=G=B=Y,这样,就得到了一个256级的灰度图像。 遥 感 实习总 结 专业:摄影测量与遥感技术 班级: 姓名: 学号: 为期两周的遥感数字图像处理结束了,在老师的精心安排下,我们全身心的投入到这次实习中。虽然是满天的时间,但是由于教室还有其他人占用并不能在那全天使用,所以说是两周实习但是我们能用是时间依然很少,我们要力抓每一分每一秒,熟练操作遥感数字图像处理软件。整个实习是以黄河水院为基础图形。通过格式变换、几何校正、图像剪裁、图像分类,以及最后的专题地图制作。 实习的过程简单又复杂,简单的是,只要动手,计算机几乎自动化的替你操作,复杂的是,在操作过程中,又有好多选项和注意的事项,有很多参数的设置很有讲究。所以在练习中我遇到好多问题,并通过解决这些问题进一步加深了对软件和课本知识的理解。 首先我们进行的是数据预处理。我们需要进行遥感图像的几何校正。由于各种误差所以遥感图像存在着几何变形,因此需要在操作前进行几何校正。流程如下:第一步:显示图像文件(打开两个视窗窗口),第二步:启动几何校正模块,第三步:启动控制点工具,第四步:地面控制点(GCP)的采集,第五步:采集地面检查点,第六步:图象重采样,第七步:保存几何校正模式。其中最关键最难的就属地面控制点的采集,我们使用的是二次多项式,所以得选取六个控制点然后再选出六个检查点。但是图像存在着误差,而我们要把误差控制在一个像素以内,这就更加困难了。在进过长时间的摸索和练习,精度慢慢的就达到了,但是图纠正后依旧不是很好,在询问同学后发现原来是点的分布不是很均匀,所以导致了图的变形。在图的校正后就得进行图范围的裁剪得到所需的范围。裁剪有两种方法一种是规则分幅裁剪,一种是不规则分幅裁剪。规则分幅裁剪需要知道坐标,而不规则分幅裁剪则只需要在图上手选出需要裁剪的范围。而我们没有坐标只能用不规则分幅裁剪。 第二项就是图象增强处理,主要包括:空间、辐射、光谱增强处理的主要方法。空间增强:包括卷积增强处理,辐射增强:直方图均衡化处理,光谱增强:主成份变换、缨穗变换、色彩变换。这一项比较简单,通过指导书和上课的学习,这些增强只要知道步骤就能很快完成。 第三项我认为也是最关键的一项,遥感图像的分类,所谓的遥感图像的分类就是通过人工目译或计算机自动分类处理相结合识别出地物属性。我们做的分类是非监督分类,在进行的分类评价时,应用分类叠加方法来评价分类结果、分类精度及定义时应注意分类文件在上,而且取消栅格参数中清楚选示选项,以使两图像叠加显示。非监督分类步骤如下:第一步:显示原图像与分类图像,第二步:打开分类图像属性并调整字段显示顺序,第三步:给各个类别赋相应的颜色,第四步:不透明度设置,第五步:确定类别专题意义及其准确程度,第六步:标注类别的名称和相应颜色,第七步:将相同的类进行合并,最后分为五大类:建筑物、道路(空闲地)、水系、草地和灌木林。 第四项是制作专题地图。其操作步骤为: 一、准备专题制图数据,二、生成专题制图文件,三、确定专题制图范围,四、放置图面整饬要素。而图面整饰又包括1.绘制格网线与坐标注记,2.绘制地图比例尺,3.绘制地图图例,4.绘制指北针,5.地图名称的设定,6.地图的保存。其中创建格网中可以设置格网线的多少和起始值,这一步主要是对制作专题图的一些整饰,可以使图美观易懂。 为期两周的实习结束了,经过这次系统全面的实习,让我更深刻的了解了遥感图像的操作流程,也掌握了面对常出现问题的解决方法,同时也让我对课程有了更确切的理解,把理论应用于实际,同时加深了对理论部分的重点理解,还提升了动手能力。 知识专题化 提高教学效果 ——《数码图像处理》教学反思 现代教育技术中心 时道波 《数码图像处理》课程是上一学年新增设的一门选修课,面向本校非信息技术班开设,本课程重点培养学生的实践动手能力和审美水平,掌握图片处理的技法,能够创作出具有一定水准的作品,根据教学对象实际情况,采用内容专题化教学,教学中以图像处理实践为主,降低相关理论知识要求。经过一个学年的教学实践与思考,有一些收获,也有一些困惑,下面从本课程的教学目标、教学内容、教学方式、教学考核等方面进行总结。 一、教学目标 《数码图像处理》课程作为一门选修课,教学目标的设定应以激发学生学习兴趣、带领学生入门为目的,具体包括: 1、通过教学实践,使学生了解数字图像处理的发展、应用以及当前研究的热点和重要成果; 2、较深入地理解数字图像处理的基本概念、解决问题的基本思想方法,熟练掌握数字图像处理的基本过程; 3、能够运用Photoshop软件实现图像编辑、校色调色、图像合成、特效制作等各种图像效果处理技术,并能够在Photoshop中制作各种人像效果制作,如:美化人像、画意影像等。 二、教学内容 《数码图像处理》课程内容丰富,涉及的领域很多,包括:Photoshop软件技术、色彩知识、设计技巧、创意创作等,具有较强的专题性(例如:图像基本修饰、图像色彩调整、人物美化、画意影像等)。我在教学初的教学计划中将教学内容实行模块化、专题化,这样可以快速实现创作效果,较好的调动学生参与的积极性。但是,教学中也遇到了一下困难,如:缺乏合适的配套教材,需要教师在教学内容设计上要紧跟图像处理技术前沿,因此备课过程必须查阅更多文献材料,同时,对教学核心内容的把握要准确到位,对教学实践项目的设计必须精心考虑,合理统筹,这些都极大增加了教师课前准备的工作量。在专题化教学实践中,将这些专题的基本原理作为核心内容,并辅以其他与专题相关的研究性资料,使专题教学内容重点突出,信息量大,如:图像基本修饰,Photoshop CS5涵盖的内容比较全面,包括了选取范围、图像变换、图层、通道、特效滤镜、动作、时间轴等等。作为专题教学时,可将与图像的裁剪、图像占用空间等相关应用知识添加进来,使学生图像处理技术有更全面、深入地认识,并为专题化实践研究打下良好基础。 三、教学方法 《数码图像处理》课程选修班学生都是来自非信息技术班,信息技术基础较差,如何充分调动学生学习主动性和激发其创造能力,也是教师面对的一大难题。我决定不采用传统的按部就班的教学模式,而采用专题化的教学模式,在教学中,始终以学生为中心,采用启发式、问题法教学。 在专题内容正式讲授之前,应引入一些与专题相关的小问题,引导学生思考、分析问题,鼓励他们尝试着解决问题,这样能有效激发他们的学习积极性,提高学习效果。在专题化教学内容的设置上,每个专题涵盖的信息量都很丰富,但在理论教学中注意突出重点,贯彻“少而精”的原则,对每个专题的基本概念、基本理论要重点讲述,使学生掌握图像处理的精髓。对于专题扩展部分的知识,力求做到内容新颖、信息量大,并通过多媒体课件对新方法、新技术的处理效果进行实例演示,从而提高学生的理论素养,有效激发他们探究数字图像处理前沿技术的热情。 整个教学实践表明,专题化教学模式更能有效组织教学内容,使教学重点突出,教学信息量大。在教学中,可以根据每个专题引入了相应的图像处理研究热点、难点和新兴应用技术,学生的视野也得到了极大的拓展,有效地激发学生的学习兴趣,调动学生的学习主动性,较好地培养了学生动手实践能力。 四、教学考核 《数码图像处理》是一门实践性很强的课程,不适合采用卷面考核方式,也不适合通过一个作品就得出成绩的考核方式,传统的重记忆轻能力的考核必将伤害学生实践学习的主动性,影响学生实践能力的培养,从而达不到教学的理想效果。我采用形成性考核和终结性考核相结合的方式。形成性考核包括平时作业和考勤情况。形成性考核中平时作业实行开卷形式,占总成绩30%,考勤情况占总成绩的20%;终结性考核即期末考试,期末考试实行闭卷形式,成绩占学期总成绩的50%,考核命题在本课程的教学目标、教学内容范围之内,评分标准从技术、色彩、结构、选材四个角度全面衡量学生的技能水平。 五、改进措施 鉴于教学中缺乏教材,导致学生无法预习,教学方法单一容易使学习枯燥等情况,在以后的教学中,将加强以下两方面工作。 1、加强教材建设。合适的配套教材是实施教学的重要保证。采用专业班使用的教材不完全合适,市面上多数都是案例式的书籍,目前解决问题的办法是从各种书籍中搜集与专题相关的资料进行整合。本课程教材的编写要考虑学生的信息基础、教材格式安排上要富于变化、合理确定选讲内容等。教材的探索不是一个短期的过程,要有一个经验的积累过程。 2、改进教学方法。在专题化教学基础上,采用研讨式教学方式使课堂教学以学生为主角,最大程度地发挥学生的主观能动性,摆脱以往课堂上以教师讲授为主的模式,采用“教师主题引导—学生专题讲授—随堂研讨—教师质疑答疑”的形式安排课堂活动,并配合验证型和设计型实验拓展学生的学习和创新空间。重点在课堂活动安排上进行新的尝试,整体设计包括首堂互动、专题讲授与研讨、实验设置与课程竞赛、作业与考核等环节。学生通过课前自学、课上讨论和课后实验能更系统、深刻地掌握所学内容,并会因为研讨提出的交叉应用问题激发拓展学习的热情。第二篇:加油站车牌识别
第三篇:图像视频处理基础知识总结
第四篇:遥感图像处理实习总结
第五篇:《数码图像处理》选修课总结