第一篇:常用图片后缀格式识别常识
一、BMP格式
BMP是英文Bitmap(位图)的简写,它是Windows操作系统中的标准图像文件格式,能够被多种Windows应用程序所支持。随着Windows操作系统的流行与丰富的Windows应用程序的开发,BMP位图格式理所当然地被广泛应用。这种格式的特点是包含的图像信息较丰富,几乎不进行压缩,但由此导致了它与生俱生来的缺点--占用磁盘空间过大。所以,目前BMP在单机上比较流行。
二、GIF格式
GIF是英文Graphics Interchange Format(图形交换格式)的缩写。顾名思义,这种格式是用来交换图片的。事实上也是如此,上世纪80年代,美国一家著名的在线信息服务机构CompuServe针对当时网络传输带宽的限制,开发出了这种GIF图像格式。
GIF格式的特点是压缩比高,磁盘空间占用较少,所以这种图像格式迅速得到了广泛的应用。最初的GIF只是简单地用来存储单幅静止图像(称为GIF87a),后来随着技术发展,可以同时存储若干幅静止图象进而形成连续的动画,使之成为当时支持2D动画为数不多的格式之一(称为GIF89a),而在GIF89a图像中可指定透明区域,使图像具有非同一般的显示效果,这更使GIF风光十足。目前Internet上大量采用的彩色动画文件多为这种格式的文件,也称为GIF89a格式文件。
此外,考虑到网络传输中的实际情况,GIF图像格式还增加了渐显方式,也就是说,在图像传输过程中,用户可以先看到图像的大致轮廓,然后随着传输过程的继续而逐步看清图像中的细节部分,从而适应了用户的“从朦胧到清楚”的观赏心理。目前Internet上大量采用的彩色动画文件多为这种格式的文件。
但GIF有个小小的缺点,即不能存储超过256色的图像。尽管如此,这种格式仍在网络上大行其道应用,这和GIF图像文件短小、下载速度快、可用许多具有同样大小的图像文件组成动画等优势是分不开的。
三、JPEG格式
JPEG也是常见的一种图像格式,它由联合照片专家组(Joint Photographic Experts Group)开发并以命名为“ISO 10918-1”,JPEG仅仅是一种俗称而已。JPEG文件的扩展名为.jpg或.jpeg,其压缩技术十分先进,它用有损压缩方式去除冗余的图像和彩色数据,获取得极高的压缩率的同时能展现十分丰富生动的图像,换句话说,就是可以用最少的磁盘空间得到较好的图像质量。
同时JPEG还是一种很灵活的格式,具有调节图像质量的功能,允许你用不同的压缩比例对这种文件压缩,比如我们最高可以把1.37MB的BMP位图文件压缩至20.3KB。当然我们完全可以在图像质量和文件尺寸之间找到平衡点。
由于JPEG优异的品质和杰出的表现,它的应用也非常广泛,特别是在网络和光盘读物上,肯定都能找到它的影子。目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快,使得Web页有可能以较短的下载时间提供大量美观的图像,JPEG同时也就顺理成章地成为网络上最受欢迎的图像格式。
四、JPEG2000格式
JPEG 2000同样是由JPEG 组织负责制定的,它有一个正式名称叫做“ISO 15444”,与JPEG相比,它具备更高压缩率以及更多新功能的新一代静态影像压缩技术。
JPEG2000 作为JPEG的升级版,其压缩率比JPEG高约30%左右。与JPEG不同的是,JPEG2000 同时支持有损和无损压缩,而 JPEG 只能支持有损压缩。无损压缩对保存一些重要图片是十分有用的。JPEG2000的一个极其重要的特征在于它能实现渐进传输,这一点与GIF的“渐显”有异曲同工之妙,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图象由朦胧到清晰显示,而不必是像现在的 JPEG 一样,由上到下慢慢显示。
此外,JPEG2000还支持所谓的“感兴趣区域”特性,你可以任意指定影像上你感兴趣区域的压缩质量,还可以选择指定的部份先解压缩。JPEG 2000 和 JPEG 相比优势明显,且向下兼容,因此取代传统的JPEG格式指日可待。
JPEG2000可应用于传统的JPEG市场,如扫描仪、数码相机等,亦可应用于新兴领域,如网路传输、无线通讯等等。
五、TIFF格式
TIFF(Tag Image File Format)是Mac中广泛使用的图像格式,它由Aldus和微软联合开发,最初是出于跨平台存储扫描图像的需要而设计的。它的特点是图像格式复杂、存贮信息多。正因为它存储的图像细微层次的信息非常多,图像的质量也得以提高,故而非常有利于原稿的复制。
该格式有压缩和非压缩二种形式,其中压缩可采用LZW无损压缩方案存储。不过,由于TIFF格式结构较为复杂,兼容性较差,因此有时你的软件可能不能正确识别TIFF文件(现在绝大部分软件都已解决了这个问题)。目前在Mac和PC机上移植TIFF文件也十分便捷,因而TIFF现在也是微机上使用最广泛的图像文件格式之一。
六、PSD格式
这是著名的Adobe公司的图像处理软件Photoshop的专用格式Photoshop Document(PSD)。PSD其实是Photoshop进行平面设计的一张“草稿图”,它里面包含有各种图层、通道、遮罩等多种设计的样稿,以便于下次打开文件时可以修改上一次的设计。在Photoshop所支持的各种图像格式中,PSD的存取速度比其它格式快很多,功能也很强大。由于Photoshop越来越被广泛地应用,所以我们有理由相信,这种格式也会逐步流行起来。
七、PNG格式
PNG(Portable Network Graphics)是一种新兴的网络图像格式。在1994年底,由于Unysis公司宣布GIF拥有专利的压缩方法,要求开发GIF软件的作者须缴交一定费用,由此促使免费的png图像格式的诞生。PNG一开始便结合GIF及JPG两家之长,打算一举取代这两种格式。1996年10月1日由PNG向国际网络联盟提出并得到推荐认可标准,并且大部分绘图软件和浏览器开始支持PNG图像浏览,从此PNG图像格式生机焕发。
PNG是目前保证最不失真的格式,它汲取了GIF和JPG二者的优点,存贮形式丰富,兼有GIF和JPG的色彩模式;它的另一个特点能把图像文件压缩到极限以利于网络传输,但又能保留所有与图像品质有关的信息,因为PNG是采用无损压缩方式来减少文件的大小,这一点与牺牲图像品质以换取高压缩率的JPG有所不同;它的第三个特点是显示速度很快,只需下载1/64的图像信息就可以显示出低分辨率的预览图像;第四,PNG同样支持透明图像的制作,透明图像在制作网页图像的时候很有用,我们可以把图象背景设为透明,用网页本身的颜色信息来代替设为透明的色彩,这样可让图像和网页背景很和谐地融合在一起。
PNG的缺点是不支持动画应用效果,如果在这方面能有所加强,简直就可以完全替代GIF和JPEG了。Macromedia公司的Fireworks软件的默认格式就是PNG。现在,越来越多的软件开始支持这一格式,而且在网络上也越来截止流行。
八、SWF格式
利用Flash我们可以制作出一种后缀名为SWF(Shockwave Format)的动画,这种格式的动画图像能够用比较小的体积来表现丰富的多媒体形式。在图像的传输方面,不必等到文件全部下载才能观看,而是可以边下载边看,因此特别适合网络传输,特别是在传输速率不佳的情况下,也能取得较好的效果。事实也证明了这一点,SWF如今已被大量应用于WEB网页进行多媒体演示与交互性设计。此外,SWF动画是其于矢量技术制作的,因此不管将画面放大多少倍,画面不会因此而有任何损害。综上,SWF格式作品以其高清晰度的画质和小巧的体积,受到了越来越多网页设计者的青睐,也越来越成为网页动画和网页图片设计制作的主流,目前已成为网上动画的事实标准。
九、SVG格式
SVG可以算是目前最最火热的图像文件格式了,它的英文全称为Scalable Vector Graphics,意思为可缩放的矢量图形。它是基于XML(Extensible Markup Language),由World Wide Web Consortium(W3C)联盟进行开发的。严格来说应该是一种开放标准的矢量图形语言,可让你设计激动人心的、高分辨率的Web图形页面。用户可以直接用代码来描绘图像,可以用任何文字处理工具打开SVG图像,通过改变部分代码来使图像具有互交功能,并可以随时插入到HTML中通过浏览器来观看。
它提供了目前网络流行格式GIF和JPEG无法具备了优势:可以任意放大图形显示,但绝不会以牺牲图像质量为代价;字在SVG图像中保留可编辑和可搜寻的状态;平均来讲,SVG文件比JPEG和GIF格式的文件要小很多,因而下载也很快。可以相信,SVG的开发将会为Web提供新的图像标准。
十、CDR
著名的图形设计软件——CorelDRAW的专用格式,属于矢量图像,最大的优点“体重”很轻,便于再处理。
总的来说,有两种截然不同的图像格式类型: 即有损压缩和无损压缩。
1.有损压缩
有损压缩可以减少图像在内存和磁盘中占用的空间,在屏幕上观看图像时,不会发现它对图像的外观产生太大的不利影响。因为人的眼睛对光线比较敏感,光线对景物的作用比颜色的作用更为重要,这就是有损压缩技术的基本依据。
有损压缩的特点是保持颜色的逐渐变化,删除图像中颜色的突然变化。生物学中的大量实验证明,人类大脑会利用与附近最接近的颜色来填补所丢失的颜色。例如,对于蓝色天空背景上的一朵白云,有损压缩的方法就是删除图像中景物边缘的某些颜色部分。当在·屏幕上看这幅图时,大脑会利用在景物上看到的颜色填补所丢失的颜色部分。利用有损压缩技术,某些数据被有意地删除了,而被取消的数据也不再恢复。
无可否认,利用有损压缩技术可以大大地压缩文件的数据,但是会影响图像质量。如果使用了有损压缩的图像仅在屏幕上显示,可能对图像质量影响不太大,至少对于人类眼睛的识别程度来说区别不大。可是,如果要把一幅经过有损压缩技术处理的图像用高分辨率打印机打印出来,那么图像质量就会有明显的受损痕迹。2.无损压缩
无损压缩的基本原理是相同的颜色信息只需保存一次。压缩图像的软件首先会确定图像中哪些区域是相同的,哪些是不同的。包括了重复数据的图像(如蓝天)就可以被压缩,只有蓝天的起始点和终结点需要被记录下来。但是蓝色可能还会有不同的深浅,天空有时也可能被树木、山峰或其他的对象掩盖,这些就需要另外记录。从本质上看,无损压缩的方法可以删除一些重复数据,大大减少要在磁盘上保存的图像尺寸。但是,无损压缩的方法并不能减少图像的内存占用量,这是因为,当从磁盘上读取图像时,软件又会把丢失的像素用适当的颜色信息填充进来。如果要减少图像占用内存的容量,就必须使用有损压缩方法。
无损压缩方法的优点是能够比较好地保存图像的质量,但是相对来说这种方法的压缩率比较低。但是,如果需要把图像用高分辨率的打印机打印出来,最好还是使用无损压缩几乎所有的图像文件都采用各自简化的格式名作为文件扩展名。从扩展名就可知道这幅图像是按什么格式存储的,应该用什么样的软件去读/写等等。
其它非主流图像格式:
1、PCX格式
PCX格式是ZSOFT公司在开发图像处理软件Paintbrush时开发的一种格式,这是一种经过压缩的格式,占用磁盘空间较少。由于该格式出现的时间较长,并且具有压缩及全彩色的能力,所以现在仍比较流行。PCX这种图像文件的形成是有一个发展过程的。最先的PCX雏形是出现在ZSOFT公司推出的名叫PC PAINBRUSH的用于绘画的商业软件包中。以后,微软公司将其移植到 Windows环境中,成为Windows系统中一个子功能。先在微软的Windows3.1中广泛应用,随着Windows的流行、升级,加之其强大的图像处理能力,使PCX同GIF、TIFF、BMP图像文件格式一起,被越来越多的图形图像软件工具所支持,也越来越得到人们的重视。
PCX是最早支持彩色图像的一种文件格式,现在最高可以支持256种彩色,如图4-25所示,显示256色的彩色图像。PCX设计者很有眼光地超前引入了彩色图像文件格式,使之成为现在非常流行的图像文件格式。
PCX图像文件由文件头和实际图像数据构成。文件头由128字节组成,描述版本信息和图像显示设备的横向、纵向分辨率,以及调色板等信息:在实际图像数据中,表示图像数据类型和彩色类型。PCX图像文件中的数据都是用PCXREL技术压缩后的图像数据。
PCX是PC机画笔的图像文件格式。PCX的图像深度可选为l、4、8bit。由于这种文件格式出现较早,它不支持真彩色。PCX文件采用RLE行程编码,文件体中存放的是压缩后的图像数据。因此,将采集到的图像数据写成PCX文件格式时,要对其进行RLE编码:而读取一个PCX文件时首先要对其进行 RLE解码,才能进一步显示和处理。
2、DXF格式
DXF(Autodesk Drawing Exchange Format)是AutoCAD中的矢量文件格式,它以ASCII码方式存储文件,具有文件小,所绘图形尺寸、角度等数据十分精确的特点,许多软件都支持DXF格式的输入与输出,是建筑设计的首选。
3、WMF格式
WMF(Windows Metafile Format)是Windows中常见的一种图元文件格式,属于矢量文件格式。它具有文件短小、图案造型化的特点,整个图形常由各个独立的组成部分拼接而成,其图形往往较粗糙。
4、EMF格式
EMF(Enhanced Metafile)是微软公司为了弥补使用WMF的不足而开发的一种Windows 32位扩展图元文件格式,也属于矢量文件格式,其目的是欲使图元文件更加容易接受
5、LIC(FLI/FLC)格式
Flic格式由Autodesk公司研制而成,FLIC是FLC和FLI的统称:FLI是最初的基于320×200分辨率的动画文件格式,而FLC则采用了更高效的数据压缩技术,所以具有比FLI更高的压缩比,其分辨率也有了不少提高。
6、EPS格式
EPS(Encapsulated PostScript)是PC机用户较少见的一种格式,而苹果Mac机的用户则用得较多。它是用PostScript语言描述的一种ASCII码文件格式,主要用于排版、打印等输出工作。
7、TGA格式
TGA(Tagged Graphics)文件是由美国Truevision公司为其显示卡开发的一种图像文件格式,已被国际上的图形、图像工业所接受。TGA的结构比较简单,属于一种图形、图像数据的通用格式,在多媒体领域有着很大影响,是计算机生成图像向电视转换的一种首选格式。
第二篇:食品简单识别常识
食品简单的识别常识
一、食品感官常识
所谓食品质量感官鉴别的基本方法,其实质就是依靠视觉、嗅觉、味觉、触觉和听觉等来鉴定食品的外观形态、色泽、气味、滋味和硬度(稠度)。其主要还是通过四觉来鉴定,下面就具体谈谈这四觉。
1、视觉鉴别法。这是判断食品质量的一个重要感官手段。食品的外观形态和色泽对于评价食品的新鲜程度、食品是否有不良改变以及蔬菜、水果的成熟度等有着重要意义。视觉鉴别应在白昼的散射光线下进行,以免灯光隐色发生错觉。鉴别时应注意整体外观、大小、形态、块形的完整程度、清洁程度,表面有无光泽、颜色的深浅色调等。在鉴别液态食品时,要将它注人无色的玻璃器皿中,透过光线来观察;也可将瓶子颠倒过来,观察其中有无夹杂物下沉或絮状物悬浮。
2、嗅觉鉴别法。人的嗅觉器官相当敏感,甚至用仪器分析的方法也不一定能检查出来极轻微的变化,用嗅觉鉴别却能够发现。当食品发生轻微的腐败变质时,就会有不同的异味产生。如核桃的核仁变质所产生的酸败而有哈喇味,西瓜变质会带有馊昧等。食品的气味是一些具有挥发性的物质形成的,所以在进行嗅觉鉴别时常需稍稍加热,但最好是在15℃~25℃的常温下进行,因为食品中的气味挥发性物质常随温度的高低而增减。在鉴别食品的异味时,液态食品可滴在清洁的手掌上摩擦,以增加气味的挥发;识别畜肉等大块食品时,可将一把尖刀稍微加热刺入深部,拔出后立即嗅闻气味。食品气味鉴别的顺序应当是先识别气味淡的,后鉴别气味浓的,以免影响嗅觉的灵敏度。在鉴别前禁止吸烟。
3、味觉鉴别法。感官鉴别中的味觉对于辨别食品品质的优劣是非常重要的一环。味觉器官不但能品尝到食品的滋味如何,而且对于食品中极轻微的变化也能敏感地察觉。如做好的米饭存放到尚未变馊时,其味道即有相应的改变。味觉器官的敏感性与食品的温度有关,在进行食品的滋味鉴别时,最好使食品处在20℃~45℃之间,以免温度的变化会增强或减低对味觉器官的刺激。几种不同味道的食品在进行感官评价时,应当按照刺激性由弱到强的顺序,最后鉴别味道强烈的食品。在进行大量样品鉴别时,中间必须休息,每鉴别一种食品之后必须用温水漱口
4、触觉鉴别法。凭借触觉来鉴别食品的膨、松、软、硬、弹性(稠度),以评价食品品质的优劣,也是常用的感官鉴别方法之一。例如,根据鱼体肌肉的硬度和弹性,常常可以判断鱼是否新鲜或腐败;评价动物油脂的品质时,常须鉴别其稠度等。在感官测定食品的硬度(稠度)时,要求温度应在15℃~20℃之间,因为温度的升降会影响到食品状态的改变。
必须做到全面,合理、客观、公正,所以在实施中是有具体原则的。其基本原则有六点:
1、《中华人民共和国产品质量法》、《中华人民共和国食品安全法》、国务院有关部委和省、市行政部门颁布的食品质量法规和卫生法规是鉴别各类食品能否食用的主要依据。(2)食品已明显腐败变质或含有过量的有
毒有害物质(如重金属含量过高或霉变)时,不得供食用。达不到该种食品的营养和风味要求,显系假冒伪劣食品的,不得供食用。
3、食品由于某种原因不能直接食用,必须加工复制或在其他条件下处理的,可提出限定加工条件和限定食用及销售等方面的具体要求。
4、食品某些指标的综合评价结果略低于卫生标准,而新鲜度、病原体、有毒有害物质含量均符合卫生时,可提出要求在某种条件下供人食用。
5、在鉴别指标的掌握上,婴幼儿、病人食用的食品要严于成年人、健康人食用的食品。
6、鉴别结论必须明确,不得含糊不清,对附条件可食的食品,应将条件写清楚。对于没有鉴别参考标准的食品,可参照有关同类食品恰当地鉴别。
7、在进行食品质量综合性鉴别前,应向有关单位或个人收集该食品的有关资料,如食品的来源、保管方法、贮存时间、原料组成、包装情况以及加工、运输、贮藏、经营过程中的卫生情况,寻找可疑环节,为上述鉴别结论提供必要的正确判断基础。
二、食品标签常识
食品包装上,应载有以下信息:
1、产品名称:国家标准规定的名称或与食品属性相关的名称
2、加工工艺:如:油炸、非油炸、冷加工、热加工,烘烤、低温、高温等
3、净含量:
4、配料表:如:水、小麦粉、白砂糖、食用植物油、饴糖
5、食用添加剂:如:甜蜜素、碳酸氢铵、碳酸氢钠
6、执行标准:如:GB/T20977-20077、生产日期:
8、保质期:如:90天
9、贮存方式:如:通风、干燥、清洁处常温保存(或低温条件储存)
10、生产许可证编号:如:QS1304 2401 104911、生产商:与营业执照注册的名称相一致
12、厂址:与营业执照注册的地址相一致
13、产地:河北省邯郸市(要求标到市级)
14、联系电话:
15、注意事项:如:运输过程中应轻拿、轻放、防雨、防晒
16、产品标准要求必须标注的。
邱县质量技术监督局食品安全举报电话:12365
第三篇:基于MATLAB的图片中文字的提取及识别
数字图象处理
Digital Image Progressing 基于MATLAB的图片中文字的提取及识别
邹浩,余龙,邹勇博,刘宇童,和振乔,李少梅(西安电子科技大学 电子工程学院,西安,710126)
摘要
随着现代社会的发展,信息的形式和数量正在迅猛增长。其中很大一部分是图像,图像可以把事物生动地呈现在我们面前,让我们更直观地接受信息。同时,计算机已经作为一种人们普遍使用的工具为人们的生产生活服务。从图像中提取文字属于信息智能化处理的前沿课题,是当前人工智能与模式识别领域中的研究热点。由于文字具有高级语义特征,对图片内容的理解、索引、检索具有重要作用,因此,研究图片文字提取具有重要的实际意义。又由于静态图像文字提取是动态图像文字提取的基础,故着重介绍了静态图像文字提取技术。
关键词:MATLAB 图像处理 文字提取 文字识别
Text Extraction and Recognition in Images Based on MATLAB
ZOU Hao, YU long, ZOU Yongbo, LIU Yutong, HE Zhenqiao, LI Shaomei(Xidian University Electronic Engineering College,Xi'an,710126)
Abstract
With the development of society,the form and quantity of imformation are increasing quickly.A large part of them are images,which can make things vividly presented in front of us,let us more intuitive to accept information.At the same time, the computer has been as a widely used tool for people's production and living services.Extracting text from image belongs to the frontier of intelligent information processing, and it is the current hot research topic in the field of artificial intelligence and pattern recognition.As the text with high-level semantic feature and plays an important role on understanding,indexing and retrieval image content.Therefore,the study on extracting texts from images have important actual meanings.And because extracting texts from still images is the basis for extracting texts from dynamic images, the article emphatically introduces the technology of extracting texts from still images.Key Words: MATLAB image processing word extraction word recognition 数字图象处理
Digital Image Progressing
一.引言
随着计算机科学的飞速发展,以图像为主的多媒体信息迅速成为重要的信息传递媒介,在图像中,文字信息(如新闻标题等字幕)包含了丰富的高层语义信息,提取出这些文字,对于图像高层语义的理解、索引和检索非常有帮助。图像文字提取又分为动态图像文字提取和静态图像文字提取两种,其中,静态图像文字提取是动态图像文字提取的基础,其应用范围更为广泛,对它的研究具有基础性,所以本文主要讨论静态图像的文字提取技术。静态图像中的文字可分成两大类: 一种是图像中场景本身包含的文字, 称为场景文字; 另一种是图像后期制作中加入的文字, 称为人工文字,如右图所示。场景文字由于其出现的位置、小、颜色和形态的随机性, 一般难于检测和提取;而人工文字则字体较规范、大小有一定的限度且易辨认,颜色为单色, 相对与前者更易被检测和提取,又因其对图像内容起到说明总结的作用,故适合用来做图像的索引和检索关键字。对图像中场景文字的研究难度大,目前这方面的研究成果与文献也不是很丰富,本文主要讨论图像中人工文字提取技术。
二.静态图像中文字的特点
静态图像中文字(本文特指人工文字,下同)具有以下主要特征:(1)文字位于前端,且不会被遮挡;(2)文字一般是单色的;
(3)文字大小在一幅图片中固定,并且宽度和高度大体相同,从满足人眼视觉感受的角度来说,图像中文字的尺寸既不会过大也不会过小;(4)文字的分布比较集中;
(5)文字的排列一般为水平方向或垂直方向;
(6)多行文字之间,以及单行内各个字之间存在不同于文字区域的空隙。在静态图片文字的检测与提取过程中, 一般情况下都是依据上述特征进行处理的。
三.文字提取、识别的一般流程 数字图象处理
Digital Image Progressing 静态图像文字提取一般分为以下步骤:文字区域检测与定位、文字分割与文字提取、文字后处理。其流程如图1所示。
(图1)
四.文字提取、识别的详细步骤
1.在Matlab中调用i1=imread('字符.jpg'),可得到原始图像,如图2所示:
(图2)
2.调用i2=rgb2gray(i1),则得到了灰度图像,如图3所示:
(图3)
调用a=size(i1);b=size(i2);可得到:a=3,b=2 即三维图像变成了二维灰度图像
3.调用i3=(i2>=thresh);其中thresh为门限,在
0,i2threshi31,i2thresh[0,255]之间
这里,i2_max=double(max(max(i2)));%获取亮度最大值 i2_min=double(min(min(i2)));%获取亮度最小值 thresh=round(i2_max-((i2_max-i2_min)/3));得到二值图像,如图4所示: 数字图象处理
Digital Image Progressing
(图4)
4.把二值图像放大观察,可看到离散的黑点
对其采用腐蚀膨胀处理,得到处理后的图像,如图5所示
(图5)
可见,腐蚀膨胀处理后的图像质量有了很大的改观。
横向、纵向分别的腐蚀膨胀运算比横向、纵向同时的腐蚀膨胀运算好上很多,图6可看出差别:
(图6)
5.对腐蚀膨胀后的图像进行Y方向上的区域选定,限定区域后的图像如图7所示:
扫描方法:中间往两边扫 数字图象处理
Digital Image Progressing
(图7)
纵向扫描后的图像与原图像的对照,如图8所示:
(图8)
6.对腐蚀膨胀后的图像进行X方向上的区域选定,限定区域后的图像如图9所示:
扫描方法:两边往中间扫
(图9)
纵向扫描后的图像与原图像的对照,如图10所示:
(图10)
7.调用i8=(iiXY~=1),使背景为黑色(0),字符为白色(1),便于后期处理。
背景交换后的图像如图11所示: 数字图象处理
Digital Image Progressing
(图11)
8.调用自定义函数(字符获取函数)i9=getchar(i8),得到图像如图12所示:
(图9)
9.调用自定义的字符获取函数对图像进行字符切割,并把切割的字符装入一维阵列,切割
过程如图12所示:
(图12)
10.调用以下代码,可将阵列word中的字符显示出来,如图13所示:
for j=1:cnum
%cnum为统计的字符个数
subplot(5,8,j),imshow(word{j}),title(int2str(j));%显示字符
end 数字图象处理
Digital Image Progressing
(图13)
可以看到,字符宽度不一致
11.调用以下代码,将字符规格化,便于识别:
for j=1:cnum
word{j}=imresize(word{j},[40 40]);%字符规格化成40×40的end 得到规格化之后的字符如图14所示:
(图14)
12.调用以下代码创建字符集:
code=char('由于作者水平有限书中难免存在缺点和疏漏之处恳请读批评指正。');
将创建的字符集保存在一个文件夹里面,以供匹配时候调用,如图15所示: 数字图象处理
Digital Image Progressing
(图15)
13.字符匹配采用模板匹配算法:将现有字符逐个与模板字符相减,认为相减误差最小的现
有字符与该模板字符匹配。
1 假设:字符A00100100100110,模板字符1T10001110011001101,模板字符T200100110011010 01 sum(sum(abs(AT1)))8,sum(sum(abs(AT2)))2 也就是说,字符A与模板字符T1更相似,我们可以认为字符集中的字符T2就是字符A。
经模板匹配,可得字符信息如下:
由于读者书评有限书中难免存在缺点和纰漏之处,恳请读者批评指正。效果如图16所示:
(图16)
14.调用以下代码,将字符放入newtxt.txt文本: 数字图象处理
Digital Image Progressing
new=['newtxt','.txt'];
c=fopen(new,'a+');
fprintf(c,'%sn',Code(1:cnum));
fclose(c);newtxt.txt文本内容如图17所示:
(图17)
五.反思与体会
1.算法具有局限性。对于左右结构的字符(如:川)容易造成误识别,“川”字将会被识别
成三部分。当图片中文字有一定倾斜角度时,这将造成识别困难。
2.模板匹配效率低。对于处理大小为m×m的字符,假设有n个模板字符,则识别一个字符至
少需要m×m×n×2次运算,由于汉字有近万个,这将使得运算量十分巨大!此次字符识
别一共花了2.838秒。
3.伸缩范围比较小。对于受污染的图片,转换成二值图像将使字符与污染源混合在一起。
对于具体的图片,需反复选择合适的thresh进行二值化处理,甚至在处理之前必须进行
各种滤波。
4.通过这次数字图象处理的学习和报告的撰写,我们小组发挥了团结友爱的协作精神,大
量的资料查阅丰富了我们的视野,同时使我们对这么课更加感兴趣。
参考文献
[1] 樊昀,王润生.从图像中提取文字[J].国防科技大学学报,2002,24(1):59-62.[2] 王健,王晨.基于静态图片的文本提取技术的研究[J].延边大学学报(自然科学版), 2007,33(2):124-128.[3] 夏莹,马少平,孙茂松等.计算机语言学方法在中文文字识别后处理中的应用[J].中文信息,1996,(2):50-51.[4] 郑阿奇,曹戈,赵阳.MATLAB实用教程[M].北京:电子工业出版社
[5] 程卫国,冯峰,姚东,徐听.MATLAB5.3应用指南[M].北京:人民邮电出版社 [6] 陈杨.MATLAB 6.X图像编程与图像处理[M].西安:西安电子科技大学出版社 数字图象处理
Digital Image Progressing [7] 阮秋琦.数字图像处理[M].电子工业出版社,2001年.[8] 徐建华.图像处理与分析[M].科学出版社,1999年.附录
主程序源代码:
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%% 数字图象处理大作业 %%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%————————图片中文字的提取及识别————————%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% tic I=imread('字符.jpg');%打开图片
%figure(1);imshow(I);title('原始图像','color','b');
I=rgb2gray(I);%RGB图片转化成灰度图像 %figure(2);imshow(I);title('灰度图像','color','b');
i_max=double(max(max(I)));%获取亮度最大值 i_min=double(min(min(I)));%获取亮度最小值
thresh=round(i_max-((i_max-i_min)/3));%计算灰度图像转化成二值图像的门限thresh I=(I>=thresh);%I为二值图像
%figure(3);imshow(I);title('二值图像','color','b');
seY=[1;1;1];%构造结构元素 I=imdilate(I,seY);%腐蚀图像 I=imerode(I,seY);%膨胀图像 seX=[1 1 1];I=imdilate(I,seX);I=imerode(I,seX);%figure(4);imshow(I);title('腐蚀膨胀后的图像','color','b');
ii=double(I);[m,n]=size(ii);%获取图像大小信息 %确定文字区域 %纵向扫描
countY=zeros(m,1);for i=1:m
for j=1:n
if ii(i,j)==0 数字图象处理
Digital Image Progressing
countY(i,1)=countY(i,1)+1;
end
end end
[maxY indexY]=max(countY);tempY1=indexY;while(countY(tempY1,1)>3)&&(tempY1>1)
tempY1=tempY1-1;end
tempY2=indexY;while(countY(tempY2,1)>3)&&(tempY2 tempY2=tempY2+1;end tempY1=tempY1-1;tempY2=tempY2+1;iiY=I(tempY1:tempY2,:);%确定了Y方向上的文字区域 %figure(5);imshow(iiY);title('Y方向区域大致确定后的图像','color','b'); %横向扫描 countX=zeros(1,n);for j=1:n for i=tempY1:tempY2 if ii(i,j)==0 countX(1,j)=countX(1,j)+1; end end end tempX1=1;while(countX(1,tempX1)<3)&&(tempX1 tempX1=tempX1+1;end tempX2=n;while(countX(1,tempX2)<3)&&(tempX2>1) tempX2=tempX2-1;end tempX1=tempX1-1;tempX2=tempX2+1;iiXY=iiY(:,tempX1:tempX2);%确定了整体的文字区域 %figure(6);imshow(iiXY);title('X、Y方向区域都大致确定后的图像','color','b'); ii=(iiXY~=1);%黑色背景,白色字体 %figure(7);imshow(ii);title('背景和文字交换颜色的图像','color','b'); ii=bwareaopen(ii,200);%删除面积小于200的杂质图像 数字图象处理 Digital Image Progressing %figure(8);imshow(ii);title('删除杂质干扰的图像','color','b'); myI=charslice(ii);%限定文字区域 %figure(9);imshow(ii);title('限定文字区域的图像','color','b'); y1=10;y2=0.25;flag=0;maxnum=40;k=1;%maxnum为字符个数限定值,k用于统计实际字符个数 word=cell(1,maxnum);%建立单元阵列,用于储存字符 figure(10)while size(myI,2)>10 %当myI的长度小等于10,可确定没有字符了 [word{k},myI]=getword(myI);%获取字符 k=k+1; %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% if k==2 subplot(5,1,1);imshow(myI);title('第一次切割后的图像','color','b'); end if k==3 subplot(5,1,2);imshow(myI);title('第二次切割后的图像','color','b'); end if k==5 subplot(5,1,3);imshow(myI);title('第四次切割后的图像','color','b'); end if k==16 subplot(5,1,4);imshow(myI);title('第十五次切割后的图像','color','b'); end end subplot(5,1,5);imshow(myI);title('最后一次切割后的图像','color','b');%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% cnum=k-1;%实际字符总个数 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% figure(11);for j=1:cnum subplot(5,8,j),imshow(word{j}),title(int2str(j));%显示字符 end %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 数字图象处理 Digital Image Progressing for j=1:cnum word{j}=imresize(word{j},[40 40]);%字符规格化成40×40的 end figure(12);for j=1:cnum subplot(5,8,j),imshow(word{j}),title(int2str(j));%显示字符 end for j=1:cnum imwrite(word{j},[int2str(j),'.jpg']);%保存字符 end defx=40;defy=40;code=char('由于作者水平有限书中难免存在缺点和疏漏之处恳请读批评指正。');%创建字符集 codenum=size(code,2);%获取字符集中字符个数 for i=1:cnum ch=int2str(i);%数字转化为字符 tempbw=imread([ch '.jpg']);%打开预匹配字符 for k=1:codenum fname=strcat('C:UsersAdministratorDesktop数字图像处理大作业字符匹配库',code(k),'.jpg');%字符匹配库中的字符 sample=imread(fname); subsam=abs(tempbw-sample);%作比较 count=sum(sum(subsam));%匹配误差统计 err(k)=count; end erro=err(1:codenum); minerror=min(erro);%找出误差最小的模板字符 findc=find(erro==minerror);%获取模板字符序号 Code(i)=code(findc);%将字符装入Code end figure(13);imshow(ii);tt=title(['文字信息: ', Code(1:cnum)],'Color','b');%显示字符信息 set(tt,'fontsize',24);%设置字体 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %将图片文字写入newtxt文本 new=['newtxt','.txt'];c=fopen(new,'a+'); fprintf(c,'%sn',Code(1:cnum));fclose(c);数字图象处理 Digital Image Progressing t=toc charslice(字符分割)函数源代码: %字符分割 function y=charslice(ii)[m,n]=size(ii);top=1;bottom=m;left=1;right=n;while sum(ii(top,:))==0 && top top=top+1;end while sum(ii(bottom,:))==0 && bottom>=1 bottom=bottom-1;end while sum(ii(:,left))==0 && left left=left+1;end while sum(ii(:,right))==0 && right>=1 right=right-1;end ydiff=bottom-top;xdiff=right-left;y=imcrop(ii,[left top xdiff ydiff]); getword(字符获取)函数源代码: %字符获取 function [word,result]=getword(ii)word=[];flag=0;y1=8;y2=0.5;while flag==0 [m,n]=size(ii); wide=0; while sum(ii(:,wide+1))~=0 && wide<=n-2 wide=wide+1; end temp=charslice(imcrop(ii,[1 1 wide m])); [m1,n1]=size(temp); if wide ii(:,1:wide)=0; if sum(sum(ii))~=0 ii=charslice(ii);% 切割出最小范围 else word=[];flag=1; end else word=charslice(imcrop(ii,[1 1 wide m])); ii(:,1:wide)=0;数字图象处理 Digital Image Progressing if sum(sum(ii))~=0; ii=charslice(ii); flag=1; else ii=[]; end end end result=ii; www.xiexiebang.com 阿弥陀佛守护神的图片,怎么识别阿弥陀佛 佛教理论认为人人都是可以成佛的,所以佛经中的佛菩萨不计其数,但地位最高功德最大的就是三世佛了,而其中的横三世佛包括主管东方琉璃光世界的药师佛、主管中央婆娑世界的释迦牟尼佛和主管西方极乐世界的阿弥陀佛,他们可以说是佛教中地位最崇高的佛,本文就通过阿弥陀佛守护神的图片来说一说阿弥陀佛。 很多人都听过阿弥陀佛,因为都知道“南无阿弥陀佛”这句佛教的口头禅,的确此佛教的六字洪名的确是源于阿弥陀佛的佛号的,而根据本命佛的说法,阿弥陀佛守护属猪和属狗,被称为是这两个生肖的守护神。 我们结缘自己的本命佛最好都是正规的开光的,只有通过佛教开光仪式的本命佛才可以从缘主的运势上真正的帮助缘主。吉照堂本命佛因为开光的正规性,成就了超高的灵验度,以真正的灵性得到了缘主的信赖,这里的阿弥陀佛守护神的图片便是实物图片,可见其材质和外观的精美。 吉照堂本命佛开光后能更好的帮助缘主聚集财富和福气,让你在事业上一帆风顺,走到更好的事业巅峰。佩戴吉照堂本命佛可以去除身边的邪气灾难,更好的帮助缘主聚集天地灵气,让我们的心境也更加的开阔和光明,我们内心自然而然也会更加的愉悦和欢欣。吉照堂本命 www.xiexiebang.com 佛在默默守护你的同时,也会庇佑家人逢凶化吉,阖家安乐。 从上面我们知道了阿弥陀佛的地位,我们常说的修佛百年之后得归净土就是前往阿弥陀佛建立的西方净土世界,在那个没有烦恼、人人幸福的世界接受阿弥陀佛的指引。 从阿弥陀佛守护神的图片可以看出此佛的造像特点,就是有“卍”字,这是佛教的标准文字,象征永恒和圆满,所以造型上有此标准的佛就是阿弥陀佛。阿弥陀佛最大的功德就是建立西方的净土世界,成为每一位求佛者心向往之的地方。而且阿弥陀佛还发四十八大愿,也称为佛教的重要理论,特别是“南无阿弥陀佛”的流传就是因为此佛的大愿,意思是我愿意接受无限的光明,无限的智慧,无限的寿命。 www.xiexiebang.com 从上面阿弥陀佛守护神的图片可以看出做工的精美,无论是摆件、吊坠还是手链,都是非常美观的。而且他同时守护了生肖猪和生肖狗两个生肖,这两个生肖的缘主都是可以结缘奉请此本命佛的,佛一定会帮助您弥补运势中的不足,感知到您真心的诉求,让您心想事成。您可以根据自己对本命佛材质以及色泽的偏爱,结缘自己最喜欢的,佛教的欢喜心可以成就更多的契缘,可以让您的本命佛更加灵验,改运纳福的效果更好。 以ion, age, ness, ty, ship, ace, ance, ancy, ence, ency, dom, itude, um, mony 结尾的大都是名词; 以ize, ise, fy结尾的大都是动词; 以ive, ent, ant, ful, ous, able, ary, ic, cal, less结尾的是大都是形容词; 以ly, s, ways, wise 结尾的大都是副词。 1.名词后缀 1)-or/er/ess/crat/cis:做某件事情或职业的人或物:worker, debtor ,actress, democrat,2)-acy, 表示“性质,状态,境遇” democracy, accuracy, diplomacy 3)-ance,-ence表示“性质,状况,行为,过程,总量,程度” importance, diligence, difference, obedience 4)-ancy,-ency, 表示”性质,状态,行为,过程“ frequency, urgency, efficiency,5)-bility, 表示”动作,性质,状态“ possibility, flexibility, feasibility,6)-dom, 表示”等级,领域,状态“ freedom, kingdom, wisdom 7)-hood, 表示”资格,身份, 年纪,状态“ childhood, manhood, falsehood 8)-ion,-sion,-tion,-ation,-ition, 表示”行为的过程,结果,状况“ action, solution, conclusion, destruction, expression, correction 9)-ism, 表示”制度,主义,学说,信仰,行为“ socialism, criticism, colloquialism, heroism 10)-ity, 表示”性质,状态,程度” purity, reality, ability, calamity 11)-ment, 表示“行为,状态,过程,手段及其结果 treatment, movement, judgment, punishment, argument 12)-ness, 表示”性质,状态,程度“ goodness, kindness, tiredness, friendliness 13)-ship, 表示”情况,性质,技巧,技能及身份,职业” hardship, membership, friendship 14)-th, 表示“动作,性质,过程,状态” depth, wealth, truth, length, growth 15)-tude, 表示“性质,状态,程度” latitude, altitude(海拔) 16)-ure, 表示“行为,结果” exposure, pressure, failure, procedure(手续),17-grapy, 表示“„„学,写法” biography, calligraphy, geography 18)-ic, ics, 表示“„„学„„法” logic, mechanics, electronics, linguistics 19)-ology, 表示“„„学„„论”biology, zoology, technology(工艺学) 20)-nomy, 表示“„„学„„术” astronomy(天文学), economy, bionomy(生态学) 2.形容词后缀 (1)带有“属性,倾向,相关”的含义 1)-able,-ible, visible, flexible2)名词-ish, foolish, bookish, selfish(注意accomplish, vanish) 3)-ive, active, sensitive, productive 4)-like, manlike, childlike 5)名词-ly, manly, fatherly, scholarly, motherly 6)-some, troublesome, handsome 7)-ful, beautiful, wonderful, helpful, truthful 8)-ous, dangerous, generous, courageous, various9)-ent, violent 10)-most, foremost, topmost(11)less, 表示否定,countless, stainless, wireless 3.动词后缀 1)-ize, ise, 表示“做成,变成,„„化“modernize, mechanize, democratize, organize 2)-en, 表示”使成为,引起,使有” quicken, weaken, soften, harden 3)-fy, 表示“使„„化, 使成”beautify, purify, intensify, signify, simplify 4)-ish, 表示”使,令” finish, abolish, diminish, establish 5)-ate, 表示“成为„„,处理,作用” separate, operate, indicate 4.副词后缀 (形容词)-ly:bad→badly坏地/恶劣地,careful→carefully小心地 -wise(OE):clock→clockwise(a./adv.)顺时针方向的(地);like→likewise同样地-wards:out→outwards向外面地,north→northwards向北方地 来源第四篇:阿弥陀佛守护神的图片,怎么识别阿弥陀佛
第五篇:单词后缀整理