第一篇:数字图像模式识别
王丽霞
深圳市南山区学府路;***、lixia_2011@126.com
求职意向
数字图像处理、模式识别算法工程师 教育经历
汕头大学 电子工程系 信号与信息处理专业 硕士2007.9—2010.6 汕头市
·在校期间成绩优良,分别一次获汕头大学年度一等、二等奖学金;2008 09担任女生部部长负责统筹管理,成立特色学科及基础学科研讨组,积极开拓学生的思维并提高他们的学习成绩,更贴近社会的新路线。
潍坊学院 信息与控制工程学院 电子信息工程 学士2003.9—2007.6 潍坊市
·2007年9月以第一名成绩考入汕头大学攻读硕士研究生;在校期间担任班级学习委员负责不同类学生的学习方法指导;2004-9-2007-6担任学院文艺部部长,负责迎新晚会筹划,锻炼了团队领导能力、协调能力、临场反应能力以及创新思维。英语及专业技能
●熟练掌握了数字信号处理及它的常用算法、有良好的数学功底;熟悉图像处理的基本算法、熟悉模式识别基础知识与智能系统理论及它们的应用,在模式识别和运动跟踪方面有较深的理解;熟悉光伏应用系统的结构、性能原理;曾在核心期刊系统仿真技术发表文章(基于神经网络应用的光伏最大功率跟踪)。
●英语:六级考试 362;四级考试 473;具有较强的相关专业学科的英文文献阅读能力; ●能熟练使用计算机,会用电路仿真软件、LabVIEW软件、熟练掌握Visual C++的MFC程序设计和MATLAB仿真工具,能够做算法的设计和仿真;并能应用LabVIEW软件进行信号处理(波形测量、时频域分析与数学分析(概率统计拟合最优化等)。工作经历
2010 6-2010 8深圳市辉锐天眼科技有限公司担任核心研发工程师 ●职位为智能监控核心研发工程师
●负责计算机视觉方面的IEEE文章的讲解及不同算法的实现研究,负责机器视觉系统图像处理、分析及识别算法设计、实现,参与图像处理技术研究与设计,对已有算法进行优化改进。使用OpenCV进行背景/前景提取、检测识别、了解运动跟踪的常用算法、设计相关信号特征提取算法及其设计模式识别分类器等。项目经验
2008 09-2009 11模式识别与智能系统理论的算法研究 ●算法在MATLAB仿真,并在SIMULINK中建模,最后把这个算法用C++语言编程,在VC++中生成了可执行文件。
2009 01-2009 06生物细胞图像病变检测算法研究 ●在MATLAB中仿真了算法,正确率达到82%。
2009 07-2009 09图像压缩算法编码器设计 ●在FPGA芯片上实现并验证了方案,对比得出了FPGA比DSP在神经网络实现上的明显优势,前者采用指令顺序执行的方式,数据位宽固定,FPGA处理数据的方式是基于硬件的并行处理方式,即一个时钟周期内可并行完成多次运算,特别适合于神经网络的并行特点。2010 02在科进生物识别公司 ●了解了不同二维条码尤其QR code的特点,探讨了定位图形的方法,了解了指纹识别,探讨了小波变换及gabor变换在纹理图像的特征提取的优劣。自我评价及爱好
●很强的责任心创新能力、自学能力及应用知识能力;诚实善良,勤奋刻苦,进取精神、团队协作精神;爱好户外运动、国学研究,齐白石大师的画。
第二篇:模式识别总结
监督学习与非监督学习的区别:
监督学习方法用来对数据实现分类,分类规则通过训练获得。该训练集由带分类号的数据集组成,因此监督学习方法的训练过程是离线的。
非监督学习方法不需要单独的离线训练过程,也没有带分类号(标号)的训练数据集,一般用来对数据集进行分析,如聚类,确定其分布的主分量等。
(实例:道路图)就道路图像的分割而言,监督学习方法则先在训练用图像中获取道路象素与非道路象素集,进行分类器设计,然后用所设计的分类器对道路图像进行分割。
使用非监督学习方法,则依据道路路面象素与非道路象素之间的聚类分析进行聚类运算,以实现道路图像的分割。
1、写出K-均值聚类算法的基本步骤, 算法:
第一步:选K个初始聚类中心,z1(1),z2(1),…,zK(1),其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定,例如可选开始的K个模式样本的向量值作为初始聚类中心。第二步:逐个将需分类的模式样本{x}按最小距离准则分配给K个聚类中心中的某一个zj(1)。假设i=j时,Dj(k)min{xzi(k),i1,2,K},则xSj(k),其中k为迭代运算的次序号,第一次迭代k=1,Sj表示第j个聚类,其聚类中心为zj。第三步:计算各个聚类中心的新的向量值,zj(k+1),j=1,2,…,K zj(k1)1NjxSj(k)x,j1,2,,K 求各聚类域中所包含样本的均值向量:
其中Nj为第j个聚类域Sj中所包含的样本个数。以均值向量作为新的聚类中心,JjxSj(k)xzj(k1),2j1,2,,K可使如下聚类准则函数最小:
在这一步中要分别计算K个聚类中的样本均值向量,所以称之为K-均值算法。第四步:若zj(k若zj(k 1)zj(k),j=1,2,…,K,则返回第二步,将模式样本逐个重新分类,重复迭代运算;
1)zj(k),j=1,2,…,K,则算法收敛,计算结束。
T线性分类器三种最优准则:
wSFisher准则:maxJ(w)wSwFTbwww.xiexiebang.com>>n)的条件下,可以使用分支定界法以减少计
m算量。
15、散度Jij越大,说明i类模式与j类模式的分布(差别越大);当i类模式与j类模式的分布相同时,Jij=(0)。
16、影响聚类算法结果的主要因素有(②分类准则 ③特征选取 ④模式相似性测度。)。
19、模式识别中,马式距离较之于欧式距离的优点是(③尺度不变性 ④考虑了模式的分布)。20、基于二次准则函数的H-K算法较之于感知器算法的优点是(①可以判别问题是否线性可分 ③其解的适应性更好)。
21、影响基本C均值算法的主要因素有(④初始类心的选取 ①样本输入顺序 ②模式相似性测度)。
22、位势函数法的积累势函数K(x)的作用相当于Bayes判决中的(②后验概率 ④类概率密度与先验概率的乘积)。
23、统计模式分类问题中,当先验概率未知时,可使用(②最小最大损失准则 ④N-P判决)
24、在(①Cn>>n,(n为原特征个数,d为要选出的特征个数)③选用的可分性判据J对特征数目单调不减)情况下,用分支定界法做特征选择计算量相对较少。
25、散度JD是根据(③类概率密度)构造的可分性判据。
26、似然函数的概型已知且为单峰,则可用(①矩估计②最大似然估计③Bayes估计 ④Bayes学习⑤Parzen窗法)估计该似然函数。
27、Kn近邻元法较之Parzen窗法的优点是(②稳定性较好)。
28、从分类的角度讲,用DKLT做特征提取主要利用了DKLT的性质:(①变换产生的新分量正交或不相关③使变换后的矢量能量更趋集中)。
29、一般,剪辑k-NN最近邻方法在(①样本数较大)的情况下效果较好。d29、如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有(②分类准则 ③特征选取)。30、假设在某个地区细胞识别中正常(w1)和异常(w2)两类先验概率分别为 P(w1)=0.9,P(w2)=0.1,现有一待识别的细胞,其观察值为x,从类条件概率密度分布曲线上查得P(xw1)0.2,P(xw2)0.4,并且已知110,126,211,220
试对该细胞x用一下两种方法进行分类: 1.基于最小错误率的贝叶斯决策; 2.基于最小风险的贝叶斯决策; 请分析两种结果的异同及原因。
第三篇:模式识别简介
模式识别简介 Pattern recognition
诞生
狗的嗅觉的灵敏度非常高,大约是人的50至100倍。狗通过这项特异的功能来识别各种各样的东西,帮助人类完成一些鉴别工作。不仅如此,识别也是人类的一项基本技能,人们无时无处的在进行“模式识别”,古人有一成语“察言观色”表达的正是这个意思。
模式识别是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。计算机模式识别在20世纪60年代初迅速发展并成为一门新学科。
概念
简单来说,模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。这是模式识别的两个重要方面。市场上可见到的代表性产品有光学字符识别(Optical Character Recognition, OCR)、语音识别系统。其计算机识别的显著特点是速度快,准确性高,效率高。在将来完全可以取代人工录入。
模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
研究
模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。
应用计算机对一组事件或过程进行辨识和分类,所识别的事件或过程可以是文字、声音、图像等具体对象,也可以是状态、程度等抽象对象。这些对象与数字形式的信息相区别,称为模式信息。
模式识别所分类的类别数目由特定的识别问题决定。有时,开始时无法得知实际的类别数,需要识别系统反复观测被识别对象以后确定。
模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。
应用领域包括:计算机视觉、医学图像分析、光学文字识别、自然语言处理、语音识别、手写识别、生物特征识别、人脸识别、指纹识别、虹膜识别、文件分类、互联网搜索引擎、信用评分、测绘学、摄影测量与遥感学。以“汉字识别”为例:
识别过程与人类的学习过程相似。首先将汉字图象进行处理,抽取主要表达特征并将特征与汉字的代码存在计算机中。就像老师教我们“这个字叫什么、如何写”记在大脑中。这一过程叫做“训练”。识别过程就是将输入的汉字图象经处理后与计算机中的所有字进行比较,找出最相近的字就是识别结果。这一过程叫做“匹配”。
还有一些比较典型的应用例子如: 去雾算法:
由有雾的图片处理成无雾的过程用的是一种基于暗影通道的去雾算法。相机照出的相片=真实相片*透谢分布率+天空亮度。这里要做的就是根据公式求出真实相片,另外三个未知量是可以求出来的。
交叉验证方法:
用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据进行分组,一部分做为训练集,另一部分做为验证集,首先用训练集对分类器进行训练,在利用验证集来测试训练得到的模型,以此来做为评价分类器的性能指标。
纹理:
在自然图象中,纹理作为物体的一种重要外观特征,为视觉感知提供了无处不在的信息,它在计算机视觉、图形学、图像编码等领域都有着重要作用,例如,格式塔(Gestalt)心理学,早期视觉理论和Marr的原始简约图(Primal Sketch)都将纹理模式作为中心话题。
因此,对纹理的理解是视觉理解不可或缺的组成部分。过去的几年里,纹理分析和合成的相关研究工作在基础理论上与实际应用两个方面都取得了振奋人心的发展,研究者结合计算机视觉,图形学,现代统计物理,心理学和神经系统科学等领域的知识,提出了很多关于纹理理解的新方法。纹理的研究工作主要集中在两个领域:滤波理论(filtering theory)和统计建模(statistical modeling)理论。滤波理论来源于在神经生理学中被发现并被广泛接受的多通道滤波机制,该机制认为,人类视觉系统将视网膜图像分解为一组子带(sub-band)图像信号,而这些子带信号可以通过一组线性滤波器和图像卷积然后经过某些非线性操作计算得到。滤波理论在纹理方面的应用主要有 Gabor 滤波器和小波(wavelet)塔等,它们在纹理分割和分类中有良好的性能。统计建模理论认为,纹理图像是随机场上概率分布的采样,该理论涉及到时间序列模型(time series model),马尔可夫链(Markov chain)模型和马尔可夫随机场(Markov random Field,MRF)模型等建模方法。基于统计的建模方法一般只需要用很少几个参数来描述纹理特征,因此能为纹理提供简练的表示,而且它能把纹理分析问题转化为一个明确的统计推理问题来处理。
计算机视觉研究中低层视觉的一个主要研究方向是图像分割。由于一个场景中,不同的物体之间有不同层度的交叠,使得最理想的分割结果也会出现物体的不同部分(可视部分)之间分割开来,而不可视部分则为其它物体所覆盖的情况,这就不利于完整地展现物体。因此,有必要利用由图像得到的相关信息,如原始简约图(Primal Sketch)、颜色一致性、方位一致性等,研究一套算法,把同一物体分在同一个层里面,然后再把它们相应的部分之间连接起来,组成完整的物体。这就是2.1D Sketch的主要研究任务。
2.1D Sketch主要研究面物体,且不关心物体之间的深度信息,而只考虑它们之间的偏序关系(Partial Order)。
2.1D Sketch的研究成果将会用于图像分割、图像编辑、艺术图像生成以及图像序列分析中。
机器学习:
机器学习是人工智能的一个分支,它是关于让机器具有学习能力的一些算法。许多情况这种算法给一些数据和从这些数据属性的推出的信息对将来出现的新的数据做出预测。之所以可以这么做是因为大多数的非随机的数据包含一些模式,这些模式可以让机器去做泛化。
机器学习的相关概念扫盲:
监督式学习:训练数据中包含输入的向量集合并且有相应的目标值(labeled样例)
例如分类(Classification)、关联规则、回归(Regression)非监督式学习:训练数据中不包含labeled样例
例如聚类(Cluster)、Density estimation、Visualization.半监督式学习:组合了labled和unlabeled的Example去生成一个函数或分类
泛化(Generalization):通过训练数据训练之后能够识别新的数据。特征提取(Feature Extraction): 为了降维去除不想关的特征,在数据预处理阶段把数据转化成容易处理的。
机器学习的局限性:
机器学习在大量的模式面前的泛化能力是不同的,如果一个模式不同于以前所看到的,那么这个算法很容易被误解。由于当前的数据量不够,不能涵盖各种将来的情况,所以机器学习的方法很容易出现过度泛化,从而出现不准确性。
AdaBoost人脸检测原理:
一种基于积分图、级联检测器和AdaBoost 算法的方法,方法框架可以分为以下三大部分: 第一部分,使用Harr-like特征表示人脸,使用“ 积分图”实现特征数值的快速计算;第二部分,使用Adaboost算法挑选出一些最能代表人脸的矩形特征(弱分类器),按照加权投票的方式将弱分类器构造为一个强分类器;第三部分,将训练得到的若干强分类器串联组成一个级联结构的层叠分类器,级联结构能有效地提高分类器的检测速度。
总结
自20世纪50年代以来,模式识别在人工智能兴起后不久就迅速发展成一门学科。它所研究的理论和方法在很多科学和技术领域得到广泛重视,推动了人工智能系统的发展,扩大了计算机应用的可能性。
经过多年的研究和发展,模式识别技术已广泛被应用于人工智能、计算机工程、机器学、神经生物学、医学、侦探学以及高能物理、考古学、地质勘探、宇航科学和武器技术等许多重要领域,如语音识别、语音翻译、人脸识别、指纹识别、手写体字符的识别、工业故障检测、精确制导等。模式识别技术的快速发展和应用大大促进了国民经济建设和国防科技现代化建设。
第四篇:模式识别国家重点实验室
模式识别国家重点实验室
模式识别国家重点实验室,于1984年由国家计委批准筹建,1987年通过国家验收并正式对外开放。依托于中国科学院自动化研究所。实验室第一任主任是现任国家科技部副部长的马颂德研究员,现任主任为谭铁牛研究员。实验室现有固定人员22人,平均年龄37.8岁,科研骨干均具有博士学位。实验室流动人员包括博士后、在读博士生与硕士生、高级访问学者及客座研究人员。实验室计划发展规模为固定人员25-30人,流动人员100人左右。
实验室以“面向世界、面向未来,开展前瞻性的基础研究;立足国内,面对现实,推进定向性的应用研究与技术开发”为发展战略,追求个人事业与集体事业共同协调发展,力争成为具有国际水准的科学研究、技术创新和高科技人才培养基地。
实验室目前的主要研究方向为模式识别、计算机视觉、图像处理与图形学,口语信息处理、自然语言处理以及模式识别应用与系统等。
实验室目前承担了三十余项科研项目,其中包括国家重点基础研究规划“973”项目(图象、语音、自然语言理解与知识发掘),国家基金委重大、重点项目,国家杰出青年科学基金项目,国家攻关项目,国家高技术计划“863”项目,国家基金委面上项目及国际合作项目等。
实验室成员每年在国内外重要的学术期刊和国际学术会议上发表论文百余篇,其中不少发表在国际权威刊物与国际重要会议上,如IEEE汇刊(PAMI等),International Journal of Computer Vision, Pattern Recognition, Image and Vision Computing,Automatica, EuroSpeech, ICSLP, ICASSP, ICCV, ICPR, ACCV等。
近年来,实验室已获准和申请发明专利26项,获国家科技进步二等奖1项,中科院自然科学二等奖2项,其它部委级三等奖3项,国际发明金奖与世界知识产权专项奖各1项。
实验室在开展国际国内学术交流与合作方面,有着优良的传统。实验室借各种机会,积极组织学术交流,每年一批在美国、法国、德国、日本、英国、新加坡等地工作的优秀中国留学生,定期到实验室从事短期客座研究,来自美国、加拿大、英国、法国、日本等二十多个国家或地区的知名学者到实验室做学术报告达几十人次。实验室通过中科院自动化所和法国国立信息与自动化研究院(INRIA)成立了“中法信息、自动化与应用数学联合实验室”,与香港科技大学成立了信息技术联合实验室。实验室成员积极参与国内外学术组织的工作,担任许多国内外学术期刊的主编、副主编或编委,以及国际重要学术会议的大会主席或程序委员会委员等。
实验室十分重视与高新技术企业的交流与合作,希望通过与社会资源的有效组合,促进成果转化,为我国的经济建设和社会发展服务!
主页链接:http://
第五篇:模式识别课程报告
模式识别文献综述报告
一,文献综述报告
阅读至少5篇论文(最好包含1篇英文论文;自己去学校电子图书馆下载,考虑中国知网;IEEE,Elsevier等数据库),写一篇文献综述报告。
1.选题不限,可以是任何一种模式识别算法(例如k-means,kNN,bayes,SVM,PCA,LDA等),阅读所选题方面的相关文献(论文都是关于一个主题的,例如都是svm算法方面的)。
2.写一份文献综述报告,包括:每篇论文主要使用什么算法实现什么,论文有没有对算法做出改进(为什么改进,原算法存在什么问题,改进方法是什么),论文中做了什么对比试验,实验结论是什么?注意,尽量用自己的话总结,不要照抄原文。可以加入自己的分析和想法,例如这篇论文还存在什么问题或者缺点,这篇论文所作出的改进策略是否好,你自己对算法有没有什么改进的想法?
3.把阅读的参考文献写在报告后面。(包括:作者;论文名称;期刊名称;出版年,卷号(期号),页码。例如:[1] 赵银娣,张良培,李平湘,一种纹理特征融合分类算法,武汉大学学报,信息科学版,2006,31(3):278-281.)
二、写一下学习这门课的心得体会(占分数)。
学习这门课有什么收获?老师在教学中还应该加入些什么教学内容?或者有哪些教学内容需要删减?需要调整?对于作业(上机实验)内容有什么意见和建议?目前内容过多过难还是适中?你希望出什么样的上机题目(可以得到好的锻炼和能力的提高)?完成作业过程中有什么收获和体会?有没有对模式识别或者某种模式识别的算法比较感兴趣?有什么想法?