第一篇:气动机器人有关文献解读(模版)
气动机器人文献资料
机器人是自动执行工作的机器装置。它既可以接受人类指挥,又可以运行预先编排的程序,也可以根据以人工智能技术制定的原则纲领行动。它的任务是协助或取代人类工作的工作,例如生产业、建筑业,或是危险的工作。
它是高级整合控制论、机械电子、计算机、材料和仿生学的产物。在工业、医学、农业、建筑业甚至军事等领域中均有重要用途。
现在,国际上对机器人的概念已经逐渐趋近一致。一般来说,人们都可以接受这种说法,即机器人是靠自身动力和控制能力来实现各种功能的一种机器。联合国标准化组织采纳了美国机器人协会给机器人下的定义:“一种可编程和多功能的操作机;或是为了执行不同的任务而具有可用电脑改变和可编程动作的专门系统。”它能为人类带来许多方便之处。
机器人能力的评价标准包括:智能,指感觉和感知,包括记忆、运算、比较、鉴别、判断、决策、学习和逻辑推理等;机能,指变通性、通用性或空间占有性等;物理能,指力、速度、可靠性、联用性和寿命等。因此,可以说机器人就是具有生物功能的实际空间运行工具,可以代替人类完成一些危险或难以进行的劳作、任务等。
机器人一般由执行机构、驱动装置、检测装置和控制系统和复杂机械等组成。一执行机构 即机器人本体,其臂部一般采用空间开链连杆机构,其中的运动副(转动副或移动副)常称为关节,关节个数通常即为机器人的自由度数。根据关节配置型式和运动坐标形式的不同,机器人执行机构可分为直角坐标式、圆柱坐标式、极坐标式和关节坐标式等类型。出于拟人化的考虑,常将机器人本体的有关部位分别称为基座、腰部、臂部、腕部、手部(夹持器或末端执行器)和行走部(对于移动机器人)等。二驱动装置
是驱使执行机构运动的机构,按照控制系统发出的指令信号,借助于动力元件使机器人进行动作。它输入的是电信号,输出的是线、角位移量。机器人使用的驱动装置主要是电力驱动装置,如步进电机、伺服电机等,此外也有采用液压、气动等驱动装置。三检测装置的作用
是实时检测机器人的运动及工作情况,根据需要反馈给控制系统,与设定信息进行比较后,对执行机构进行调整,以保证机器人的动作符合预定的要求。作为检测装置的传感器大致可以分为两类:一类是内部信息传感器,用于检测机器人各部分的内部状况,如各关节的位置、速度、加速度等,并将所测得的信息作为反馈信号送至控制器,形成闭环控制。一类是外部信息传感器,用于获取有关机器人的作业对象及外界环境等方面的信息,以使机器人的动作能适应外界情况的变化,使之达到更高层次的自动化,甚至使机器人具有某种“感觉”,向智能化发展,例如视觉、声觉等外部传感器给出工作对象、工作环境的有关信息,利用这些信息构成一个大的反馈回路,从而将大大提高机器人的工作精度。四控制系统有两种方式
一种是集中式控制,即机器人的全部控制由一台微型计算机完成。另一种是分散(级)式控制,即采用多台微机来分担机器人的控制,如当采用上、下两级微机共同完成机器人的控制时,主机常用于负责系统的管理、通讯、运动学和动力学计算,并向下级微机发送指令信息;作为下级从机,各关节分别对应一个CPU,进行插补运算和伺服控制处理,实现给定的运动,并向主机反馈信息。根据作业任务要求的不同,机器人的控制方式又可分为点位控制、连续轨迹控制和力(力矩)控制。
中国的机器人专家从应用环境出发,将机器人分为两大类,即工业机器人和特种机器人。所谓工业机器人就是面向工业领域的多关节机械手或多自由度机器人。而特种机器人则是除工业机器人之外的、用于非制造业并服务于人类的各种先进机器人,包括:服务机器人、水下机器人、娱乐机器人、军用机器人、农业机器人、机器人化机器等。在特种机器人中,有些分支发展很快,有独立成体系的趋势,如服务机器人、水下机器人、军用机器人、微操作机器人等。目前,国际上的机器人学者,从应用环境出发将机器人也分为两类:制造环境下的工业机器人和非制造环境下的服务与仿人型机器人,这和中国的分类是一致的。
空中机器人又叫无人机器,近年来在军用机器人家族中,无人机是科研活动最活跃、技术进步最大、研究及采购经费投入最多、实战经验最丰富的领域。80多年来,世界无人机的发展基本上是以美国为主线向前推进的,无论从技术水平还是无人机的种类和数量来看,美国均居世界之首位。气动技术简介
气动技术,全称气压传动与控制技术,是生产过程自动化和机械化的最有效手段之一,具有高速高效、清洁安全、低成本、易维护等优点,被广泛应用于轻工机械领域中,在食品包装及生产过程中也正在发挥越来越重要的作用。气动技术用途宇宙开发,姿态控制,生命维持系统,医疗器械,气垫床,人造心脏,省力产业机器人,真空搬运,住宅产业,空气门,气控喷涂,空气幕帘,空调,计量设备,气动量仪,液面检测装置,纺织,气动精纺,化学工业,过程控制,液化气体,控制,可动元件,纯流体元件,海洋开发,水中空气呼吸器,海底送气系统,潜水,车辆,气动门,气动离合器,气动刹车,空气轮胎,矿山业风镐(凿岩机),造船,防暴控制,气垫船,气动工具,气动研磨机,空气铆钉枪,空气锤,农业,空气消毒,喷雾防虫,娱乐产业 空气枪,空气垫、充气帐篷、充气船、运输,空气传送带、工业机械、机床的自动控制、食品机械自控制、包装机械的自动控制、冲压机械的自动控制等。
气动技术应用的最典型的代表是工业机器人。代替人类的手腕、手以及手指能正确并迅速的做抓取或放开等细微的动作。除了工业生产上的应用之外,在游乐场的过山车上的刹车装置,机械制作的动物表演以及人形报时钟的内部,均采用了气动技术,实现细小的动作。液压可以得到巨大的输出力但灵敏度不够;另一方面要用电能来驱动物体,总需要用一些齿轮,同时不能忽视漏电所带来的危险。而与此相比,使用气动技术即安全又对周围环境无污染,即使在很小的空间里,也可以实现细小的动作。如果尺寸相同,其功率能超过电气。与此特性所带来的需求完全相一致的就是半导体产业。在生产线上,实现前进、停止、转动等细小简单的动作,在自动化设备中不可或缺。在其它方面,如制造硅晶片生产线上不可缺少的电阻液涂抹工序中使用的定量输出泵以及与此相配合的周边机器。气动机器人是多自由度的机电气一体化系统, 影响其定位精度的因素有两个方面: 一是数学模型是否准确;二是实现数学模型的控制系统、检测系统定位装置及执行机构的度是否满足要求.所以正确建立其数学模型对定位精度的分析与提高有着重要的意义,以前多数文献在建立机器人的误差数学模型时, 把构件视为刚体, 视运动副没有间隙.而实际上机器人的构件有加工误差装配误差, 在运动过程中有摩擦和摩损, 运动副的间隙会增大.而构件有弹性, 在惯性力、重力和外载荷作用下产生的弹性变形也会引起误差而气动机器人由于压缩空气在力作用下还会产生很大的位移误差。
压缩空气驱动的机器人, 既经济、清洁, 又防火,其制造费和使用费仅为电驱动及液压驱动机器人的3 % 一25 %.因此特别适合我国及第三世界使用.但是气动机器人的冲击大, 不易任意位置准确定位及连续轨迹控制.因此目前仅用作简单的装卸与搬运作业.如果研究解决好经济型气动机器人的任意位置准确定位及连续控制问题, 就能扩大它的通用性和使用范围, 加以它的经济性优势, 在国内外市场上将会有很大的竞争潜力和发展。因此研究和解决经济型气动机器人的任意位置准确定位及提高定位精度的方法与装置, 有着重要的现实和长远的意义
高精度的压力控制, 在许多方面有着广泛的应用,如用于压力表和压力传感器的标定、模拟潜艇或水下机器人在水中的深度变化等[ 1]。传统的压力控制, 常常是通过电液伺服阀来实现的[ 2]。由于压力源的压力波动或电液伺服阀自身的控制灵敏性问题, 实现高精度的压力控制是非常困难的。本文所研究的高精度压力控制系统, 是基于密闭液体的体积变化与压力变化之间呈反比的特性, 通过强制改变密闭液体体积, 实现压力筒内部压力的大范围、高精度的连续控制。2 系统的组成及工作原理
系统由压力筒、强制改变密闭液体体积的机械系统、计算机控制系统和数字式压力传感器组成。机械系统由伺服电机、谐波减速器、滚珠丝杆、螺母驱动的活塞杆、压力筒组成, 见图1。伺服电机根据计算机控制系统发来的控制信号, 通过谐波减速器控制滚珠丝杆的回转运动, 往复运动的螺母带动活塞杆实现伸缩运动。插入压力筒内的活塞杆的伸缩运动使压力筒内的密闭液体的体积发生变化, 从而导致压力筒内的压力发生改变, 进而实现压力筒内部的压力控制。计算机控制系统由工控机、检测压力筒压力的高精度压力传感器、A/ D 卡、D/A 卡、伺服电机控制模块等组成, 如图2 所示。工控机根据操作人员的设定信息, 通过D/ A 卡、伺服电机控制模块对伺服电机进行控制及驱动。伺服电机则通过减速器驱动电动缸活塞杆的伸缩, 使压力筒内的压力发生变化。高精度的压力传感器将压力信息反馈给计算机, 构成闭环控制回成工艺循环。
微细加工技术、微传感器技术、微电子技术和微机电系统(MEM S)集成技术的发展为研究开发柔性主动内窥镜检查系统提供了有利条件, 研制开发少创或无创介入的诊查微机器人系统也是医用机器人发展的一个重要方向。目前, 医疗机器人按驱动方式有: 电磁驱动式、压电驱动式、气动式以及通过功能材料形状记忆合金驱动等几种, 按移动机构可分为腿式、轮式及蠕动移动等方式, 与人体直接接触的医用机器人要求柔性接触, 因此柔性蠕动式为无创微创进入人体腔道诊察机器人的首选方式[ 7]。气动机器人系统由于气体的可压缩性而具有柔性, 为此,研制了具有柔性的气动机器人系统用于人体腔道内环境诊查和治疗, 设计了该机器人的电-气控制系统, 控制机器人的移动,实现诊疗任务。气动机器人移动
1)后支撑单元钳位。后气囊充气后紧压气管壁, 固定不动, 前支撑单元气囊不充气, 处于放松状态。
(2)驱动器伸长。驱动3气室通气使驱动器伸长, 推动前支撑单元前移一步。
(3)前支撑单元钳位。使前气囊充气紧压气管壁, 固定不动。(4)后支撑单元放松。后支撑单元放气阀打开, 气囊放气, 脱离气管壁。(5)驱动器收缩。驱动器在张力作用下收缩复位, 并带动后支撑单元通过前移一步。
(6)后支撑单元钳位。使由后支撑单元气囊充气, 紧压气管壁, 也处于钳位状态。通过(1)~(6)完成一个循环, 机器人前移一步。2 电-气控制系统
电-气控制系统主要由PC 计算机、数据采集转换设备、隔离放大驱动电路、10个继电器、10个电磁阀、压力传感器、高压气源及压力、流量调阀组成。采集转换设备采用了N I公司生产的USB-6008, 该数据采集卡具有8通道、12或14位模拟输入、2个模拟输出、12路I /O, 以及1个定时器, 通过该卡控制10个继电器的通、断, 从而实现对连接机器人通气管路的电磁阀的开闭控制, 及机器人治疗传感机构的控制, 通过该卡实现通气管道压力传感器及机器人携带的传感器的信息采集。电子气动机器人
电子气动机器人系统系采用模块化结构设计技术、精选国外工程用优良元器件、集控制)检测)执行等于一体的综合性实验装置。电子气动机器人系统由控制模块(基本模块)和操作机模块构成: 控制模块由FX2N 系列PLC、F940GOT 人机界面及输出输入接口板组成;操作机模块由电子气动机器人、基本气动回路实验模块及相应接口板组成。图1a 所示为电子气动机器人系统结构组成。要求该控制系统具有手动运行模式、原点回归模 式和自动运行模式。手动模式: 按动各开关按钮, 气缸可作相应手动控制;原点模式: 按回原点按钮气缸回原点位置, 前臂(垂直气缸)处在上升的极限位置, 后臂(水平气缸)处在缩进的极限位置, 旋转缸处在逆时针转动的极限位置, 气手指松开;自动模式: 在完成回原点操作后, 将模式开关切换至自动模式, 此时按启动按钮可实现自动运行, 按停止按钮, 机器人将在1 个循环工作结束后停止。
电子气动机器人控制系统
根据工艺要求, 以及考虑到本系统作为教学设备需具有较大扩展余量, 选用FX2N-48MR 型PLC 主单元。另外, 控制系统选用了F940GOT 人机界面, 有关控制的输入、输出信息、工作状态等都可以通过F940GOT 实现, 节省了可编程控制器的输入、输出触点, 配线简单, 性价比高, 操作方便、直观。高精度的压力控制, 在许多方面有着广泛的应用,如用于压力表和压力传感器的标定、模拟潜艇或水下机器人在水中的深度变化等[ 1]。传统的压力控制, 常
常是通过电液伺服阀来实现的[ 2]。由于压力源的压力波动或电液伺服阀自身的控制灵敏性问题, 实现高精度的压力控制是非常困难的。本文所研究的高精度压力控制系统, 是基于密闭液体的体积变化与压力变化之间呈反比的特性, 通过强制改变密闭液体体积, 实现压力筒内部压力的大范围、高精度的连续控制。
读书的好处
1、行万里路,读万卷书。
2、书山有路勤为径,学海无涯苦作舟。
3、读书破万卷,下笔如有神。
4、我所学到的任何有价值的知识都是由自学中得来的。——达尔文
5、少壮不努力,老大徒悲伤。
6、黑发不知勤学早,白首方悔读书迟。——颜真卿
7、宝剑锋从磨砺出,梅花香自苦寒来。
8、读书要三到:心到、眼到、口到
9、玉不琢、不成器,人不学、不知义。
10、一日无书,百事荒废。——陈寿
11、书是人类进步的阶梯。
12、一日不读口生,一日不写手生。
13、我扑在书上,就像饥饿的人扑在面包上。——高尔基
14、书到用时方恨少、事非经过不知难。——陆游
15、读一本好书,就如同和一个高尚的人在交谈——歌德
16、读一切好书,就是和许多高尚的人谈话。——笛卡儿
17、学习永远不晚。——高尔基
18、少而好学,如日出之阳;壮而好学,如日中之光;志而好学,如炳烛之光。——刘向
19、学而不思则惘,思而不学则殆。——孔子
20、读书给人以快乐、给人以光彩、给人以才干。——培根
第二篇:机器人文献综述
文献综述
摘要
目前有关并联机器人精度方面的研究工作还比较薄弱,为采取有效措施提高并联机构的精度,通过对3-RRR并联机器人机构的分析,针对传统D-H参数法的局限性,采用微分理论,建立了该并联机器人机构的精度模型,通过计算机仿真,针对单条支链多个结构参数误差,比较全面的分析了结构参数对输出位姿误差以及位姿变化对机器人机构精度的影响。分析结果为:机构中所有结构误差随着X轴正向增大而单调增大;运动支链在关节转角处的误差单调上升的比其他结构快。为该机器人机构实际误差补偿与控制提供了理论依据。
关键词
3-RRR 并联机器人
精度
一、发展趋势
由于20世纪70年代机电一体化技术的不断发展和广泛应用,使传统意义上的机器和机构的概念已有很大的发展。“现代机械”概念的形成成为机构学发展的一个新的里程碑,可以毫不夸张地说,现代机构学正在逐步形成。机构学中不断新内容、新方法、新理论正有待于我们去研究。现代机构的类型综合和设计方法将会不断展开,逐步深入。将机构扩大为驱动元件与机构的集合将会大大有利于机构的创新和机构运动控制的研究和应用。对驱动元件进行可编程控制即可实现复杂多变的输出运动,使原来“刚性化”的输出发展成“柔性化”输出,从而使机构有了质的变化,有利于设计现代机械。现代机构已经在实际中得到应用,但对它的类型综合、运动学、动力学的研究才刚刚起步,有待深入。可以预期,现代机构学将会深入研究和广泛应用。机械系统的动力特性及动态稳定性将提高,现代机械向高速、高精度、高可控方向发展,通过机械系统的动力学建模及解法的研究、动力分析和综合的研究,它将大大提高现代机械的设计水平的工作性能。
二、并联机器人构型设计准则
1、在进行机构形式设计时,除了要满足规定的运动形式、运动规律或运动轨迹外,还应该遵循下面几项准则:
(1)机构的运动链要尽可能的短。完成同样的动作要求,应该优先选用机构构件数和运动副数少的机构,以简化其结构从而减轻重量、降低成本、减少由于零件的制造误差而形成的运动链的积累误差,运动链短有利于提高机构的刚度,减少振动。
(2)在运动副的选择上,优先选用低副。低副机构的运动元素加工方便,容易保证配合的精度以及有较高的承载能力。
(3)适当选用原动机,使机构有好的动力学性能。
2、并联机器人的尺度设计原则
以往,我们在设计阶段为了确定机器人操作手机构的尺寸和确定机器人操作手在工作空间内部的位置和姿态时多数是靠经验和直觉。现在,为了开发出高精度、高速度和高效率的并联机器人,我们在机构的综合设计时要考虑到它的工作空间的体积和形状、奇异位形、输出的各向同性等条件。但是,在全局最优的机构尺度综合设计中,顾全到上述的所有条件是十分困难的。国内外的学者提出了许多机构综合的标准,以便在满足指定的设计指标下,机构的性能达到最优。由于并联机器人与串联机器人相比,工作空间小。因此为实现作业要求,在设计时要先确定能够满足性能指标的工作空间是至关重要的。
另外,在并联机构的设计过程中必须要考虑避免构型奇异。与串联机器人不同的是,并联机器人不仅有运动学奇异,还有由构型所导致的构型奇异。即奇异区域通常都扩张到整个工作空间或一些显著的子空间,而且是实际操作中最常用的区域。O.M给出了判定并联机构发生构型奇异的条件:(1)如果动平台和定平台是相似的正多边形,并且每一对相应的顶点通过一条连杆相连,则雅戈比矩阵在工作空间内的大部分区域都是奇异的。(2)如果动平台和定平台是相似的非正多边形,并且每一对相应的顶点通过一条连杆相连,则雅戈比矩阵在工作空间内的大部分区域都是奇异的。这种设计上的奇异的存在,将使并联机器人由于无法平衡施加在动平台上的负载而不能工作。在构型奇异附近的区域,即使没有发生构型奇异,也有可能出现雅戈比矩阵条件数很大的情况,同样会导致运动和力的传递性能变的很差,我们称这种区域为病态条件区域。因此,进行并联机构尺度综合设计时必须考虑在满足工作空间要求、运动可传递性的要求以及负载能力要求的情况下,要避开构型奇异点及奇异点附近的病态区域。
三、并联机构的设计方法
应用影响系数法求解了弹性铰平面并联3-RRR机器人的一阶、二阶影响系数,借助虚功原理建立了包含主、被动铰链弹性变形,杆件及其平台自重的连续刚度映射模型。与以往刚度模型区别在于,该连续刚度模型考虑了机构刚度变化的动态过程,从而使并联机器人刚度非线性映射还原。文中还结合刚度矩阵瑞利商定义了连续刚度判定指标,绘制了刚度性能空间图,进一步探讨了该机构的方向刚度特性,为平面并联弹性铰机器人机构刚度的分析提供了一种新颖通用的方法。
刚度是并联机构重要性能指标,为了评价并联机构刚度,提出了一种刚度评价方法。基于3-RRR机构的逆运动学模型,推导出其雅可比矩阵。在力雅可比矩阵的基础上,给出了刚度评价指标,该指标不仅适用于3-RRR并联机构,而且可以应用于其它并联机构。将提出的刚度指标应用于3-RRR并联机构,数值仿真结果表明3-RRR机构在工作空间中具有对称的刚性。
平面柔性并联机构具有柔性机构和少自由度并联机构两者的优点,是当前研究的热点之一。提出并验证一种简单、有效的平面柔性3-RRR并联机构自标定方法。从误差建模出发,利用矢量链法推导出标定参数辨识方程。借助静平台上的标准定位圆孔,通过仪器对拉线式编码器(线尺)进行标定,进而利用线尺在线地测量、记录机构运行中的实际位姿,结合数控系统中的理论轨迹,辨识出系统模型误差。根据辨识结果对控制模型进行补偿,使平面柔性3-RRR运动平台轨迹误差得到了明显的减小,有效提高了机构的精度,完成了利用线尺进行机构自标定方法的研究。由于测量工具和建模方法通用性强,且具有在线实际位姿测量能力,该试验研究为平面柔性少自由度并联机构的自标定提供了一种切实可行的解决途径,同时为全闭环控制提供了可行的测量方法。
导出了3-RRR平面并联机构基于守恒协调转换刚度矩阵机构刚度结构位形部分的解析表达式和外力作用影响部分的不完全解析表达式.给出了求机构刚度映射的一般方法,求出了不同参数下3-RRR平面并联机构的刚度映射曲线,并对机构的刚度特性进行了分析和讨论.研究发现,3-RRR平面并联机构的刚度是机构构型的函数,并与驱动力和关节刚度成比例;动平台中心趋于工作空间边界刚度增大,在工作空间的边界附近形成一个刚度较强的环状区域,而在工作空间的内部形成一个刚度较弱的区域.基于螺旋理论分析了一种3-RRR并联机构的自由度和构型.通过分析动平台和各分支机构的约束螺旋系,构造3-RRR串联分支,运用修正Crübler-Kutabath公式计算出其自由度满足3个转动自由度.基于虚拟样机技术建立3-RRR并联机构虚拟仿真模型,进行正向运动学仿真和工作空间分析,从而找到该机构存在的缺陷,为少自由度并联机构运动学和动力学分析提供保证。
分析了平面3-RRR三自由度并联机构中存在的过约束及其有害影响,详细讨论了在保证3-RRR并联机构平面运动特性的情况下无过约束自调结构的设计问题,得出了几种新的平面三自由度并联机构运动副配置方案,深入分析了2-RCS-RRR结构的自调特性。
四、并联机构研究中存在的问题
目前,国内外关于并联机构的研究主要集中于机构学、运动学、动力学和控制策略等方面。其中并联机构的机构学与运动学主要集中在机构的运动学问题、奇异位形、工作空间和灵巧度分析等方面。并联机构机构学与运动学的研究在并联机构的研究中占有重要的基础地位,是实现并联机器人、并联机床等控制和应用的基础。动力学分析及控制策略的研究主要是对并联机构进行动力学分析和建模,并且研究利用各种可能的控制算法,对并联机器人、并联机床等实施控制,从而达到期望的控制效果。从大量的关于并联机构的研究文献可以看出,近十余年来,关于并联机器人各方面的研究工作都取得了很大的进展。但是,还有大量的工作需要进一步研究和开展,主要有以下几个方面:(1)进一步研究并联机器人机构的型数综合,寻求结构更加合理、适合不同用途的并联机构,使并联机构的运动学和动力学模型变得简单,同时考虑深入研究多种约束条件的并联机构优化设计方法。(2)加强位置正解的研究,使位置正解更加简单。寻找简化精度补偿、工作空间和奇异位形的方法。(3)加强并联机构的动力学研究。(4)进一步加强串并联机器人的研究,充分利用串联和并联机构的优点,实现功能强、特性好、类型广的新型机器人。(5)加强少自由度并联机构的研究,特别是动力学、精度标定、系控制、机构结构的优化设计等问题,是目前和今后少自由度并联机器人机构研究和发展的方向。
参考文献
【1】 赵延治 张洁 赵铁石 弹性铰平面并联三自由度机器人连续刚度映射研究 燕山大学学报 2008年04期
【2】 魏轩 吴军 3-RRR平面并联机构刚度分析 机械设计与制造 2009年09期
【3】 邵珠峰 唐晓强 王立平黄鹏平面柔性3-RRR并联机构自标定方法 机械工程学报 2009年03期
【4】 李树军 3-RRR平面并联机构的刚度特性分析 东北大学学报(自然科学版)2007年01期
【5】 刘大炜 王立平基于工作空间的4RRRR冗余并联机构支链优化 清华大学学报(自然科学版)2010年08期
【6】 钟相强 高洪 基于螺旋理论的3-RRR并联机构设计与仿真 安徽工程大学学报 2011年03期
【7】 刘步才 陈劲杰 刘子召 刘振华 3-RRR并联机器人的精度分析与仿真 工业控制计算机 2011年12期
【8】 黄勇刚 黄茂林 杜力 冉瑞利平面3-RRR并联机构过约束分析及自调机构设计 中国机械工程 2006年03期
【9】 贺永刚 基于运动功能的少自由度串并联机构创新设计方法的研究 华中科技大学机械设计理论硕士论文 2008年05期
【10】 刘善增 并联机器人的研究进展和现状【J】 组合机床与自动化加工技术 2007年08期
【11】 戴巍 六自由度并联机器人运动学分析 东北大学机械设计理论硕士论文 2006年05期
【12】 黄真 李秦川 少自由度并联机器人机构的型综合原理【J】 中国科学 2003年33期
第三篇:文献综述-机器人通信
文献综述
题 目 未知环境中多机器人通信技术研究 姓 名 杜帅锋 专 业 通信工程 学 号 201251004 指导教师 邵杰
郑州科技学院信息工程学院
二〇一六年三月
目录
1前言.............................................................................................................................1
1.1概述..................................................................................................................1 1.2 设计研究的背景意义.....................................................................................1 2多机器人通信方式.....................................................................................................2
2.1多机器人通信方式介绍..................................................................................2 2.2基于多机器人通信模型研究.........................................................................2
2.2.1机器人通信访问协议.........................................................................3 2.2.2智能体通信方式.................................................................................3
3基本通信模式.............................................................................................................4
3.1C/S模型...........................................................................................................4 3.2基于Zigbee通信...........................................................................................4 3.3云计算多机器人.............................................................................................5 4国内外研究状态与水平.............................................................................................5 5 多机器人通信系统研究展望....................................................................................6 致谢................................................................................................................................7 参考文献........................................................................................................................7
1前言
目前,机器人技术是近年来发展起来的一门综合学科,集中了机械、电子、计算机、自动控制等多学科最新研究成果,代表了机电一体化的最高成就。随着机器人技术的发展,机器人的能力不断提高,机器人应用领域也不断开拓,尤其是一些危险的、特殊的领域人们对其“智能”的要求也日益提高,由于单机器人的局限性,一些复杂任务需要通过多机器人协调来完成,要求多机器人之间具有协作能力。主要通过书籍和网络文献了解国内外群体机器人协调工作中通信技术研究历史和现状。
1.1概述
本文的主要研究内容如下:主要介绍了多机器人通信研究发展历史与研究现状,指出了论文的课题背景。介绍了国内外多机器人通信的各种通信方式,并重点介绍了三种主流的群体机器人通信方式,并以此引出两种实验与仿真。对全文内容的总结说明,并指出了新的研究方向和仍然需要进一步解决的问题。
1.2 设计研究的背景意义
目前人们对多机器人的研究主要集中在运动控制层,即研究多机器人忽略了多机器人协调最基本的问题,即多机器人之间信息的传递;多机器人之间通过必要的信息交流,从多机器人的同步或协调,如坐标确定、路径规划、防止死锁、避免碰撞等,这虽然是很有必要的,但忽略了多机器人系统的角度实现系统中单个机器人的控制。
多机器人协作和控制研究的基本思想就是将多机器人之间的协作看作一个群体,研究其协作机制,从而充分发挥多机器人系统各种内在的优势。为了有效地交流和协商,必须解决机器人之间信息处理与传输问题,即多机器人通信问题。
多机器人技术是机器人学发展的一个新方向.一方面,由于某些任务的复杂性,单个机器人难以完成时,常通过多机器人之间的合作来完成;另一方面,通过多机器人间的合作,可提高机器人系统在作业过程中的效率,进而当工作环境发生变化或机器人系统局部发生故障时,多机器人系统仍可通过本身具有的合作关
系完成预定的任务.2多机器人通信方式 2.1多机器人通信方式介绍
在多机器人系统中,通过通信多机器人系统中各机器人了解其它机器人的意图、目标和动作以及当前环境状态等信息,进而进行有效的磋商,协作完成任务。机器人之间的通信一般分为隐式通信和显式通信两类隐式通信系统通过外界环境和自身传感器来获取所需的信息并实现相互之间的协作,机器人之间没有直接进行信息交换。在隐式通信中机器人在环境中留下某些特定信息,其通过传感器获取外界环境信息的同时,也可能获取到其它的机器人遗留下的信息。此多机器人系统中,各机器人之间不存在数据的显式交换,所以无法使用一些高级的协调协作策略,降低了完成复杂任务的能力。使用显式通信的多机器人系统利用特定的通信介质,快速有效地完成各机器人间信息的交互,实现许多在隐式通信下无法完成的高级协调协作策略。但由于多机器人系统在通信的实时性、可靠性等方面有特殊要求,所以针对适用于多机器人系统分布式控制结构的特定环境的通信机制的研究具有重要的意义。隐式通信与显式通信是多机器人系统各具特色的两种通信模式,如果将两者各自的优势结合起来,则多机器人系统就可以灵活地应对各种动态未知环境,完成许多复杂任务。
多机器人通信拓扑结构大致分为:星形、环形、总线、网状等。
在各种拓扑结构中,总线形拓扑结构在多机器人通信中应用得较多。总线拓扑的重要特征是可采用多址访问和广播介质,易于组成分布式系统。总线拓扑的典型代表是著名的以太网。总线结构是目前多机器人通信系统中采用最多的一种拓扑形式,其优点是具有较好的坚固性。
2.2基于多机器人通信模型研究
协作是多机器人系统的重要特征,协作的实现离不开通信。在多智能体机器
人环境中,通信系统的构建与实现,要为多机器人系统提供良好的通信平台以实现总体控制功能。
2.2.1机器人通信访问协议
针对保证实时通信的研究工作有很多,如令牌总线、令牌环、分布式队列双总线、光纤分布数据接口等。这些解决方法都需要维持一个物理或逻辑环,增加的硬件设备导致费用较高,管理和分发很复杂,带来的系统负担将较大。在总线拓扑结构里总线式 CSMA/CA得到广泛应用。CSMA/CA 的目的是避免冲突,而不是检测冲突是否存在。CSMA/CA 存取方式存在的一个问题是报 分组冲突后,仍然继续发送直至全部结束,如果冲突各方检测到冲突后能及时停止发送,则可使信道有效利用率得到提高。而 CSMA/CD 协议的存取方式是根据上述要求改进而来的。采用C S M A / C D 控制方式时,不足的一面是,当各机器人发送请求的频率越高信号冲突的可能性就越大,从而造成整个网络信号处理量下降。
层协议的研究,目前基于多智能体的实时通信系统中,多采用T C P 协议,以保证系统的稳定性和可靠性,基本不发生丢包的现象。但是,这是以牺牲系统的实时性为代价的,往往达不到预期的效果。相反,无连接的、不可靠的、尽最大努力投递报文的 U D P协议虽然没有差错控制、超时重发、拥塞控制等可靠性保证策略,但这也正是U D P 的特点所在。在基于 U D P 的通信中,没有发送之前建立连接的过程,也没有发送方等待确认包的“握手”过程,但保证了 U D P 的“轻量”、快速的特点,在网络质量较好的情况下仍然是首要选择。因此可考虑使用 TCP 协议和 U D P 协议结合的通信协议。
2.2.2智能体通信方式
在多智能体机器人系统中,常用通信方式有:黑板模式、联邦方式、广播方式、点到点方式。如下表。
3基本通信模式 3.1C/S模型
此模型适用于需要集中控制的应用,中心服务器利用其特殊地位了解各客户机的需求,这有利于对客户进程的管理以及实现通信资源的合理分配与调度;另外,C / S 模型结构简单、易于实现,便于错误诊断及系统维护。其缺点也很明显:客户进程间通信效率低,服务器工作负荷大,服务器性能及网络带宽是影统性能的瓶颈;中心服务器的错误会导致整个系统的崩溃。
3.2基于Zigbee通信
P2P 通信模型由中心结构改变为分布式结构,节点间通信不经过中心服的转发,而是直接进行通信,提高了通信效率;系统运行不依赖于模型中某个节点,因此系统负载较为均衡、可靠性高。然而,P 2 P 模型并不适用于包含控制、调度、管理等任务的应用。我们希望有一种机制能对系统资源进行统一、可预计分配。如果采用 P2P 模型来实现,由于智能体的对等特性,那么每个智能体都要保存所有智能体的状态信息,增加了本地存储负担;智能体内部状态的任何变化
都必须及时通知其它智能体,增加了网络通信负担;每个智能体都必须处理控制或调度相关的计算,增加了系统负担。
综合比较 C /S 和 P2P 模型,可考虑建立能支持系统复杂通信行为的基于 C/S 和 P2P 模型混合的模型结构。
3.3云计算多机器人
云计算或者我们听起来很陌生,但是这是近几年来国家大力推广的一项业务,或许现阶段人们还对云计算还没有一个标准定义,也就是一个国际上承认的称呼,但是目前来说基本上都会认为云计算是相比传统,是一种大规模的分布式计算模式。云计算需要通过互联网的人都可以请求资源池,云计算使人们可以分享更多的资源和资源更新速度,当系统不受影响时。用户只需要有一个能够连接硬件终端的网络能够利用云计算资源,云计算在近几年已经得到了广泛的发展和应用,物联网云、云安全、云存储、私有云、云游戏、云教育、云会议、社会网络和云。中国,云计算的生态系统正在建设,在政府、商界和科研人员共同的关切,云计算将会发挥越来越重要的作用,在卫生领域的关心,包括电信、电子商务。电子设计机器人拟人内幕信息从外面快速反应有很多的运算处理,机器人可以大量的算法处理在,“云”极大地简化了结构的内部设计,但也可以提高处理速度的反应,是可以通过网络实现的最终控制远端的机器人也使更多的机器人“集群效应”,以执行更复杂的任务。
4国内外研究状态与水平
目前,多机器人系统应用领域广泛。美、欧、日等国家从 20 世纪 80 年代中期就开始对多机器人系统做了大量研究,协作机器人学得到了较好的发展。日本对群体机器人系统的研究开展得比较早,著名的研究有 A C T R E S S系统和 C E B O T 系统。A C T E R E S S系统通过设计底层的通信结构而把机器人、周围设备和计算机等连接起来的自治多机器人智能系统。C E B O T 系统中,每个
机器人可以自主地运动,整个系统没有集中控制,可以根据任务和环境动态重构、可以具有学习和适应的群体智能。我国群体机器人的研究起步较晚,上海交通大学、中国科学院、哈尔滨工业大学机器人研究所、东北大学等已先后开发出各种形式的群体机器人系统。中科院沈阳自动化研究所以制造环境应用多机器人装配为背景,建立了一个多机器人协作装配系统。国内外对群体机器人通信的研究已取得了令人瞩目的进展,但与工业机器人相比,实用性尚有很大的差距,仍需要在通信协作,系统可靠性,任务分解与分配等方面继续研究,不断深入。多机器人通信系统研究展望
有限的通信范围影响了多机器人系统完成任务的效率.目前的多机器人系统研究中,并没有考虑机器人通信范围的受限性,机器人往往不受任何通信范围的约束而进行工作.深入讨论了通信受限情况下的机器人探索策略,均提出了用/ 包机器人0来扩展机器人活动范围的策略,类似的策略还有转播节点和转发器 Puck具有通信受限约束的机器探测环境时,比不含有此限制的情况困难得多,因此通信受限题是目前研究的热点和难点。
通信质量问题机器人在移动过程中脱离了通信网络,或者遇到通信故障时,没有任何信息交流,可能去探测已探测过的区域,从而造成资源浪费若 1 个机器人与其他机器人脱离了联系。第 2 个机器人可以自主地创建一个新的通信网络,将丢失的机器人与团队重新连接,则可以避免这种浪费。文献进行了恢复通信和保证通信质量的研究.文献提出了一个基于行为的导航方法,用于在机器人团队间保持直线通信.利用其他机器人的信息,对通信质量进行实时检测,并结合环境的先验地图近似计算出一个最佳的移动方向.实验表明,该方法在机器人数增加时,可以提高机器人间的通信质量目前多机器人通信技术远未成熟,还需要进行广泛的研究,以实现在不可靠环境中机器人的可靠通信。因此,提高多机器人通信系统的通信质量是一个值得研究的方向。
通信复杂度和切换不适应性多机器人系统通信网络研究的主要挑战在于机器人系统是将控制、通信和计算三者相结合的复杂智能体系统.结合通信问题,提出了一种多机器人运动控制算法,并提出了时间可计算理论和基于通信复杂度的运动协调算法。当多机器人需要适应其他特定的任务或环境时,这种变化会给整个团队带来混乱,即环境切换感知能力不足,针对如何达到无缝的环境切换感知能力,提出了一种规一化熵索引模型.该模型通过计算每个机器人对团队的贡献来估计系统状态,进而做出相应的调整,以克服这种环境切换不适应性问题.智能体子系统间的相互通信具有较大的复杂性,目前对于多机器人系统中通信复杂度的研究已引起了研究人员的重视。
致谢
首先,真诚的感谢我的指导老师邵杰老师,自从选择毕业论文课题以后,邵老师就一直很关心我们的毕业论文,给我进行论文课题的分析和讲解,并帮助我分析了未知环境中多机器人通信技术研究发展历史和国内外的发展现状,而且帮助我分析预测了论文撰写过程中可能会出现的各种各样的问题,提出了一些针对性的建议,使我少走了很多弯路。邵杰老师为人谦虚宽容,和蔼可亲,学识渊博,老师严肃的科学态度,严谨的治学精神,精益求精的工作作风,深深地感染和激励着我。邵杰老师不仅在学业上给我以精心指导,同时还在思想、生活上给我以无微不至的关怀,在此谨向邵杰老师致以诚挚的谢意和崇高的敬意。我还要感谢在一起愉快的度过毕业论文小组的同学们,正是由于你们的帮助和支持,我才能克服一个一个的困难和疑惑,直至本文的顺利完成。
参考文献
[1 ] 谭民, 王硕, 曹志强.多机器人系统 [M ].北京: 清华大学出版社, 2005.[2] 熊举峰, 谭冠政, 盘辉.多机器人系统的研究现状[J ].计算机工程与应用, 2005, 41(30): 28-45.[3] 原魁, 李园, 房立新.多移动机器人系统研究发展近况[J ].自动化学报, 2007, 33(8): 786-794.吴艮霞, [4] 李国阳, 韦巍.基于 W LA N 的多机器人分布式合作系统研究[ J].机电工
程, 2006, 23(5): 32-36.[5 ] 吴涛, 黄心汉, 黄振宇.基于 Linux 的多机器人通信的原理与实现方法 [ J ].电工技术杂志, 2003, 12:73-75.[6] 陈人际,谈大龙.分布式对象技术在多机器人系统中的应用[J].机器人, 1998, 20(60):466-470.[7] 蒋东兴,林鄂华.Windows Socket网络程序设计指南[M].北京:清华大学出版社, 1995.[8] 王越超,谈大龙.协作机器人学的研究现状与发展[ J].机器人, 1998, 20(1):69-75.[9] 李开生,张慧慧.灵巧擦窗机器人控制系统[ J].计算机自动测量与控制, 2000, 8(4):23-26.[10] 赵春霞,杨静宇.基于多Agent的虚拟系统模型设计[J].计算机辅助设计与图形学学报, 2000, 12(4):251-254.
第四篇:智能语音识别机器人文献翻译
改进型智能机器人的语音识别方法
2、语音识别概述
最近,由于其重大的理论意义和实用价值,语音识别已经受到越来越多的关注。到现在为止,多数的语音识别是基于传统的线性系统理论,例如隐马尔可夫模型和动态时间规整技术。随着语音识别的深度研究,研究者发现,语音信号是一个复杂的非线性过程,如果语音识别研究想要获得突破,那么就必须引进非线性系统理论方法。最近,随着非线性系统理论的发展,如人工神经网络,混沌与分形,可能应用这些理论到语音识别中。因此,本文的研究是在神经网络和混沌与分形理论的基础上介绍了语音识别的过程。
语音识别可以划分为独立发声式和非独立发声式两种。非独立发声式是指发音模式是由单个人来进行训练,其对训练人命令的识别速度很快,但它对与其他人的指令识别速度很慢,或者不能识别。独立发声式是指其发音模式是由不同年龄,不同性别,不同地域的人来进行训练,它能识别一个群体的指令。一般地,由于用户不需要操作训练,独立发声式系统得到了更广泛的应用。所以,在独立发声式系统中,从语音信号中提取语音特征是语音识别系统的一个基本问题。
语音识别包括训练和识别,我们可以把它看做一种模式化的识别任务。通常地,语音信号可以看作为一段通过隐马尔可夫模型来表征的时间序列。通过这些特征提取,语音信号被转化为特征向量并把它作为一种意见,在训练程序中,这些意见将反馈到HMM的模型参数估计中。这些参数包括意见和他们响应状态所对应的概率密度函数,状态间的转移概率,等等。经过参数估计以后,这个已训练模式就可以应用到识别任务当中。输入信号将会被确认为造成词,其精确度是可以评估的。整个过程如图一所示。
图1 语音识别系统的模块图
3、理论与方法
从语音信号中进行独立扬声器的特征提取是语音识别系统中的一个基本问题。解决这个问题的最流行方法是应用线性预测倒谱系数和Mel频率倒谱系数。这两种方法都是基于一种假设的线形程序,该假设认为说话者所拥有的语音特性是由于声道共振造成的。这些信号特征构成了语音信号最基本的光谱结构。然而,在语音信号中,这些非线形信息不容易被当前的特征提取逻辑方法所提取,所以我们使用分型维数来测量非线形语音扰动。
本文利用传统的LPCC和非线性多尺度分形维数特征提取研究并实现语音识别系统。
3.1线性预测倒谱系数
线性预测系数是一个我们在做语音的线形预分析时得到的参数,它是关于毗邻语音样本间特征联系的参数。线形预分析正式基于以下几个概念建立起来的,即一个语音样本可以通过一些以前的样本的线形组合来快速地估计,根据真实语音样本在确切的分析框架(短时间内的)和预测样本之间的差别的最小平方原则,最后会确认出唯一的一组预测系数。
LPC可以用来估计语音信号的倒谱。在语音信号的短时倒谱分析中,这是一种特殊的处理方法。信道模型的系统函数可以通过如下的线形预分析来得到:
其中p代表线形预测命令,(k=1,2,„ „,p)代表预测参数,脉冲响应用
。那么(1)式可以扩展为(2)式: h(n)来表示,假设h(n)的倒谱是
将(1)带入(2),两边同时,(2)变成(3)。
就获得了方程(4):
那么 可以通过
来获得。
(5)中计算的倒谱系数叫做LPCC,n代表LPCC命令。
在我们采集LPCC参数以前,我们应该对语音信号进行预加重,帧处理,加工和终端窗口检测等,所以,中文命令字“前进”的端点检测如图2所示,接下来,断点检测后的中文命令字“前进”语音波形和LPCC的参数波形如图3所示。
图2 中文命令字“前进”的端点检测
图3 断点检测后的中文命令字“前进”语音波形和LPCC的参数波形
3.2 语音分形维数计算
分形维数是一个与分形的规模与数量相关的定值,也是对自我的结构相似性的测量。分形分维测量是[6-7]。从测量的角度来看,分形维数从整数扩展到了分数,打破了一般集拓扑学方面被整数分形维数的限制,分数大多是在欧几里得几何尺寸的延伸。
有许多关于分形维数的定义,例如相似维度,豪斯多夫维度,信息维度,相关维度,容积维度,计盒维度等等,其中,豪斯多夫维度是最古老同时也是最重要的,它的定义如【3】所示:
其中,表示需要多少个单位来覆盖子集F.端点检测后,中文命令词“向前”的语音波形和分形维数波形如图4所示。
图4 端点检测后,中文命令词“向前”的语音波形和分形维数波形
3.3 改进的特征提取方法
考虑到LPCC语音信号和分形维数在表达上各自的优点,我们把它们二者混合到信号的特取中,即分形维数表表征语音时间波形图的自相似性,周期性,随机性,同时,LPCC特性在高语音质量和高识别速度上做得很好。
由于人工神经网络的非线性,自适应性,强大的自学能力这些明显的优点,它的优良分类和输入输出响应能力都使它非常适合解决语音识别问题。
由于人工神经网络的输入码的数量是固定的,因此,现在是进行正规化的特征参数输入到前神经网络[9],在我们的实验中,LPCC和每个样本的分形维数需要分别地通过时间规整化的网络,LPCC是一个4帧数据(LPCC1,LPCC2,LPCC3,LPCC4,每个参数都是14维的),分形维数被模范化为12维数据,(FD1,FD2,„FD12,每一个参数都是一维),以便于每个样本的特征向量有4*14+12*1=68-D维,该命令就是前56个维数是LPCC,剩下的12个维数是分形维数。因而,这样的一个特征向量可以表征语音信号的线形和非线性特征。
自动语音识别的结构和特征
自动语音识别是一项尖端技术,它允许一台计算机,甚至是一台手持掌上电脑(迈尔斯,2000)来识别那些需要朗读或者任何录音设备发音的词汇。自动语音识别技术的最终目的是让那些不论词汇量,背景噪音,说话者变音的人直白地说出的单词能够达到100%的准确率(CSLU,2002)。然而,大多数的自动语音识别工程师都承认这样一个现状,即对于一个大的语音词汇单位,当前的准确度水平仍然低于90%。举一个例子,Dragon's Naturally Speaking或者IBM公司,阐述了取决于口音,背景噪音,说话方式的基线识别的准确性仅仅为60%至80%(Ehsani & Knodt, 1998)。更多的能超越以上两个的昂贵的系统有Subarashii(Bernstein, et al., 1999), EduSpeak(Franco, etal., 2001), Phonepass(Hinks, 2001), ISLE Project(Menzel, et al., 2001)and RAD(CSLU, 2003)。语音识别的准确性将有望改善。
在自动语音识别产品中的几种语音识别方式中,隐马尔可夫模型(HMM)被认为是最主要的算法,并且被证明在处理大词汇语音时是最高效的(Ehsani & Knodt, 1998)。详细说明隐马尔可夫模型如何工作超出了本文的范围,但可以在任何关于语言处理的文章中找到。其中最好的是Jurafsky & Martin(2000)and Hosom, Cole, and Fanty(2003)。简而言之,隐马尔可夫模型计算输入接收信号和包含于一个拥有数以百计的本土音素录音的数据库的匹配可能性(Hinks, 2003, p.5)。也就是说,一台基于隐马尔可夫模型的语音识别器可以计算输入一个发音的音素可以和一个基于概率论相应的模型达到的达到的接近度。高性能就意味着优良的发音,低性能就意味着劣质的发音(Larocca, et al., 1991)。
虽然语音识别已被普遍用于商业听写和获取特殊需要等目的,近年来,语言学习的市场占有率急剧增加(Aist, 1999;Eskenazi, 1999;Hinks, 2003)。早期的基于自动语音识别的软件程序采用基于模板的识别系统,其使用动态规划执行模式匹配或其他时间规范化技术(Dalby & Kewley-Port,1999).这些程序包括Talk to Me(Auralog, 1995), the Tell Me More Series(Auralog, 2000), Triple-Play Plus(Mackey & Choi, 1998), New Dynamic English(DynEd, 1997), English Discoveries(Edusoft, 1998), and See it, Hear It, SAY IT!(CPI, 1997)。这些程序的大多数都不会提供任何反馈给超出简单说明的发音准确率,这个基于最接近模式匹配说明是由用户提出书面对话选择的。学习者不会被告之他们发音的准确率。特别是内里,(2002年)评论例如Talk to Me和Tell Me More等作品中的波形图,因为他们期待浮华的买家,而不会提供有意义的反馈给用户。Talk to Me 2002年的版本已经包含了更多Hinks(2003)的特性,比如,信任对于学习者来说是非常有用的: ★ 一个视觉信号可以让学习者把他们的语调同模型扬声器发出的语调进行对比。★ 学习者发音的准确度通常以数字7来度量(越高越好)★ 那些发音失真的词语会被识别出来并被明显地标注。
Improved speech recognition method
for intelligent robot
2、Overview of speech recognition Speech recognition has received more and more attention recently due to the important theoretical meaning and practical value [5 ].Up to now, most speech recognition is based on conventional linear system theory, such as Hidden Markov Model(HMM)and Dynamic Time Warping(DTW).With the deep study of speech recognition, it is found that speech signal is a complex nonlinear process.If the study of speech recognition wants to break through, nonlinear-system theory method must be introduced to it.Recently, with the developmentof nonlinea-system theories such as artificial neural networks(ANN), chaos and fractal, it is possible to apply these theories to speech recognition.Therefore, the study of this paper is based on ANN and chaos and fractal theories are introduced to process speech recognition.Speech recognition is divided into two ways that are speaker dependent and speaker independent.Speaker dependent refers to the pronunciation model trained by a single person, the identification rate of the training person?sorders is high, while others’orders is in low identification rate or can’t be recognized.Speaker independent refers to the pronunciation model trained by persons of different age, sex and region, it can identify a group of persons’orders.Generally, speaker independent system ismorewidely used, since the user is not required to conduct the training.So extraction of speaker independent features from the speech signal is the fundamental problem of speaker recognition system.Speech recognition can be viewed as a pattern recognition task, which includes training and recognition.Generally, speech signal can be viewed as a time sequence and characterized by the powerful hidden Markov model(HMM).Through the feature extraction, the speech signal is transferred into feature vectors and act asobservations.In the training procedure, these observationswill feed to estimate the model parameters of HMM.These parameters include probability density function for the observations and their corresponding states, transition probability between the states, etc.After the parameter estimation, the trained models can be used for recognition task.The input observations will be recognized as the resulted words and the accuracy can be evaluated.Thewhole process is illustrated in Fig.1.Fig.1 Block diagram of speech recognition system Theory andmethod Extraction of speaker independent features from the speech signal is the fundamental problem of speaker recognition system.The standard methodology for solving this problem uses Linear Predictive Cepstral Coefficients(LPCC)and Mel-Frequency Cepstral Co-efficient(MFCC).Both these methods are linear procedures based on the assumption that speaker features have properties caused by the vocal tract resonances.These features form the basic spectral structure of the speech signal.However, the non-linear information in speech signals is not easily extracted by the present feature extraction methodologies.So we use fractal dimension to measure non2linear speech turbulence.This paper investigates and implements speaker identification system using both traditional LPCC and non-linear multiscaled fractal dimension feature extraction.3.1 L inear Predictive Cepstral Coefficients
Linear prediction coefficient(LPC)is a parameter setwhich is obtained when we do linear prediction analysis of speech.It is about some correlation characteristics between adjacent speech samples.Linear prediction analysis is based on the following basic concepts.That is, a speech sample can be estimated approximately by the linear combination of some past speech samples.According to the minimal square sum principle of difference between real speech sample in certain analysis frame short-time and predictive sample, the only group ofprediction coefficients can be determined.LPC coefficient can be used to estimate speech signal cepstrum.This is a special processing method in analysis of speech signal short-time cepstrum.System function of channelmodel is obtained by linear prediction analysis as follow.Where p represents linear prediction order, ak,(k=1,2,…,p)represent sprediction coefficient, Impulse response is represented by h(n).Suppose cepstrum of h(n)is represented by ,then(1)can be expanded as(2).The cepstrum coefficient calculated in the way of(5)is called LPCC, n represents LPCC order.When we extract LPCC parameter before, we should carry on speech signal pre-emphasis, framing processing, windowingprocessing and endpoints detection etc., so the endpoint detection of Chinese command word“Forward”is shown in Fig.2, next, the speech waveform ofChinese command word“Forward”and LPCC parameter waveform after Endpoint detection is shown in Fig.3.3.2 Speech Fractal Dimension Computation
Fractal dimension is a quantitative value from the scale relation on the meaning of fractal, and also a measuring on self-similarity of its structure.The fractal measuring is fractal dimension[6-7].From the viewpoint of measuring, fractal dimension is extended from integer to fraction, breaking the limitof the general to pology set dimension being integer Fractal dimension,fraction mostly, is dimension extension in Euclidean geometry.There are many definitions on fractal dimension, eg.,similar dimension, Hausdoff dimension, inforation dimension, correlation dimension, capability imension, box-counting dimension etc., where,Hausdoff dimension is oldest and also most important, for any sets, it is defined as[3].Where, M£(F)denotes how many unit £ needed to cover subset F.In thispaper, the Box-Counting dimension(DB)of ,F, is obtained by partitioning the plane with squares grids of side £, and the numberof squares that intersect the plane(N(£))and is defined as[8].The speech waveform of Chinese command word“Forward”and fractal dimension waveform after Endpoint detection is shown in Fig.4.3.3 Improved feature extractions method Considering the respective advantages on expressing speech signal of LPCC and fractal dimension,we mix both to be the feature signal, that is, fractal dimension denotes the self2similarity, periodicity and randomness of speech time wave shape, meanwhile LPCC feature is good for speech quality and high on identification rate.Due to ANN′s nonlinearity, self-adaptability, robust and self-learning such obvious advantages, its good classification and input2output reflection ability are suitable to resolve speech recognition problem.Due to the number of ANN input nodes being fixed, therefore time regularization is carried out to the feature parameter before inputted to the neural network[9].In our experiments, LPCC and fractal dimension of each sample are need to get through the network of time regularization separately, LPCC is 4-frame data(LPCC1,LPCC2,LPCC3,LPCC4, each frame parameter is 14-D), fractal dimension is regularized to be12-frame data(FD1,FD2,…,FD12, each frame parameter is 1-D), so that the feature vector of each sample has 4*14+1*12=68-D, the order is, the first 56 dimensions are LPCC, the rest 12 dimensions are fractal dimensions.Thus, such mixed feature parameter can show speech linear and nonlinear characteristics as well.Architectures and Features of ASR ASR is a cutting edge technology that allows a computer or even a hand-held PDA(Myers, 2000)to identify words that are read aloud or spoken into any sound-recording device.The ultimate purpose of ASR technology is to allow 100% accuracy with all words that are intelligibly spoken by any person regardless of vocabulary size, background noise, or speaker variables(CSLU, 2002).However, most ASR engineers admit that the current accuracy level for a large vocabulary unit of speech(e.g., the sentence)remains less than 90%.Dragon's Naturally Speaking or IBM's ViaVoice, for example, show a baseline recognition accuracy of only 60% to 80%, depending upon accent, background noise, type of utterance, etc.(Ehsani & Knodt, 1998).More expensive systems that are reported to outperform these two are Subarashii(Bernstein, et al., 1999), EduSpeak(Franco, et al., 2001), Phonepass(Hinks, 2001), ISLE Project(Menzel, et al., 2001)and RAD(CSLU, 2003).ASR accuracy is expected to improve.Among several types of speech recognizers used in ASR products, both implemented and proposed, the Hidden Markov Model(HMM)is one of the most dominant algorithms and has proven to be an effective method of dealing with large units of speech(Ehsani & Knodt, 1998).Detailed descriptions of how the HHM model works go beyond the scope of this paper and can be found in any text concerned with language processing;among the best are Jurafsky & Martin(2000)and Hosom, Cole, and Fanty(2003).Put simply, HMM computes the probable match between the input it receives and phonemes contained in a database of hundreds of native speaker recordings(Hinks, 2003, p.5).That is, a speech recognizer based on HMM computes how close the phonemes of a spoken input are to a corresponding model, based on probability theory.High likelihood represents good pronunciation;low likelihood represents poor pronunciation(Larocca, et al., 1991).While ASR has been commonly used for such purposes as business dictation and special needs accessibility, its market presence for language learning has increased dramatically in recent years(Aist, 1999;Eskenazi, 1999;Hinks, 2003).Early ASR-based software programs adopted template-based recognition systems which perform pattern matching using dynamic programming or other time normalization techniques(Dalby & Kewley-Port, 1999).These programs include Talk to Me(Auralog, 1995), the Tell Me More Series(Auralog, 2000), Triple-Play Plus(Mackey & Choi, 1998), New Dynamic English(DynEd, 1997), English Discoveries(Edusoft, 1998), and See it, Hear It, SAY IT!(CPI, 1997).Most of these programs do not provide any feedback on pronunciation accuracy beyond simply indicating which written dialogue choice the user has made, based on the closest pattern match.Learners are not told the accuracy of their pronunciation.In particular, Neri, et al.(2002)criticizes the graphical wave forms presented in products such as Talk to Me and Tell Me More because they look flashy to buyers, but do not give meaningful feedback to users.The 2000 version of Talk to Me has incorporated more of the features that Hinks(2003), for example, believes are useful to learners: ★ A visual signal allows learners to compare their intonation to that of the model speaker.★ The learners' pronunciation accuracy is scored on a scale of seven(the higher the better).Words whose pronunciation fails to be recognized are highlighted
第五篇:机器人外文翻译(文献翻译_中英文翻译)
外文翻译
外文资料:
Robots First, I explain the background robots, robot technology development.It should be said it is a common scientific and technological development of a comprehensive results, for the socio-economic development of a significant impact on a science and technology.It attributed the development of all countries in the Second World War to strengthen the economic input on strengthening the country's economic development.But they also demand the development of the productive forces the inevitable result of human development itself is the inevitable result then with the development of humanity, people constantly discuss the natural process, in understanding and reconstructing the natural process, people need to be able to liberate a slave.So this is the slave people to be able to replace the complex and engaged in heavy manual labor, People do not realize right up to the world's understanding and transformation of this technology as well as people in the development process of an objective need.Robots are three stages of development, in other words, we are accustomed to regarding robots are divided into three categories.is a first-generation robots, also known as teach-type robot, it is through a computer, to control over one of a mechanical degrees of freedom Through teaching and information stored procedures, working hours to read out information, and then issued a directive so the robot can repeat according to the people at that time said the results show this kind of movement again, For example, the car spot welding robots, only to put this spot welding process, after teaching, and it is always a repeat of a work It has the external environment is no perception that the force manipulation of the size of the work piece there does not exist, welding 0S It does not know, then this fact from the first generation robot, it will exist this shortcoming, it in the 20th century, the late 1970s, people started to study the second-generation robot, called Robot with the feeling that This feeling with the robot is similar in function of a certain feeling, for instance, force and touch, slipping, visual, hearing and who is analogous to that with all kinds of feelings, say in a robot grasping objects, In fact, it can be the size of feeling out, it can through visual, to be able to feel and identify its shape, size, color Grasping an egg, it adopted a acumen, aware of its power and the size of the slide.Third-generation robots, we were a robotics ideal pursued by the most advanced stage, called intelligent robots, So long as tell it what to do, not how to tell it to do, it will be able to complete the campaign, thinking and perception of this man-machine communication function and function Well, this current development or relative is in a smart part of the concept and meaning But the real significance of the integrity of this intelligent robot did not actually exist, but as we continued the development of science and technology, the concept of intelligent increasingly rich, it grows ever wider connotations.Now, I would like to briefly outline some of the industrial robot situation.So far, the industrial robot is the most mature and widely used category of a robot, now the world's total sales of 1.1 million Taiwan, which is the 1999 statistics, however, 1.1 million in Taiwan have been using the equipment is 75 million, this volume is not small.Overall, the Japanese industrial robots in this one, is the first of the robots to become the Kingdom, the United States have developed rapidly.Newly installed in several areas of Taiwan, which already exceeds Japan, China has only just begun to enter the stage of industrialization, has developed a variety of industrial robot prototype and small batch has been used in production.Spot welding robot is the auto production line, improve production efficiency and raise the quality of welding car, reduce the labor intensity of a robot.It is characterized by two pairs of robots for spot welding of steel plate, bearing a great need for the welding tongs, general in dozens of kilograms or more, then its speed in meters per second a 5-2 meter of such high-speed movement.So it is generally five to six degrees of freedom, load 30 to 120 kilograms, the great space, probably expected that the work of a spherical space, a high velocity, the concept of freedom, that is to say, Movement is relatively independent of the number of components, the equivalent of our body, waist is a rotary degree of freedom We have to be able to hold his arm, Arm can be bent, then this three degrees of freedom, Meanwhile there is a wrist posture adjustment to the use of the three autonomy, the general robot has six degrees of freedom.We will be able to space the three locations, three postures, the robot fully achieved, and of course we have less than six degrees of freedom.Have more than six degrees of freedom robot, in different occasions the need to configure.The second category of service robots, with the development of industrialization, especially in the past decade, Robot development in the areas of application are continuously expanding, and now a very important characteristic, as we all know, Robot has gradually shifted from manufacturing to non-manufacturing and service industries, we are talking about the car manufacturer belonging to the manufacturing industry, However, the services sector including cleaning, refueling, rescue, rescue, relief, etc.These belong to the non-manufacturing industries and service industries, so here is compared with the industrial robot, it is a very important difference.It is primarily a mobile platform, it can move to sports, there are some arms operate, also installed some as a force sensor and visual sensors, ultrasonic ranging sensors, etc.It’s surrounding environment for the conduct of identification, to determine its campaign to complete some work, this is service robot’s one of the basic characteristics.For example, domestic robot is mainly embodied in the example of some of the carpets and flooring it to the regular cleaning and vacuuming.The robot it is very meaningful, it has sensors, it can furniture and people can identify, It automatically according to a law put to the ground under the road all cleaned up.This is also the home of some robot performance.The medical robots, nearly five years of relatively rapid development of new application areas.If people in the course of an operation, doctors surgery, is a fatigue, and the other manually operated accuracy is limited.Some universities in Germany, which, facing the spine, lumbar disc disease, the identification, can automatically use the robot-aided positioning, operation and surgery Like the United States have been more than 1,000 cases of human eyeball robot surgery, the robot, also including remote-controlled approach, the right of such gastrointestinal surgery, we see on the television inside.a manipulator, about the thickness fingers such a manipulator, inserted through the abdominal viscera, people on the screen operating the machines hand, it also used the method of laser lesion laser treatment, this is the case, people would not have a very big damage to the human body.In reality, this right as a human liberation is a very good robots, medical robots it is very complex, while it is fully automated to complete all the work, there are difficulties, and generally are people to participate.This is America, the development of such a surgery Lin Bai an example, through the screen, through a remote control operator to control another manipulator, through the realization of the right abdominal surgery A few years ago our country the exhibition, the United States has been successful in achieving the right to the heart valve surgery and bypass surgery.This robot has in the area, caused a great sensation, but also, AESOP's surgical robot, In fact, it through some equipment to some of the lesions inspections, through a manipulator can be achieved on some parts of the operation Also including remotely operated manipulator, and many doctors are able to participate in the robot under surgery Robot doctor to include doctors with pliers, tweezers or a knife to replace the nurses, while lighting automatically to the doctor's movements linked, the doctor hands off, lighting went off, This is very good, a doctor's assistant.Robot is mankind's right-hand man;friendly coexistence can be a reliable friend.In future, we will see and there will be a robot space inside, as a mutual aide and friend.Robots will create the jobs issue.We believe that there would not be a “robot appointment of workers being laid off” situation, because people with the development of society, In fact the people from the heavy physical and dangerous environment liberated, so that people have a better position to work, to create a better spiritual wealth and cultural wealth.译文资料:
机器人
首先我介绍一下机器人产生的背景,机器人技术的发展,它应该说是一个科学技术发展共同的一个综合性的结果,同时,为社会经济发展产生了一个重大影响的一门科学技术,它的发展归功于在第二次世界大战中各国加强了经济的投入,就加强了本国的经济的发展。另一方面它也是生产力发展的需求的必然结果,也是人类自身发展的必然结果,那么随着人类的发展,人们在不断探讨自然过程中,在认识和改造自然过程中,需要能够解放人的一种奴隶。那么这种奴隶就是代替人们去能够从事复杂和繁重的体力劳动,实现人们对不可达世界的认识和改造,这也是人们在科技发展过程中的一个客观需要。
机器人有三个发展阶段,那么也就是说,我们习惯于把机器人分成三类,一种是第一代机器人,那么也叫示教再现型机器人,它是通过一个计算机,来控制一个多自由度的一个机械,通过示教存储程序和信息,工作时把信息读取出来,然后发出指令,这样的话机器人可以重复的根据人当时示教的结果,再现出这种动作,比方说汽车的点焊机器人,它只要把这个点焊的过程示教完以后,它总是重复这样一种工作,它对于外界的环境没有感知,这个力操作力的大小,这个工件存在不存在,焊的好与坏,它并不知道,那么实际上这种从第一代机器人,也就存在它这种缺陷,因此,在20世纪70年代后期,人们开始研究第二代机器人,叫带感觉的机器人,这种带感觉的机器人是类似人在某种功能的感觉,比如说力觉、触觉、滑觉、视觉、听觉和人进行相类比,有了各种各样的感觉,比方说在机器人抓一个物体的时候,它实际上力的大小能感觉出来,它能够通过视觉,能够去感受和识别它的形状、大小、颜色。抓一个鸡蛋,它能通过一个触觉,知道它的力的大小和滑动的情况。第三代机器人,也是我们机器人学中一个理想的所追求的最高级的阶段,叫智能机器人,那么只要告诉它做什么,不用告诉它怎么去做,它就能完成运动,感知思维和人机通讯的这种功能和机能,那么这个目前的发展还是相对的只是在局部有这种智能的概念和含义,但真正完整意义的这种智能机器人实际上并没有存在,而只是随着我们不断的科学技术的发展,智能的概念越来越丰富,它内涵越来越宽。
下边我简单介绍一下工业机器人的一些情况。到目前为止,工业机器人是最成熟,应用最广泛的一类机器人,世界总量目前已经销售110万台,这是1999年的统计,但这110万台在已经进行装备使用的是75万台,这个量也是不小的。总体情况看,日本在工业机器人这一块,是首位的,成为机器人的王国,美国发展也很迅速,目前在新安装的台数方面,已经超过了日本,中国刚开始进入产业化的阶段,已经研制出多种工业机器人样机,已有小批量在生产中使用。
点焊机器人主要是针对汽车生产线,提高生产效率,提高汽车焊接的质量,降低工人的劳动强度的一种机器人。它的特点是通过机器人对两个钢板进行点焊的时候,需要承载一个很大的焊钳,一般在几十公斤以上,那么它的速度要求在每秒钟一米五到两米这样的高速运动,所以它一般来说有五到六个自由度,负载三十到一百二十公斤,工作的空间很大,大概有两米,这样一个球形的工作空间,运动速度也很高,那么自由度的概念,就是说,是相对独立运动的部件的个数,就相当于我们人体,腰是一个回转的自由度,我们大臂可以抬起来,小臂可以弯曲,那么这就三个自由度,同时腕部还有一个调整姿态来使用的三个自由度,所以一般的机器人有六个自由度,就能把空间的三个位置,三个姿态,机器人完全实现,当然也有小于六个自由度的,也有多于六个自由度的机器人,只是在不同的需要场合来配置。
第二类是服务机器人,随着工业化的发展,尤其近十年以来,机器人的发展的应用领域在不断拓宽,目前一个很重要的特征,大家都知道,机器人已经从制造业逐渐转向了非制造业和服务行业,刚才谈的汽车制造属于是制造业,但服务行业包括清洁、加油、救护、抢险、救灾这些等等,都属于非制造行业和服务行业,那么这里边跟工业机器人相比,它有一个很重要的不同,它主要是一个移动平台,它能够移动、去运动,上面有一些手臂进行操作,同时还装有一些像力觉传感器和视觉传感器、超声测距传感器等等。它对周边的环境进行识别,来判断它的运动,完成某种工作,这是服务机器人的基本的一个特点。
例如,家务机器人主要体现在像一些对地毯和地板定期的它能够进行清扫和吸尘,它这个机器人很有意思,它有传感器,它能够把家具和人能识别出来,它自动的按照一种规律,能根据路径把地面全部的清扫干净,这也是家务中一些机器人的表现。
那么医疗机器人,是近五年来发展比较迅速的一个新的应用领域。如果人手术的时候,医生来手术,一个是疲劳,另一个人手操作的精度还是有限的。在德国一些大学里面,面向人的脊椎,如腰间盘突出这种病,进行识别以后,能够自动地用机器人来辅助进行定位,进行操作和手术。像美国已经有一千多例机器人对人眼球进行手术,这样的机器人,还包括通过遥控操作的办法,实现对人的胃肠这种手术,大家在电视里边看到,一个机械手,大概有手指这样粗细的一个机械手,通过插入腹脏以后,人在屏幕上操作这个机器手,同时对它用激光的方法对病灶进行激光的治疗,这样的话,人就不用很大幅度地破坏人的身体,这实际对人的一种解放,是非常好一种机器人,医疗机器人它也很复杂,一方面它完全自动去完成各种工作,是有困难的,一般来说都是人来参与,这是美国开发的一个林白手术这样一个例子,人通过在屏幕上,通过一个遥控操作手来控制另一个机械手,实现通过对人的腹腔进行手术,前几年我们国家展览会上,美国已经成功的实现了对人的心脏瓣膜的手术和搭桥手术,这已经在机器人领域中,引起了很大的轰动,还包括,AESOP的这种外科手术机器人,它实际上通过一些仪器能够对人的一些病变进行检查,通过一个机械手就能够实现对人的某些部位进行手术,还包括遥操作机械手,以及多个医生可以在机器人共同参与下进行手术,包括机器人给大夫医生拿钳子、镊子或刀子来代替护士的工作,同时把照明能够自动的给医生的动作联系起来,医生的手到哪儿,照明就去哪儿,这样非常好的,一个医生的助手。
机器人是人类的得力助手,能友好相处的可靠朋友,将来我们会看到人和机器人会存在一个空间里边,成为一个互相的助手和朋友。机器人会不会产生饭碗的问题。我们相信不会出现“机器人上岗,工人下岗”的局面,因为人们随着社会的发展,实际上把人们从繁重的体力和危险的环境中解放出来,使人们有更好的岗位去工作,去创造更好的精神财富和文化财富。