第一篇:华理09多媒体技术与应用期末考试重点整理
1.操作系统就是计算机系统的“管家” 2.操作系统的类型
处理操作系统:分时操作系统实时操作系统网络操作系统分布式操作系统 3.分时操作系统的特点 : 多路性:
交互性 独占性
及时性
4.作业:是指用户在一次计算过程或在一次事务处理过程中,要求计算机系统所做工作的集合(一次任务)
5.进程是一个具有一定独立功能的程序关于某个数据集合的一次运行,是操作系统进行资源分配的单位 6.进程的特征 动态性并发性
独立性异步性结构特性。
6.进程生命周期中存在三种基本状态:即就绪状态、执行状态、阻塞状态
7.线程具有进程所具有的许多特征,故又称为轻型进程,而把一般的进程称为重型进程。
8.存储管理的功能
①内存分配与回收
②地址映射
③内存共享与保护
④内存扩充 9.存储管理方式有4种类型: 分区式存储管理2 分页式存储管理3 段式存储管理4 段页式存储管理
10.输入输出操作有4种控制方式:
程序直接控制方式
中断控制方式
DMA控制方式
通道控制方式 11.文件系统是负责存取和管理文件的机构
感觉媒体:指直接作用于人们的感觉器官,使人能直接产生感觉的一类媒体 表示媒体是为了加工、处理和传输感觉媒体而人为研究、构造出来的一种媒体 构造表示媒体的目的是更有效地将感觉媒体从一地向另外一地传送,便于加工和处理 多媒体的基本特征主要有:多样性、交互性、集成性和实时性
通过交互性使用户介入到信息的活动过程中,当用户完全进入到一个与信息环境一体化的虚拟信息空间自由遨游时,这才是交互应用的高级阶段,这有待于虚拟现实或临境技术的进一步研究和发展。
在静态图像中有一块表面颜色均匀的区域,在这个区域中所有点的光强和色彩以及色饱和度都相同,具有很大的空间冗余。这是由于基于离散像素采样的方法不能表示物体颜色之间的空间连贯性导致的
电视图像、动画等序列图片,当其中物体有位移时,后一帧的数据与前一帧的数据有许多共同的地方,如背景等位置不变,只有部分相邻帧改变的画面,显然是一种冗余,这种冗余称为时间冗余。
事实表明,人的视觉系统对图像的敏感性是非均匀性和非线性的。在记录原始的图像数据时,对人眼看不见或不能分辨的部分进行记录显然是不必要的。因此,大可利用人的视觉的非均匀性和非线性,降低视觉冗余。
多媒体数据压缩方法根据不同的依据可产生不同的分类。根据解码后数据是否能够完全无丢失地恢复原始数据,可分为两种: 无损压缩、有损压缩开发一个多媒体应用系统与开发一个一般的信息系统有许多类似的地方,都要经过系统分析、系统设计、系统实施和系统维护等阶段
优秀的多媒体产品应该是计算机科学、人文社会科学和影视技术及专门领域知识的完美结合。
我们非常熟悉的计算机屏幕的显示通常采用RGB色彩系统CMY:多用于印刷,通过色彩的相减来产生其他颜色,也称为减法合成系统
YIQ色彩系统被北美的电视系统广泛采用Y表示颜色的明视度(Luminance),即亮度(Brightness),实质上就是图像的灰度值 HSI色彩系统通过色调(Hue)、饱和度(Saturation)和亮度(Intensity)来表示物体的颜色,色调值表示基本的纯色,饱和度值表示颜色中掺入白光的比例,亮度值则表示颜色中掺入黑光的比例,此方法是适合人的直觉的配色方法JPEG图片采用的色彩系统就是该系统YCbCr由YUV色彩系统衍生而来Y表示明视度;Cb和Cr是由U和V做少量调整得到的
BMP是标准的Windows和OS/2的图像的基本位图格式是一种与设备无关的图形文件格式,是Windows软件推荐使用的一种格式BMP文件有压缩和非压缩之分,压缩方法采用行程长度编码
GIF文件格式的全称是图形交换文件格式(graphics interchange format),颜色最多为256色(8位)GIF格式是目前惟一使用LZW压缩方法的主要图像文件格式GIF文件压缩比较高,文件长度较小GIF图像有两个主要的规范,即GIF87a和 GIF89a.,后者支持图像内的多画面循环显示,可以用来制作小型的动画,现有WWW上的许多微小动画就是用这种方法做的GIF格式已成为网上最流行的图像文件格式之一
JPG文件格式的最大特点是文件非常小,而且可以调整压缩比它是一种有损压缩的编码格式,是以牺牲图像中某些信息为代价以换取较高的图像压缩比
WMF文件格式(Windows MetaFile)一种比较特殊的文件格式,可以说是位图和矢量的一种混合体,在桌面出版领域应用十分广泛,许多剪贴图片集(clip art)中的图像是以这种格式存储的模式选项用于设置图像的色彩模式设定新图像的背景颜色,有三种选择:白色、背景色、透明
【历史记录】调板中记录了最近若干次的操作,只要选中记录调板中的一个状态,图像就会恢复到这个状态
图章工具有二个: 仿制图章工具、橡皮图章工具仿制图章工具: 以指定位置为参照点,将其周围的像素复制到其它图像中或同一幅图像的其它位置
通道的主要功能有两个方面:
用于保存图像的颜色数据。s中的一个RGB模式的图像,每一个像素的三个分色分别由“红”、“绿”、“蓝”三个通道来存储,三个分色通道组合后形成RGB主通道。(2)用于保存选区
蒙版用来保护特定区域,使该区域不受任何编辑操作的影响,可以认为蒙版与选区的作用是相反的计算机动画中用于控制动画物体随时间而运动控制模型主要有:运动学方法、物理推导方法、随机方法、行为规则方法、自动运动控制方法等。
运动学方法:这是传统的动画技术,运动通过几何变化(包括旋转、缩放、位移、切变)来描述
常用的三类主要的运动控制模型依次是几何模型、物理学模型和行为模型
动画的中间画面的生成技术主要有三种途径,即关键帧方法、算法生成和基于物理的动画生成。关键帧方法:它是基于动画设计者提供的一组关键帧、通过插值自动产生中间帧的技术。分为基于图像的关键帧动画和参数化的关键帧动画。
基于物理的动画生成:它是基于物体造型、应用物理定律以及基于约束的技术来推导和计算物体随时间运动或变化的一种技术。三维动画中物体造型技术:在三维建模动画里,计算机不仅仅是一个辅助工具,计算机可方便而精确地表示人类难以表示的三维透视画面
曲面造型最通用的技术是通过多边形集合来描述曲面。实体造型能完全、精确、有效地表示三维物体,并且十分符合人们在几何形体构造时的思维方式。人体造型是最困难及最富挑战性的一个课题。常用的人体造型方法有棍状模型、表面模型、体模型
动画应用主要分为面向影视制作和应用和面向模拟的应用,面向影视制作的应用不强调画面的真实性,只追求观赏性和趣味性,其中角色的运动可以有些虚幻,但绘制技术要求较高,能模拟出各种真实感效果,面向模拟的应用着眼于各种真实问题的仿真研究,它追求数据的正确性和结果的可信性以及能使各种以前仅能得到大批数据的科学试验可视化,这类动画对绘制效果没有前者要求的高
ActionScript 特点:
ActionScript能够控制Flash动画的播放行为和对象的属性。ActionScript 是一种面向对象的编程语言,它的风格和JavaScript语言相类似。ActionScript可以使用自定义函数。支持XML和XMLSocket。ActionScript提供了XML和XMLSocket对象来和后台程序进行交互。在Flash中要使用ActionScript有两种方式,一种是直接在Flash中写入ActionScript程序段 要在Flash中写入ActionScript程序,就要在“动作-帧面板”中进行编辑
实例:
实例是属于某个类的对象。类的每个实例均包含该类的所有属性和方法 ActionScript中每个完整的语句以分号“;”结束使用大括号“{ }” 对多条语句进行组织形成一个语句块
路径是为了正确引用Flash中的各个不同的对象,对对象进行定位,路径分为:绝对路径和相对路径。绝对路径就是从根开始。如,_root-MC1,相对路径以某对象做参照对应的路径。相对路径看自己层是this,上层的是_parent。表示路径时常用点运算符,如:引用对象MC2写成 _parent.MC
2时间轴变量是可用于该时间轴上的任何脚本,应用时注意3点:一是用前要初始化,二是其他时间轴引用要加路径,三是只能是定义后的时间轴应用
当调试一个动画的时候,trace 动作会把要调试的语句的结果在输出窗口中输出,参数expression是要输出的值、变量或者表达式
gotoAndPlay gotoAndStop on(mouseEvent)play()stop()startDrag(targat [,lock[,left,top,right,bottom]])stopDrag(target)etProperty(“target”, property, value/expression)getProperty(“target”, property)
模拟视频是一种用于传输图像和声音的并且随时间连续变化的电信号。早期视频的记录、存储和传输都是采用模拟方式。
模拟视频具有以下特点:(1)以模拟电信号的形式来记录;(2)依靠模拟调幅的手段在空间传播;(3)使用盒式磁带录像机将视频作为模拟信号存储在磁带上 数字视频要使计算机能够对视频进行处理,必须把视频源,即来自于电视机、模拟摄像机、录像机、影碟机等设备的模拟视频信号,转换成计算机要求的数字视频形式,并存放在磁盘上,这个过程称为视频的数字化过程,包括采样、量化和编码三个步骤。克服了模拟视频的局限性,这是因为数字视频可以大大降低视频的传输和存贮费用,增加交互性,带来精确再现真实情景的稳定图像。适合于网络应用在网络环境中,视频信息可以很方便地实现资源的共享(2)再现性好其抗干扰能力是模拟视频无法比拟的
(3)便于计算机编辑处理处理速度慢,所需的数据存储空间大,从而使数字图像的处理成本增高。通过对数字视频的压缩,这样可以节省大量的存储空间。光盘技术的应用也使得大量视频信息的存储成为可能。
在逐行扫描中,电子束从显示屏的左上角一行接一行地扫描到右下角,在显示屏上扫描一遍就显示一幅完整的图像。在隔行扫描中,一帧需要奇数行和偶数行两部分组成,我们分别将它们称为奇数场和偶数场,也就是说,要得到一幅完整的图像需要扫描两遍。扫描过程的一个重要参数是长宽比例。这是屏幕上水平扫描行与全部扫描行垂直覆盖的距离之比,可以将它看作是帧的长宽比例。电视的长宽比例很早就标准化为4:3,其中电影可以使用2:1。
扫描频率是指一个画面在一秒钟内被刷新的次数。刷新次数越多,即刷新频率越高。如果刷新频率较低,图像闪烁和抖动得就会越厉害,人的眼睛就会感觉越疲劳
NTSC制式是美国国家电视系统委员会在1953年制定的一种兼容的彩色电视制式,是目前最常用的视频标准,在美国、日本和其他国家广为使用。它定义了彩色电视机对于所接受的电视信号的解码方式、色彩的处理方式、屏幕的扫描频率。NTSC制式规定水平扫描线有525条,以30帧/秒速率传送。NTSC采用隔行扫描、扫描频率60Hz,每一帧画面由两次扫描完成,两个场构成一帧。PAL制式是联邦德国1962年制定的一种兼容电视制式。PAL意义是“相位逐行交变”。我国和大部分西欧国家都使用这种制式。PAL制式规定水平扫描线有625行、每秒25帧、隔行扫描、扫描频率50Hz。
SECAM制式称为顺序传送彩色与存储是用于法国、俄罗斯及非洲地区的彩色电视制式。其基本技术及广播方式与NTSC和PAL有很大的区别。它规定每秒25帧,每帧625行,隔行扫描、扫描频率50Hz。HDTV是高清晰度电视的简称。它是目前正在蓬勃发展的电视标准,尚无完全统一的标准。一般认为宽高比例16:9,每帧扫描在1000行以上,采用逐行扫描方式,有较高的扫描频率,传送信号全部采用数字化。
视频采集卡也称为视频捕捉卡,其作用是将输入的各种制式的模拟视频信号数字化,并转换成适合计算机处理、储存、传输、显示和播放的格式
图形加速卡也称为显示卡,它工作在计算机CPU和显示器之间,基本作用就是控制计算机的图形输出,通常显示卡是安装在主板的扩展槽中,或集成在主板上
1.顺序流式传输顺序流式传输是顺序下载,即用户可在下载文件的同时观看在线媒体。但在给定时刻,用户只能观看已下载的那部分,而不能跳到还未下载的前头部分。2.实时流式传输
AVI文件式是Video for Windows所使用的文件格式,其扩展名为AVI。它采用了Intel公司的Indeo视频有损压缩技术把视频信号混合交错地存放在一个文件中,较好地解决了音频信息与视频信息的同步问题,是目前较为流行的视频文件格式。AVI文件使用的压缩方法有多种,主要使用有损的压缩方法。通常采用纯软件的压缩和还原手段。
MOV文件格式是Quick Time Windows 所使用的视频文件格式
MPG文件是最新的数字视频标准文件,可在1024×768的分辨率下以每秒24,25或30帧的速度播放128000种颜色的全运动视频图像和同步CD音质的伴音。
RM格式是RealNetworks公司开发的一种新型流式视频文件格式,共有三种:RealAudio、RealVideo和RealFlash
MOV也可以作为一种流媒体文件格式。能够在浏览器中实现多媒体数据的实时回放,可以令用户几乎能在发出请求的同时便收看到第一帧视频画面
ASF是一个Microsoft公司推出的在Internet上实时传播多媒体的技术标准,主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载以及扩展性等
【工程窗口】用于导入各种视频、音频、动画等素材,并通过左上角的预览框播放素材 时间标尺位于【时间线窗口】的上部,时间标尺的单位有“帧、秒、分”三种,可以通过单击【时间线窗口】左下角的【时间顺序播放】(Time Zoom Level)下拉按钮来选择
Visual Basic提供了几种用于多媒体开发的控件,主要包括以下几种:(1)Animation控件(2)MCI控件(3)ActiveMovie控件(4)PictureClip控件(5)MCIWnd控件 多媒体API函数
使用MCI控件开发Windows系统下的多媒体程序,具有简单、快捷、方便的特点。但在实际程序设计中,常会碰到一些利用MCI控件不好解决的问题。Visual Basic提供了直接调用Windows的API函数的功能,通过调用API函数,可以实现对系统的各个层次的功能调用。Windows的动态链接库文件winmm.dll文件中包含了100多个具有多媒体处理功能的API函数,这些函数大多为低级的程序接口,可以用于处理语音、合成音乐、动画、视频等
Play方法使Animation控件播放.avi文件。并且可以设置重复播放次数和开始、结束帧 MCI是微软Windows定义的多媒体接口标准。MCI接口包括CDAudio、Scanner、VCR、Videodisc、DAT、DigitalVideo、MMMovie、Sequencer、WaveAudio等
MCI控件具有一组执行MCI命令的下压式按钮。从左到右,依次是Prev、Next、Play、Pause、Back、Step、Stop、Record 和 Eject按钮
UpdateInterval属性
规定两次连续的StatusUpdate事件之间的毫秒数,如果毫秒数是0,表明没有StatusUpdate事件发生
StatusUpdate事件:通过这一事件应用程序可以从Position、Length和Mode等属性中获得状态信息
使用MediaPlayer控件是播放视频最简捷的方法,MediaPlayer控件是Visual Basic 6.0新增加的多媒体控件,具有强大的多媒体播放功能,其操作方法类似于Windows操作系统附件中的Windows Media Player播放器
AutoStart属性:用于指定MediaPlayer控件是否可以自动播放多媒体文件。AutoStart属性设置为True,则程序运行后可自动播放,否则,必须用Play方法播放
Play方法:用于播放多媒体文件,其格式为 MediaPlayer1.Play。与MCI控件相似的是,MediaPlayer控件可以播放多种格式的媒体文件。Pause方法:用于暂停播放多媒体文件,其格式为 MediaPlayer1.Pause。Stop方法:用于停止播放多媒体文件,其格式为 MediaPlayer1.Stop
一、题型及分值:
1.选择题 30题×1’
共30分 2.是非题26题×1’
共26分
3.程序填空题4题,每题3空,每空2分,共24分
4.操作题:ps 1题 * 10分,pr在emiere 1题 * 10分,共20分
二、考试范围
操作系统、多媒体技术概述、图像、动画、视频、VB共6章中的内容。
选择填空题考核动画、VB二章(Flash一章5个实例+七巧板实验中涉及基本命令、常用内置类;VB一章前三个实例涉及控件的属性方法)。操作题考核内容是图像、视频二章。选择、是非上述6章都涵盖。
二、知识点 1.操作系统部分
l
操作系统在计算机体系结构中地位 l
如何理解操作系统两句精髓的话 l
区分五种基本操作系统类型,各自特征(给出定义描述,能选择何种操作系统)l
操作系统的五大功能 l
存储管理的种类
l
典型操作系统window、unix操作系统类型 l
地址重定位概念 l
文件存取方式 l
进程三态
l
进程和线程的区别以及联系;进程和程序的区别和联系 l
内存扩种技术:覆盖和交换 l
进程通讯、临界资源概念 2.多媒体技术
l
六类媒体(给出定义,选择名称)
l
多媒体的基本特征:多样性、交互性、集成性和实时性 l
多媒体数据冗余的种类 l
无损压缩、有损压缩 l
多媒体应用系统开发流程 l
区分色彩空间种类 l
图像文件格式
l
photoshop基本操作(注意上机测试,并可使用help)l
图层、路径、通道、蒙版、色彩调整、滤镜概念
l
运动控制方法:运动学方法、物理推导方法、随机方法、行为规则方法、自动运动控制方法等
l
静态图像的文件大小:图像宽*图像高*颜色深度/8,例如:1024*768*24/8=2.25M l
动态图像大小=静态图像*帧率*时间长,例如:上例PAL制一分钟 2.25M*25*60=3375M l
wav文件大小,例如:以22.05kHz的采样频率、8位的采样精度,录制时间长度为1分钟的声音文件,存储时所需要的存储空间约为:22.05K*8*60/8=1323M l
常用的三类主要的运动控制模型依次是几何模型、物理学模型和行为模型 l
动画的中间画面的生成技术 l
三维动画中物体造型技术
l
ActionScript基本语法(考得不深,基本语法规则了解即可)l
模拟视频和数字视频特点 l
隔行扫描和逐行扫描 l
同步信号和扫描频率的概念 l
电视三种制式区别,记参数 l
HDTV扫描方式和画面比 l
各类视频卡的应用场合 l
流式传输和顺序流式传输的特点 l
视频文件格式和流式视频格式,各自特点 l
premeiere软件的初步使用
l
常见多媒体控件(使用限制,基本特征)l
api函数使用场合 往届操作考题:
1.在Photoshop创建一个15cm×12cm大小的图像文件,制作如图所示(样张字样除外)的魔方图片,并保存为PSD格式图像文件(文件名:班级-学号-姓名.psd;位置:D盘自己学号文件夹下),保存时请保留制作过程产生的图层,不要全部合并,为减少图像文件,可合并部分图层,请保存3个图层。要求:魔方大小为4×4,同一行每一小方格颜色不同,整个魔方共使用4种颜色,制作的魔方具有立体效果。
2.在Premiere中导入视频文件“C:Program FilesAdobePremiere 6.5Sample FolderCyclers.avi”,拖放到时间线。然后为该视频片段添加垂直滚动字幕,字幕字体为楷体,大小36磅,左对齐,字幕开始位于画面下方,字幕保存为“d:学号文件夹学号.prtl”,内容如下。自行车运动 摄影:你的姓名 效果:你的班级 灯光:你的学号
最终效果如下图所示,最后请导出为影片文件(文件名:班级-学号-姓名.avi;位置:D盘自己学号文件夹下)。其中产生的Project文档.ppj文件也请保存在D盘自己学号文件夹下,文件名为班级-学号-姓名.ppj。
1.在Photoshop创建一个15cm×7cm大小的图像文件,制作如图所示(样张字样除外)的空心圆柱及圆锥图片,并保存为PSD格式图像文件(文件名:班级-学号-姓名.psd;位置:D盘自己学号文件夹下),保存时请保留制作过程产生的图层,不能全部合并,请保存背景、圆柱、圆锥3个图层。要求:制作的圆柱和圆锥具有立体效果。
2.在Premiere中导入视频文件 “C:Program FilesAdobePremiere 6.5Sample Folder Cyclers.avi”和“C:Program FilesAdobePremiere 6.5Sample Folder Fastslow.avi”,拖放到时间线。然后为该片段与片段之间添加画面切换特技效果Iris Diamond。最终效果如下图所示,最后请导出为影片文件(文件名:班级-学号-姓名.avi;位置:D盘自己学号文件夹下)。其中产生的Project文档.ppj文件也请保存在D盘自己学号文件夹下,文件名为班级-学号-姓名.ppj。
第二篇:多媒体技术与应用重点知识
媒体分为感觉媒体、表示媒体、表现媒体、存储媒体和传输媒体
1、感觉媒体
感觉媒体指的是能直接作用于人们的感觉器官,从而能使人产生直接感觉的媒体。如文字、数据、声音、图形、图像等。
在多媒体计算机技术中,我们所说的媒体一般指的是感觉媒体。
2、表示媒体
表示媒体指的是为了传输感觉媒体而人为研究出来的媒体,借助于此种媒体,能有效地存储感觉媒体或将感觉媒体从一个地方传送到另一个地方。如语言编码、电报码、条形码等。
3、表现媒体
表现媒体指的是用于通信中使电信号和感觉媒体之间产生转换用的媒体。如输入、输出设备,包括键盘、鼠标器、显示器、打印机等。
4、存储媒体
存储媒体指的是用于存放表示媒体的媒体。如纸张、磁带、磁盘、光盘等。
5、传输媒体
传输媒体指的用于传输某种媒体的物理媒体。如双绞线、电缆、光纤等
多媒体技术的特征 1.多样性
指文字、文本、图形、图像、视频、语音等多种媒体信息于一体。2.交互性
多媒体的第二个关键特性是交互性。所谓交互就是通过各种媒体信息, 使参与的各方都可以进行编辑、控制和传递。
交互性将向用户提供更加有效的控制和使用信息的手段和方法, 同时也为应用开辟了更加广阔的领域。交互可做到自由地控制和干预信息的处理, 增加对信息的注意力和理解, 延长信息的保留时间。3.协同性
每一种媒体都有其自身规律, 各种媒体之间必须有机地配合才能协调一致。多种媒体之间的协调以及时间、空间的协调是多媒体的关键技术之一。4.实时性
所谓实时就是在人的感官系统允许的情况下, 进行多媒体交互, 就好像面对面一样, 图像和声音都是连续的。实时多媒体分布系统是把计算机的交互性、通信的分布性和电视的真实性有机地结合在一起。5.集成性
多媒体技术是多种媒体的有机集成。它集文字、文本、图形、图像、视频、语音等多种媒体信息于一体。
多媒体数据压缩技术:多媒体数据之所以能够压缩,是因为视频、图像、声音这些媒体具有很大的压缩力。以目前常用的位图格式的图像存储方式为例,在这种形式的图像数据中,像素与像素之间无论在行方向还是在列方向都具有很大的相关性,因而整体上数据的冗余度很大;在允许一定限度失真的前提下,能对图像数据进行很大程度的压缩。
显卡:显示适配器即显卡,其作用是将CPU送来的图像信号经过处理再输送到显示器上。性能指标:接口,芯片,显示内存。
声卡:声音适配器即声卡,其主要用于处理声音,是多媒体计算机的基本配置。目前多数主机板上集成了声卡的功能,声卡可能不单独存在。
其功能:1·进行A/D(模/数)转换,将模拟的声音转化成数字化的声音。
2·进行D/A(数/模)转换,将数字化声音转换成模拟的声音。
3·实时、动态地处理数字化声音信号。
4·输入、输出
性能指标:采样频率,样本位数,MIDI合成方式
数码相机,是一种利用电子传感器把光学影像转换成电子数据的照相机。按用途分为:单反相机,微单相机,卡片相机,长焦相机和家用相机等。数码相机与普通照相机在胶卷上靠溴化银的化学变化来记录图像的原理不同,数字相机的传感器是一种光感应式的电荷耦合器件(CCD)或互补金属氧化物半导体(CMOS)。在图像传输到计算机以前,通常会先储存在数码存储设备中(通常是使用闪存;软磁盘与可重复擦写光盘(CD-RW)已很少用于数字相机设备)。
声音3要素:音调、响度(音强)、音色 声波:频率、声压、频谱
PCM编码:是一种把模拟信号转换成数字信号的最基本的编码方法,它主要包括采样,量化,和编码3个过程。采样:每隔一定时间测量一次声音信的幅值,把时间连续的模拟信号转换成时间离散,幅度连续的采样信号。如果采样的时间间隔相等,就是均匀采样。量化:按“四舍五入”或其他方法将采样得到的数值限定在几个有限的数值中,将采样信号转换成时间离散,幅度离散的数字信号。编码:将量化后的信号转成一个二进制码组输出。
数字音频的技术指标;
1采样频率,一秒钟采样的次数2采样精度,用每个声音样本的位数表示3,声道数,4音频数据传输率数据传输率(bps)=采样频率(HZ)x量化位数(b)x声道数5编码算法与音频数据压缩比 数字音频文件格式 WAVE文件格式2MPEG文件(MP3是MPEG-1第三层,压缩比例达10:1~12:1。MP1,4:1。MP2,6:1~8:1)3,RealAudio文件4WMA文件
MIDI是音乐盒计算机结合的产物,它是用于在音乐合成器,电子乐器,计算机之间交换音乐信息的一种标准协议。行程编码:仅存储一个像素值以及具有相同颜色的像素数目的图像数据编码方式称为行程编码,或称游程编码 颜色的描述与度量
颜色是人的视觉系统对可见光的感知结果,感知的颜色由光波的频率决定。颜色是人的大脑对物体的一种反映是一种感觉,光波是一种具有一定平率范围的电磁波,其波长覆盖的范围很广。颜色的三要素,色调,饱和度,明度 颜色空间
颜色空间是组织和描述颜色的方法之一,也可称为颜色模型。
1,RGB颜色空间 2,CMYK颜色空间3,XYZ颜色空间4,Lab颜色空间5,HSL颜色空间 6,YUV颜色空间 图像的种类
矢量图和位图,矢量图记录的是路径和衔点,位图是每个像素的颜色 图像深度
图像深度也成图像的位深,是指描述图像中每个像素的数据所占的二进制位数。GIF文件格式
GIF图像是基于颜色列表的,最多支持8位256色,支持动画,透明背景 电视信号
电视信号主要由图像信号和伴音信号两大部分组成。图像信号的频带位0MHZ-6MHZ,伴音信号的频带一般为20HZ-20KHZ。
电视中使用亮度Y和色差C1/C2表示彩色图像。视频中采用Y,C1,C2表示彩色有两个优点,1是Y和c1,c2是独立的,因此彩色电视和黑白电视可以同时接收彩色电视信号,2是可以利用人眼对亮度较为敏感,而对色度相对不够敏感的视觉特性,降低c1,c2信号的采样频率,使c1,c2的带宽明显低于Y的带宽,而又不影响重显色彩图像的观看。avi文件格式
avi是音频视频交错的英文缩写,是Microsoft公司开发的一种符合RIFF文件规范的数字音频与视频文件格式。avi文件的结构为;一个表头+两个列表,avi格式是专业人员最常采用的一种视频格式,可以说从dv带转换到计算机视频文件众多格式中,avi的画面损失最小。优点是图像质量好,可以跨多个平台使用,缺点是体积过于庞大,而且压缩标准不统一。Flash视频
支持矢量图,位图,运动补间,形状补间,FLV格式是一种新的视频格式,由于它形成的文件极小,加载速度极快,使得网络观看视频成为可能,它有效解决了swf文件体积庞大不能在网络上很好使用的缺点
磁道是同心圆,光道是螺旋形 信息储存介质:硬盘(最快),光盘cd,软盘,半导体,CD
1.CD-DA 激光数字唱盘2.CD-ROM光盘储存器 3.CD-I扇区结构跟CD-XA一样 4.CD-ROM/XA 5.Photo CD 存放彩色照片 6.CD-Bridge盘
7.VCD 8.CD-R DVD-5
DVD-9
DVD-10 DVD-18 播放时间
133min 241min 266min 482min 光盘容量
4.7GB
8.5GB
9.4GB
17GB
资源预留协议RSVP:是在Internet上的资源预订协议,是用来为因特网中的一次会话预留资源的。能在一定程度上为流媒体的传输提供服务质量保证。支持两种服务类型:受控载荷服务和保证服务
实时传输协议RTP:是为支持实时业务而设计的,是在点对点通信和多点广播网络上实时传输流媒体数据的实时传输协议。业务的发送和接受必须在很短的时间内完成,是封装协议。组成部分:RTP(数据协议)和RTCP(控制协议)
流媒体:又叫流式媒体,是边传边播的媒体,是多媒体的一种。边传边播是指媒体提供商在网络上传输媒体的“同时”,用户一边不断地接收并观看或收听被传输的媒体。“流”媒体的“流”指的是这种媒体的传输方式(流的方式),而并不是指媒体本身。
HTML,超文本
软件危机:早期的软件开发技术不能满足用户对软件的要求,软件开发效率低、质量差、周期长、费用高的问题日益严重,导致了软件危机。软件开发模型 瀑布模型:瀑布模型是将软件生存周期的各项活动规定为以线性顺序连接的若干阶段,形如瀑布流水,最终得到软件产品。特点严格按时间顺序执行,完不成前一阶段的任务,则不能进行下一阶段的工作。缺点缺乏灵活性,无法解决软件需求不明确的问题
原型模型:也称样品模式,根据用户需求,快速建立一个系统的“样品”雏形,再根据用户意见,通过不断改进完善样品,最后得到的样品就是用户所需要的产品。
多媒体著作通常以电子化的形式表现,主要包括电子图书,电子期刊,电子新闻报纸,电子手册,电子文献,电子图画、广告和电子声像制品等。特殊性:
1、首先,它是基于内容的,即多媒体著作包含用户所需的全部内容,用户只能浏览、学习使用,而不能进行添加、修改内容;
2、其次,多媒体著作不管以哪种类型表现,其最终目的都是用来传播信息,给人以某种特定知识与技能的。
Authorware应用程序由图形化的流程线和图标组成。
使用一个57X55的矩阵存储图像,假设矩阵中每个元素使用一个字节来储存,则存储空间为:55X57X1=3135B 如果是存储彩色图像,则需要分别存储R、G、B3个分量,则存储空间为:3135X3=9405B
第三篇:多媒体技术与应用期末重点
多媒体重点!!第一章:
·1985年,美国Commodore公司将世界上第一台多媒体计算机系统Amiga展现在世人面前。·媒体课氛围下列五大类:感觉媒体(视觉、听觉等)、表示媒体(文字、音频、图形、图像、动画、视频等)、显示媒体(键盘、显示器等)、存储媒体(光盘等)和传输媒体(光纤等)。
·多媒体技术具有以下特征:多样性、集成性、交互性、实时性。·多媒体系统的层次结构:(从最底到最高):多媒体硬件系统、多媒体驱动程序、多媒体操作系统、多媒体开发工具、多媒体应用软件。·多媒体硬件构成:(选择)
图像输入
图像输出 音视频输入
音视频输出 多媒体板卡
通信网络
·多媒体软件三类:多媒体系统软件、多媒体支持软件(多媒体素材制作工具:Photoshop等等;多媒体著作工具:ppt等;多媒体编程语言:c++等)、多媒体应用软件。
·超文本和超媒体的数据模型是一个复杂的非线性网络结构,结构中包含的三要素是结点、链、网络。
·虚拟现实的特征:多感知性、临场感、交互性、自主性。
第二章:
·声波的三个重要指标:振幅、周期、频率。·声音质量的频率范围(/Hz):调幅广播:50-7000 调频广播20-15000 ·目前通用的采样频率有3个:11.025kHz,22.05kHz,44.1kHz(选择)·声音数字化的数据量=采样频率(Hz)*量化位数(b)*声道数/8(B/s)·音频信号的压缩编码主要分为无损压缩编码和有损压缩编码两大类。无损压缩编码包括不引入任何数据失真的各种熵编码(霍夫曼编码、算术编码、行程编码),有损压缩编码又分为波形编码、参数编码、混合编码。
·如果最初音量很小甚至无声,最终音量相对较大,就形成了一种淡入、渐强的效果;
如果最初音量较大,最终音量很小甚至无声,就形成了一种淡出、渐弱的效果。
·目前,MIDI合成方式主要是调频合成法【又称FM合成法】和波形表合成法【又称WT合成法】(音质更好一些)。
·特征提取:用于提取语音中反映本质特征的声学参数,如平均能量、平均跨零率、共振峰等。
模式匹配部分是整个语音识别系统的核心,它是根据一定的准则以及专家知识,计算输入特征与库存模式之间的相似度,判断出输入语音的语意信息。
·文本-语音转换技术是基于声音合成技术的一种声音产生技术,它能将计算机内的文本转换成连续自然的语言流。这种转换实际上是系统按需求先合成语音单位,再按语言学规则连接起来,形成自然的语言流。(可能简答)
第三章:
·显示分辨率:是指在显示器上能够显示出的像素数目,由水平方向的像素总数和垂直方向的像素总数构成。
图像分辨率:是指数字图像的实际尺寸,反映了图像的水平和垂直方向的大小。
像素分辨率:是指显像管荧光屏上一个像素点的宽和长耳之比。·颜色深度:是指记录每个像素所使用的二进制位数。
·通道:图像中各种单色分量的分布状态。通道主要有两个作用:一是存储彩色信息,二是保存选择区域。
通道的种类:默认通道、Alpha通道、专色通道。(选择)
第四章:
·动画字实际的播放过程中有几种不同的方式:在电影中以24帧/秒的速度播放,在电视中,PAL制式以25帧/秒的速度播放,NSTC制式以30帧/秒的速度播放。·计算机动画:是指借助于计算机生成一系列连续图像画面并可动态实时播放这些画面的计算机技术。
第五章:
·视频:指连续地随时间变化的一组图像。
·常见的彩色电视制式:PAL制式(德国、英国、中国、朝鲜等),HDTV(每帧扫描在1000行以上,宽高比是16:9),NTSC制式,SECAM制式
·视频的特点:①视频信息具备高分辨率,色彩逼真。②人类接受的信息越70%来自视觉,其中视频信息是最直观、生动、具体的一种承载信息的媒体。③视频的信息容量大,通过视觉获得的视频往往比通过听觉获取的音频信息有更大的信息量。·数字视频的主要优点有:便于处理、再现性好、网络共享。(扩充。简答)
·视频卡的种类:视频采集卡、视频压缩卡、视频输出卡、视频叠加卡、电视接收卡。
第六章:
·多媒体著作工具扥分类:根据多媒体著作工具的创作方法和特点的不同,将其划分为基于页或卡片,基于图标以及基于时间等3种多媒体著作工具。·基于时间的多媒体著作工具:Director和Action
第七章:
·瀑布模型将软件生命周期分为7个阶段:问题定义、需求分析、系统设计、详细设计、编码、测试、运行和维护等。
·采用螺旋模型开发多媒体应用软件的步骤:(简答)
·一个完整的多媒体软件开发组同行需要配备下列各种开发人员:项目经理、多媒体设计师(脚本创作师、专业设计师)、多媒体软件工程师。
·螺旋模型的开发过程:需求分析、脚本设计、素材制作、编码集成、系统测试、使用和维护。
·多媒体软件的画面构成:连续、渐变、对称、对比、比例、平衡、调和、律动、统一、完整。
第四篇:《多媒体技术及其应用》期末考试(新)
` 《多媒体技术及其应用》考试复习
考试题型:选择题、填空题、算法设计、简答题
一、选择题部分:5题*3分/题=15分
1、颜色模型的应用范围
显示彩色图像的电视机和计算机显示器色彩显示原理主要基于图像的颜色模型。颜色模型主要有HSV(面向用户,对应于画家的配色方法)、RGB(通常使用于彩色阴极射线管等彩色光栅图形显示设备中)、HSI、CHL、LAB、CMY(应用于印刷工业)等。
2、信息媒体的分类
根据国际电报电话咨询委员会(CCITT)的定义,媒体分为:感觉媒体、表示媒体、展现媒体、存储媒体、传输媒体
其中,存储媒体和和传输媒体称为信息交换媒体。
根据时间在表示空间中的作用,媒体分为:离散媒体、连续媒体
3、压缩编码标准(有损、无损的分类)
数据压缩的评价标准: 压缩比:越大越好
数据质量:数据失真越小越好
压缩与解压缩的速度:速度越快越好
有损压缩无损压缩统计编码PCM编码预测编码变换编码混合编码JPEGMPEGH.261行程编码哈夫曼编码香农编码算数编码LZW编码DPCM编码ADPCM编码帧间预测编码离散余弦变换K-L变换小波变换
4、图像的基本属性描述
分辨率
显示分辨率:指显示屏上能够显示出的像素数目。
图像分辨率:指组成一幅图像的像素密度的度量方法。
像素深度,即像素的所有颜色分量的二进制位数之和,它决定了不同颜色(亮度)的最大数目。或者确定灰度图像的每个像素可能有的灰度级数。` 颜色空间,指彩色图像所使用的颜色描述方法,也叫颜色模型。真彩色、伪彩色与直接色
真彩色是指在组成一幅彩色图像的每个像素值中,有R、G、B3个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。
伪彩色是指每个像素的颜色不是由每个基色分量的数值直接决定的,而是把像素值当做彩色查找表(CLUT)的表项入口地址,去查找一个显示图像时使用的R、G、B强度值,用查找出的R、G、B强度值产生的彩色称为伪彩色。
直接色是指每个像素值分成R、G、B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后的得到的R、G、B强度值产生的彩色称为直接色,它的特点是对每个基色进行变换。
5、信息熵和信息编码的关系
若信息熵H,平均编码长度为L。
如果L远远大于H,则该编码为非最佳编码,说明编码中仍有数据冗余,可以进一步压缩;如果L小于H,证明是不可实现的。所以,通常情况下,最佳编码应该满足L稍大于H。
6、MPEG-1、2、4、7的用途
MPEG-1:数字电话网络上的视频传输,如非对称数字用户线路(ADSL)、视频点播(VOD)及教育网络,同时也用于多媒体的信息存储和Internet音频传输。
MPEG-2:对音频、视频、码流合成、音视频控件方面进行大量的扩充 MPEG-4:视频
MPEG-7:数字化图书馆、多媒体目录服务、广播式媒体选择、多媒体编辑、教育、娱乐、新闻、旅游、医疗、购物、地理信息系统
7、多媒体数据库管理系统(MDBMS)体系结构 P179 多媒体数据库系统的体系结构可分为层次结构和组织结构。多媒体数据库的层次结构可分为媒体支持层、存取与存储数据模型层、概念数据模型层和多媒体用户接口层等4层。
用户
多媒体用户接口层
数
概念数据模式层 据
模
型存取与存储数据模式
层
媒体支持层
图为层次结构示意图
多媒体数据库的组织结构可分为协作性、集中统一型、客户/服务器型和超媒体型等4种。
8、哪些是损编码、无损编码?(参考题三)`
9、关于MIDI的描述
MIDI即电子乐器数字接口。用于在音乐合成器、乐器和计算机之间交换音乐信息的一种标准协议。MIDI是音乐和计算机使用的标准语言,是一套指令(即命令的约定),不是声音信号,在MIDI电缆上传送的不是声音,而是发给MIDI设备或其他装置,让它产生声音或执行某个动作的指令。产生MIDI音乐的方法有:FM合成法、乐音样本(波形表)合成法。
MIDI是一种数字音乐的国际标准,MIDI文件存储的不是波形而是指令序列。
10、多媒体硬件原理
多媒体硬件系统是多媒体计算机实现多媒体功能的物质基础,任何多媒体信息的采集、处理和播放功能都离不开多媒体硬件技术的支持。
计算机系统中,为了对多媒体信息进行存储处理,需要先把音频信号、视频信号数字化,以数字形式存入计算机存储器中。然后计算机软件才能对它们加以有效的处理。但是,数字化的音频、视频数据量非常大,需要把它们进行压缩并存入大容量存储器;音频信号、视频信号的输入输出都是实时的,需要很快的速度,实现以上要求,必须有专用的多媒体硬件支持。
二、填空题部分:5题*3分/题=15分
1、掩蔽效应:时域掩蔽、频域掩蔽。
一种频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应。
2、多媒体通信系统 P325 计算机网络是多媒体通信的基础,电路交换网络和分组交换网络的融合是构造多媒体通信系统结构的出发点。多媒体系统主要有网关、会务器和通信终端组成。网关和会务器是多媒体通信系统的两个极其重要的组成部件。
3、动画的分类
按生成动画方式分为:帧到帧动画、实时动画;
按运动控制方式分为:关键帧动画、算法动画、基于物理的动画; 按变化的性质可分为:运动动画(如景物位置发生改变)、更新动画(如光线、形状、角度、聚焦发生改变)。
4、仿射变换
110cosasina0Sx00
平移:010
缩放:0Sy0 sinacosa0旋转:1010100TxTy
5、采样定理
为了保证采样后的信号能真实的保留原始模拟信号的信息,采样信号的频率必须至少为原信号中最高频率成分的2倍。
6、MIDI声音的合成方法
一种是FM(Frequency Modulation)合成法,另一种是乐音样本合成法,也称为波形表(Wavetable)合成法。此外,还有波表合成和物理模型合成法。
7、信息熵的概念、公式
信息熵是信息论中用于度量信息量的一个概念。一个系统越是有序,信息熵就越低; ` 反之,一个系统越是混乱,信息熵就越高。所以,信息熵也可以说是系统有序化程度的一个度量。信息熵Hp(i)log2p(i)(i=1,„„,n),即信息集N的平均信息量。
i1n8、多媒体硬件原理
多媒体硬件系统是多媒体计算机实现多媒体功能的物质基础,任何多媒体信息的采集、处理和播放功能都离不开多媒体硬件技术的支持。
计算机系统中,为了对多媒体信息进行存储处理,需要先把音频信号、视频信号数字化,以数字形式存入计算机存储器中。然后计算机软件才能对它们加以有效的处理。但是,数字化的音频、视频数据量非常大,需要把它们进行压缩并存入大容量存储器;音频信号、视频信号的输入输出都是实时的,需要很快的速度,实现以上要求,必须有专用的多媒体硬件支持。
9、多媒体软件设计方法、步骤
软件从设计到完成可以用一种生命周期模型开描述,生命周期指的是软件开发的整个开发、使用、维护和报废的过程。最主要且用的最多的软件开发模型是瀑布模型和螺旋模型,此外还有快速原型模型等方法。软件开发阶段主要过程有:
(1)需求分析;
(2)应用系统结构分析(初步设计);(3)建立设计标准和细则(详细设计);(4)准备多媒体数据;(5)制作生成多媒体应用系统(编码与集成);
(6)系统的测试与应用。其中软件测试应包括可靠性、可维护性、可修改性、效率及可用性等。
软件人机界面设计过程:(1)界面风格的设计(2)系统界面布局分析(3)打开界面的结构体系(4)文字的应用(5)色彩的选择(6)图形和图标的使用 人机界面设计过程遵循的原则:(1)用户原则(2)信息量最小原则(3)帮助和提示原则(4)媒体最佳组合原则(5)纠错原则(6)艺术性原则
设计步骤:1.客户咨询2.上门拜访3.探讨分析4.提供制作方案5.签定合同6.成立专门项目小组7设.计制作8.修改9.技术合成10.测试版11.交付使用12.生产、包装
10、离散变换原理
离散余弦变换(DCT变换)可表示为:
m1F(u,v)C(u)C(v)[4x0y0nf(x,y)cos((2x1)u(2y1)v)cos()] 16161C(z)2其中 1z0z0
11、傅里叶变换概念
傅里叶变换时一种将信号从时域变换到频域的变换形式。
傅里叶变换公式
F(w)F[f(t)]f(t)eiwtdt
逆向傅里叶变换公式
f(t)F1[F(w)]1iwtF(w)edw 2 `
12、人耳能够判别出声音到左右耳相对时差、声强(频差),能判别声音方向及由于空间使声音来回反射造成的特殊效果。
三、算法设计部分:2题*10分/题=20分
1、Huffman编码 编码过程:
(1)对图像中出现的不同像素值进行概率统计,得到N个不同概率的信息符号。(2)按符号出现的概率由大到小,由上到下排列。(3)对两个最低概率符号分别以二进制0、1赋值。
(4)两最低相加后作为一个新符号的概率重新置入符号序列中。(5)对概率按从大到小重新排列。
(6)重复2~5,直到只剩下两个概率符号的序列。
(7)分别以二进制0、1赋值后,以此为根节点,沿赋值的顺序的逆序依次写出该路径上的二进制代码,得到Huffman编码。解码过程:
(1):判断解码数据的类型选择与之对应的表。(2):进行码长的判断。(3):计算DHT地址。(4):从DHT表中读取数据。(5):若为DC数据需要进行DPCM解码。
2、LZW编码
(1)编码过程:
步骤1: 开始时的词典包含所有可能的根(Root),而当前前缀P是空的; 步骤2: 当前字符(C):=字符流中的下一个字符; 步骤3: 判断缀-符串P+C是否在词典中
(1)如果“是”:P := P+C //(用C扩展P);
(2)如果“否”
① 把代表当前前缀P的码字输出到码字流;`
② 把缀-符串P+C添加到词典;
③ 令P := C //(现在的P仅包含一个字符C);步骤4: 判断码字流中是否还有码字要译
(1)如果“是”,就返回到步骤2;
(2)如果“否”
① 把代表当前前缀P的码字输出到码字流;
② 结束。(2)译码过程
步骤1: 在开始译码时词典包含所有可能的前缀根(Root)。步骤2: cW :=码字流中的第一个码字。
步骤3: 输出当前缀-符串string.cW到码字流。步骤4: 先前码字pW := 当前码字cW。
步骤5: 当前码字cW := 码字流中的下一个码字。步骤6: 判断先前缀-符串string.pW是否在词典中
(1)如果“是”,则:
① 把先前缀-符串string.pW输出到字符流。
② 当前前缀P :=先前缀-符串string.pW。
③ 当前字符C :=当前前缀-符串string.cW的第一个字符。
④ 把缀-符串P+C添加到词典。
(2)如果“否”,则:
① 当前前缀P :=先前缀-符串string.pW。
② 当前字符C :=当前缀-符串string.cW的第一个字符。
③ 输出缀-符串P+C到字符流,然后把它添加到词典中。
步骤7: 判断码字流中是否还有码字要译
(1)如果“是”,就返回到步骤4。
(2)如果“否”, 结束。
3、算术编码
给定事件序列的算术编码步骤如下:
(1)编码器在开始时将“当前间隔” [ L,H)设置为[0,1);(2)对每一事件,编码器按步骤(a)和(b)进行处理;(a)编码器将“当前间隔”分为子间隔,每一个事件一个;(b)一个子间隔的大小与下一个将出现的事件的概率成比例,编码器选择子间隔对应于下一个确切发生的事件相对应,并使它成为新的“当前间隔”;
(3)最后输出的“当前间隔”的下边界就是该给定事件序列的算术编码。编码过程伪代码描述如下:
Set Low to 0 Set High to 1 While there are inputs symbols do Take a symbol Code Range = High – Low High = Low + Code Range * High Range(symbol)Low = Low + Code Range * Low Range(symbol)End of while ` Output Low 算术码解码过程用伪代码描述如下:
get encoded number do find symbol whose range straddles the encoded number output the symbol range = symbo.LowValue – symbol.HighValue substracti symbol.LowValue from encoded number divide encoded number by range until no more symbols
四、简答题部分:5题*10分/题=50分
1、声音的数字化(滤波、采样、量化、编码、混叠)。
采样:曲线代表声波曲线,是连续变化的模拟量,时间轴以一种离散分段的方式来表示,并且波形以固定的时间间隔来测量其值。
量化:本质是A/D转换,也可以看作是采样时间内测量模拟信息值的过程。编码:本质就是压缩,分为有有损压缩和无损压缩。
2、均匀量化及非均匀量化的原理和优点。
均匀量化是一种把输入信号的取值域等间隔分割的量化。均匀量化的好处就是编解码的很容易,但要达到相同的信噪比占用的带宽要大。
非均匀量化是一种在输入信号的动态范围内量化间隔不相等的量化。它与均匀量化相比,有两个主要的优点:(1)当输入量化器的信号具有非均匀分布的概率密度时,非均匀量化器的输出端可以较高的平均信号量化噪声功率比;(2)非均匀量化时,量化噪声功率的均方根值基本上与信号抽样值成比例。因此,量化噪声对大、小信号的影响大致相同,即改善了小信号时的量化信噪比。
3、信息数字化的参数(量化位数、声道数、采样数等)解释。
声音信息:
采样频率:是指1秒钟内的采样次数。计算机音频处理中,常用的采样频率有11.025kHz、22.05kHz和44.1kHz。
量化位数:是指描述每个采样点值的二进制数位。常用的量化位数为8位和16位。声道数:又称为声音通道的个数,是指一次采样同时记录的声音波形个数。随着声道数的增加,存储容量也相应增大。
图像信息:
采样频率:采样点之间的间隔大小,采样频率越高,获取的样本就细腻逼真,图像的质量越高。
量化等级:是指图像样本量化后每个采样点用多少位二进制数表示,它反映了采样的质量。
4、MPEG的概念及MPEG-1中的主要技术。
MPEG系列标准是由ISO/IEC共同制定的。MPEG系列标准作为运动图像压缩编码国际标准具有良好的兼容性较高的压缩比(最高可达200:1),而且数据损失小。` MPEG-1用于帧内压缩编码的主要技术有:(1)基于8×8像素块的余弦变换DCT;(2)量化器;(3)Z型扫描与行程长度编码;(4)熵编码;(5)信道缓存。
MPEG-1用于帧间压缩编码的主要技术有:(1)运动估计;(2)运动补偿。
5、图像滤波技术的作用及傅里叶变换。
滤波技术的作用:(1)去噪;(2)对信号做平滑;(3)可以把声音细节提取出来。图像滤波频域操作:傅里叶变换然后过滤频谱; 滤波空间操作:通过滤波函数空间卷积;平滑或锐化;
6、简述滤波的基本原理。
对每个点的像素值计算,由该点本身灰度值以及领域内的其他像素值加权平均值所得,而加权平均的权系值由二维离散采样归并所得。
7、立体声原理及变调是如何实现的。
立体声原理:人耳能够判别出声音到左右耳相对时差、声强(频差),能判别声音方向及由于空间使声音来回反射造成的特殊效果。
变调是如何实现的:启动Cool Edit,载入需要处理的声音文件。在菜单栏上单击Transform选择Time/Pitch中的Stretch命令,在Stretch对话框,选择Pitch Shift,这是固定音频时间长度的要点。然后,通过Transpose下拉列表框进行调整,软件已经按音乐调子设好变调幅度了,可以半度半度地升调或降调,按下OK确认,开始喧染。完成后,即可按播放键试听变调后的效果。
8、文—语转换系统结构及主要技术。
综合谱,形状反射,声谱特征音素库文本文本分析音标韵律语音控制韵律控制(节奏、音调)语法规则发音词典韵律库语音合成器语音输出词库音长,加重,声调,停
文—语转化系统结构
文语转换的目的是将计算机内存储的文本自动转换为声音输出,其主要技术是文字转换成语音的技术,文字以数字或代码形式表示的语言信息,由计算机合成后发出的语音,该过程包含很多高级的信息处理和发音器官复杂的生理控制。文-语转换系统由发音器、发声的驱动器两部分组成。`
9、JPEG基于DCT顺序编码模式的一般过程。
第一步:颜色模式转换及采样;第二步:DCT变换;第三步:量化;第四步:编码。
10、小波变换的算法基本思想。
小波变换编码技术的基本原理是对整幅图像进行变换,采用小波变换的本质是对一幅图像进行高通和低通滤波,对不同的频带上的图像部分可采用不同的量化技术进行量化。其主要依据是变换后的各级分辨率的图像之间自相似的特点,采用逐级逼近技术来实现减少编码的数据量。
设f(t),(t)是平方可积函数,且(t)的傅立叶变换()满足条件:则称Wf(a,b)f(t),a,b(t)1af(t)(|()|2d,Rtb)dt,(a0)为f(t)的连续小波变换,Ra1tb称(t)为小波函数或小波母函数,称a为尺度因子,b为平移因子,a,b(t)()。aa
11、MPEG-4的体系结构与技术。
MPEG-4标准的体系结构有5个部分组成,分别是: 第一部分:DMIF(多媒体传送整体框架),包括3个方面的技术,交互式网络技术,广播技术和磁盘技术。
第二部分:缓冲区管理和实时识别。第三部分:音频编码。第四部分:视频编码。第五部分:场景描述。
12、图形填充算法、图形光照模型和光线跟踪法。光照模型:模拟物体表面的光照物理现象的数学模型。有序边表算法
1.求出每一扫描线与多边形各边交点,把各交点坐标(xk,yk)存贮在表中; 2.按扫描线以及扫描线上交点x值递增顺序对该表进行排序。如交点(x1,y1)和(x2,y2),当y1<y2或y1﹦y2而x1≤x2时,(x1,y1)将位于(x2,y2)的前面;
3.按(x1,y1)和(x2,y2)形式成对提取巳排序表的交点; 4.将每一对交点之间的象素置成填充的光强或颜色。边填充法
1.取多边形的一条边;
2.求出每一扫描线与该边交点坐标(xk,yk); 3.将(xk,yk)右边的全部象素取补;
4.还有没处理的多边形边时转1,否则结束。堆栈种子填充算法
种子象素压入堆栈; 2 当堆栈非空时做
(1)栈顶象素出栈;
(2)将出栈象素置填充色; `(3)检查每个与当前象素邻接的4连接象素,若其中有象素不为边界且没有设置成填充颜色,将该象素压入堆栈;
(4)转2
扫描线种子填充算法
扫描线种子填充算法适用于边界定义的区域。算法如下:
F(k)f(n)en0N1j(2)nkN1f(n)NF(k)ek0N1j(2)nkN 1 种子象素入栈; 2 当堆栈非空时做
(1)栈顶象素出栈;
(2)沿扫描线对出栈象素的左右象素填充,直到遇到边界象素为止,即每出栈一象素,便对包含该象素整个区间填充;
(3)上述区间内最左最右的象素分别记为xLeft,xRight;
(4)在区间[xLeft,xRight]中检查与当前扫描线相邻的上下两条扫描线的有关象素是否全为边界象素或为已填充象素,若存在非边界未填充象素,则把每一区间最右象素取作种子入栈;
(5)转2 光线跟踪算法
光线跟踪过程可用二叉树(称光线跟踪树)表示。逐个将相交点加入到二叉树中,树的左分支表示反射光线,右分支表示透射光线。光线跟踪树最大深度可由用户选定,或由存储容量决定。当树中一束光到达光源、背景或预定的最大深度时,停止跟踪。在计算象素光强时,需从叶结点开始由底向上遍历相应二叉树,在树每个结点处,递归调用整体光照模型公式,累计光强贡献直到二叉树根结点。
光线跟踪法考虑来自环境的漫射、镜面反射和透射对物体表面产生的光强,其光照模型由Whitted提出: I﹦I1﹢RsIs﹢RtIt 其中,I1是不考虑环境影响,由简单光照模型计算的光强;Is是在镜面反射方向上来自其它物体的光强;It是在折射方向上来自其它物体的光强;Rs和Rt分别表示物体表面反射系数和透射系数。此式也称整体光照模型。
综上,从视点到物体表面上任一点I为反射光强度Ie、漫反射光强度Id及镜面反射光强度Is总和,即 I﹦Ie﹢Id﹢Is=kaIa﹢kdIl(N·L)﹢ksIl(R·V)n
第五篇:多媒体技术基础与应用考试重点
1.什么是媒体?
媒体是一种信息发布和表现的形式。
2.按照ITU的定义,媒体是如何分类的? 感觉媒体、表示媒体、显示媒体、存储媒体、传输媒体
3.多媒体有哪些关键特性?
交互性、多样性、集成性、数字化
4.多媒体数据有哪些特性?
数据量大、数据长度不定、多数据流、数据流的连续记录和检索
5.多媒体信息的主要表现形式
文本、图形与图像、音频、视频、动画
1.数字多媒体计算机系统的两部分组成:硬件系统和软件系统
2.多媒体计算机系统的硬件系统有哪些? 主机系统、磁存储系统、显示系统、信息处理器及芯片
3.多媒体计算机系统的硬件系统常用设备有哪些?
光盘存储、调制解调器、电话、数码相机、打印机、扫描仪、绘图仪、模拟录像、摄像机、电视、投影仪、语音输入设备、音频设备、MIDI设备、音箱
1.光盘存储具有哪些特点?
记录密度高、存储容量大、采用非接触方式读/写信息、信息保存时间长、不同平台可以互换、取代传统媒体存储介质、价格低廉
2.光盘的类型
只读型光盘存储器、多次可写光盘存储器、可重写光盘存储器
3.目前主要的光盘标准及含义
CD-DA标准:数字式激光唱盘CD-ROM标准:只读式唱盘
CD-R标准:可记录光盘Video CD:数字电视视盘
DVD:数字通用光盘蓝光DVD与HD DVD
3.提高光盘记录密度的技术
一般而言,光盘片的记录密度受限于读出的光点大小,一般可使用波长更短的激光或提高物镜的数值孔径使光点缩小,另一个主要办法就是缩小存储轨道间的间距
1.决定音频信号波形的参数是:频率、幅度
2.模拟音频数字化的过程及相关参数 采样(44.1KHz)、量化(16位)、编码
3.数字激光唱盘质量(CD-DA质量)、高频无线电广播质量(FM质量)、调幅无线电广播质量(AM质量)、电话质量中CD-DA等级最高。
4.音频技术指标:CD音质
CD音质:指录音采样频率达到44.1KHz,用16位量化指标记录声音。
5.常用的音频文件格式: WAV(波形)、MP3、MP4、RA/RM/RAM
6.衡量光盘记录密度的指标有哪些? 光点大小、存储轨道间的间距
7.声卡的主要性能指标:音频技术指标、MIDI音频、声道数、多音频流输出、I/O设备接口、声卡软件、总线结构
1.图像的分类:数字图像、可见图像、不可见图像
2.图像的数字化过程:图像的采样、图像量化、图像的编码与压缩
3.色彩的三要素:高度、色调和饱和度。
4.色彩模型的种类:RGB模型(三基色)、HSL模型(三要素)、CMY模式(印刷)、Lab模型
5.图像分辨率概念:指数字化图像在大小,以水平的和垂直的像素点表示。
6.图像分辨率和显示分辨率的关系:
7.常用图像文件格式:BMP、JPEG、JPEG2000、TIFF、GIF、MACPAINT(扩展名为MPT、MAC)、PNG、PSD
8.图像处理软件:Adobe Photoshop
1.数字化视频的优点:适合于网络应用、再现性好、便于计算机编辑处理
数字化视频的缺点:所需的数据存储空间大,导致数字图像的处理成本增高。
2.常用的电视信号制式:NTSC制、PAL制(我国电视信号制式)、SECAM
3.电视信号组成(全电视信号):高度信号、色度信号、复合同步信号和伴音信号。
4.彩色电视的信号类型:高频或射频信号、复合视频信号、S-Video视频信号、分量视频信号。
5.视频的数字化过程:采样、量化、编码 数字视频的采样格式分别有4:1:
1、4:2:2(我国)和4:4:4三种
6.数字视频常用的采样格式为了4:2:2,含义为:
表示在每条扫描线上每4个连续的采样点取4个高度信号Y样本,取两个红色差Cr样本和两个蓝色差Cb样本,平均每个像素用两个样本表示。4:2:2格式中色度信号取高度信号采样频率的一半,可以减少数字视频的数据量。
7.数字视频处理系统的组成:视频采集设备、视频信号源设备、大容量存储设备、安装有相应视频处理软件的高性能计算机系统。8.常用本地视频格式:AVI格式、MPEG格式 9.常用的流媒体格式:RM(Real Media)格式、Quick Time格式(MOV)、WMV格式 10.视频处理软件:Adobe Premiere 1.动画必须遵循的3个规则:(1)动画由多幅内容相关的连续画面组成(2)各幅画面的内容有所不同,彼此具有规律性的差异,目的是表现出“动”的效果(3)所谓画面内容连续是指后一幅画面的内容(动作)是前一幅画面内容(动作)的继续。2.计算机动画采用的技术和方法:关键帧动画、路径动画、变形动画 3.常用二维动画的格式:SWF、GIF、FLA 4.常用二维动画制作软件:FLASH 1.压缩的概念:去掉信息中的冗余,即保留不确定的信息,去除确定的信息,也就是用一种更接近信息本质的描述来代替原有冗余的描述。2.数据为什么能压缩?(1)连续多帧画面在很大程度上是相似的,而这些相似的信息为数据的压缩提供了基础(2)人的视觉和听觉对某些信号不那么敏感,即使信息被压缩之后还不知不觉,也不至对压缩后的信息产生调解。3.数字媒体数据压缩的类型:有损压缩、无损压缩、对称压缩、不对称压缩 4.静止图像压缩标准:JPEG、JPEG2000 5.JPEG标准概念:JPEG算法是一种适用于连续色调、多级灰度、静止图像的数字图像压缩编码方法。JPEG2000标准的特点:高压缩率、支持“感兴趣区域”、同时支持有损和无损压缩、实现了渐进传输 1.运动图像压缩标准:MPEG 2.MPEG图像的类型:I图(帧内图)、P图(前向预测图)、B图(双向预测)MPEG的帧序列:I帧-B帧-B帧-P帧-B帧-B帧-I帧 1.多媒体输入设备:图像扫描仪、数码相机、数字摄像机、数字摄像头、触摸屏、手写输入设备 2.多媒体输出设备:彩色打印技术、数字投影机、数码视频展示台 1.电子出版物概念:系指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机或类似设备阅读使用,并可复制发行的大众传播媒体。电子出版物特点:(1)丰富的多媒体信息表现(2)容量大、体积小(3)交互能力与检索查询(4)制作高效、出版迅速(5)成本低、节省能源 2.电子出版物开发系统的组成:多媒体集成系统、文字制作系统、音效制作系统、图像制作系统、视频制作系统、动画制作系统
(一)一副彩色静态图像,分辨率是352*288,RGB模式,每一张颜色用8位量化,则该彩色静态图像不压缩的数据量为多少KB? 图像文件大小:=图像分辨率*量化位数/8*基色数=352*288*8/8*3=304128B约等于304KB
(二)波形文件的容量计算S=R*D*(r/8)*NS:文件的大小R:采样频率D:录音时间r:量化位数N:声道数 对于立体声,如果采样频率为44.1KHz,量化位数为16位,声道数为2,录音时间同样为10s,则声音文件的大小为:S=44100*10*(16/8)*2=1764KB
(三)选择采样频率为44.1KHz,量化位数为16位的录音参数,在不采用压缩技术的情况下,录制1分钟的立体声需要多少MB存储空间?S=44100*60*(16/8)*2≈10MB