第一篇:“教学用音频处理技术”学习心得
“教学用音频处理技术”学习心得
不知不觉 “教学用音频处理技术”已经学完了,对于这门课程,我学到的东西还是蛮多的。从最初的一无所知,到现在的初见成效,其间付出了时间和心血,也从中感受到无穷的乐趣。
大学里接触过“教学用音频处理技术”,但现在已经毕业这么久,该会的知识也忘记的差不多了。现在再次学习这么课程,觉得无比的亲切,虽然作业完成的不是很好。通过学习,我对“教学用音频处理技术”有了进一步的认识,知道了好多以前根本没有接触过的东西。就像一笼中之鸟见到了蔚蓝的天空,小河里的一条小鱼见到了大海。一点也不夸张,这只是心里的一些想法。
我们的作业,其实就是一次艺术创作的过程,从构思、选材到制作完成需要花费时间和精力,而每天的上网时间是有限的,因为我的课程比较多,所以只好下班后再进行学习。听自己做的“声音”我被感动了,很有成就感和自豪感。我并不是为自己骄傲,而是自己有了进步,我知道,“教学用音频处理技术”的知识是渊博的,我只是学了皮毛。
学习的过程就是一个提高的过程,只有不段地学习、不断地总结,才能不断地提高。
第二篇:教学视频处理技术 学习心得
教学视频处理技术学习心得
相城实验中学 方艳玲
这次网上培训,我选择学习教学视频处理技术,带着初学者的好奇,在接触之前以为很难,因为这是个一比较专业的软件处理技术。起初是为了完成任务的心态去学习它,但是深入学习了解之后,觉得教学视频处理技术是一个非常有意思、值得学习的软件。
通过这次视频处理技术的学习,弥补以往视频处理技术知识的空缺。过去只会通过QQ影音等软件对视频、音乐进行简单的剪辑,但对整个视频画面的剪辑还是第一次接触,经过这一段时间的学习,收获颇丰,希望接下来一段时间再接再厉,努力掌握好教学视频入门处理技术。
在学习的过程中,我按照老师的教学视频,从最基本的知识和最基础的操作开始,一步一步按部就班的学习,慢慢我开始入门了,开始掌握一些基本操作。对于比较复杂的知识块,我就反复看老师的视频资料,我会将比较复杂的地方做笔记,然后反复练习,最后在经过多次的实践后也就自然掌握了。在对视频教学处理技术不断深入的学习后,也逐渐感觉到了这个软件技术其实对我们的教学工作的帮助也挺大的。
教学视频处理技术能对现有的视频文件进行处理,使其满足自己的需要,通过学习,我掌握了几种小方法。它不仅可以将自己需要的的几种视频合并在一起,还能将自己不需要的视频部分删除掉,这样子可以节约活动中不必要 的时间。运用电脑制作一些文件,可动可静,生动活泼,使教学过程更加生动、直观、形象,吸引学生的注意力,提升学生参加活动的兴趣。现在课堂教学以学生为 主体视频教学技术可以调动学生的学习积极性,增加学生的学习兴趣.让学生被动学转化为主动学,愿意学。
现在,我已经掌握了一些视频的制作技巧,遇到困难,可以网上搜索教学视频,然后反复练习,熟能生巧。在今后的教学活动会中有效的利用现代化资源,不仅可以创设情境,还能把枯燥的活动变得生动、有趣。让孩子们在愉快的气氛中主动学习,使学习活动达到最佳的效果。作为新时代的教师,应该不断的学习充电,学习掌握新的知识和技术。通过这次网上视频处理软件专题的学习,我也让对现代信息技术的强大功能深有体会。在学习的过程中收获很多,在此感谢老师提供的丰富的学习资源和热情的帮助。这次培训的经历我懂得了掌握电脑技巧,需要不断地实践。
第三篇:音频制作学习心得
学习音频软件心得体会
潘
飞
今年暑假,我学习了数字音频技术,带着初学者的好奇,在接触之前以为很难,因为这是个一比较专业的软件处理工具。起初是完成任务的心态去学习它,但是深入学习了解之后,觉得音频软件是一个非常有意思的软件。
在学习的过程中,我会将比较复杂的地方做笔记,然后反复练习。音频数字技术在今后的教学中对我们帮助太大。数字音频编辑能对现有的音频文件进行处理,使其满足自己的需要,通过学习,我学会了几个小方法方法。它不仅可以将自己需要的的几首歌曲合并在一起,还能将自己不需要的歌曲部分删除掉,这样子可以节约活动中不必要的时间。运用电脑制作一些文件,可动可静,生动活泼,使教学过程更加生动、直观、形象,吸引幼儿的注意力,提升幼儿参加活动的兴趣。现在课堂教学以幼儿为主体,音频数字技术可以调动幼儿的学习积极性,增加幼儿的学习兴趣.让幼儿被动学转化为主动学,愿意学.。现在,我已经掌握了一些数字音频的编辑技巧,还学习了PPT、photoshop这两个软件,遇到困难,可以网上搜索答案,然后反复练习,熟能生巧。在今后的教学活动会中有效的利用现代化资源,不仅可以创设情境,还能把枯燥的活动变得生动、有趣。让孩子们在愉快的气氛中主动学习,使活动得到最有效的收获。
作为新时代的青年教师的我们,更应该不断的学习充电。通过这个专题的学习,我不由得对自己肃然起敬,对现代信息技术的好处深有体会.。原来学习真的很重要!在学习的过程中会遇到很多困难,但只要不断地实践,掌握电脑技巧,就会觉得这些并不难相信做出的文件会越来越好,越来越实用。
第四篇:视频会议中的各种音频技术
视频系统术语---音频技术
音频技术
视频通讯过程是视频和音频的实时双向完整通讯过程。在这个过程中我们为了获得高清晰视频图像,有时却忽略了另外一个重要的过程——音频通讯过程。如果我们在观看高清晰视频图像的时候,不能得到一个更清晰、连续的音频效果。那么这个过程实际上就没有任何意义,所以其重要性甚至超过视频。在传统的视频会议系统中音频技术发展极其缓慢,原因在于目前应用于视频通讯的音频编解码压缩标准都是为了保持传输时的低带宽占用和较高的编解码效率,从而将音频信号的采样频率、采样精度和采样范围指标做了极大的降低,使得所能提供的音频清晰度和还原性都有很大程度上的衰减。与用于存储和回放非实时压缩协议的标准(如OGG、MP3等)相比,音频的保真度非常低。这样就在某种程度上对现场声音的还原达不到要求。目前传统视频通讯过程中主要采用的是G.711、G.722、G.721、G.728等音频标准,音频宽度仅有50Hz-7KHz单声道,而人耳所能感知的自然界的频响能力可以达到20Hz-20KHz,因此,在对现场环境音的还原过程中过多的音频信息的丢失造成了无法真实表现现场情况。所以在高清晰视频通讯过程中我们势必要有一种相辅助的音频处理方式解决此问题。使整个高清晰通讯过程更去近于完美。
目前国际上对音频处理技术上标准较多,在对下一代实时交互音频处理上可以采用MPEG-1 Layer 2或AAC系列音频,对选用标准的原则是,音频频响范围要达到22KHz,这样就几乎可以覆盖了人耳听觉的全部范围,甚至在高频方面还有所超越,能够使现场音频得到真实自然的还原,并且在还原时可以采用双声道立体声回放,使整个视频通讯的声音有更强的临近感,达到CD级音质。同时在对链路带宽的适应和编解码效率上达到最佳。下面是各种音频编码标准的说明:
1G.711
类型:Audio
制定者:ITU-T
所需频宽:64Kbps
特性:算法复杂度小,音质一般
优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)缺点:占用的带宽较高
备注:70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。
2G.721
制定者:ITU-T
所需带宽:32Kbps
音频频宽:3.4KHZ
特性:相对于PCMA和PCMU,其压缩比较高,可以提供2:1的压缩比。
优点:压缩比大
缺点:声音质量一般
备注:子带ADPCM(SB-ADPCM)技术。G.721标准是一个代码转换系统。它使用ADPCM转换技术,实现64 kb/s A律或μ律PCM速率和32 kb/s速率之间的相互转换。
3G.722
制定者:ITU-T
所需带宽:64Kbps
音频宽度:7KHZ
特性:G722能提供高保真的语音质量
优点:音质好
缺点:带宽要求高
备注:子带ADPCM(SB-ADPCM)技术
4G.721
制定者:ITU-T
所需带宽:32Kbps/24Kbps
音频宽度:7KHZ
特性:可实现比G.722 编解码器更低的比特率以及更大的压缩。目标是以大约一半的比特率实现G.722 大致相当的质量。
优点:音质好
缺点:带宽要求高
备注:目前大多用于电视会议系统。
5G.721附录C
制定者:ITU-T
所需带宽:48Kbps/32Kbps/4Kbps
音频宽度:14KHZ
特性:采用自Polycom 的Siren™14 专利算法,与早先的宽频带音频技术相比具有突破性的优势,提供了低时延的14 kHz 超宽频带音频,而码率不到MPEG4 AAC-LD 替代编解码器的一半,同时要求的运算能力仅为十分之一到二十分之一,这样就留出了更多的处理器周期来提高视频质量或者运行因特网应用程序,并且移动设备上的电池续航时间也可延长。
优点:音质更为清晰,几乎可与CD 音质媲美,在视频会议等应用中可以降低听者的疲劳程度。缺点:是Polycom的专利技术。
备注:目前大多用于电视会议系统
6G.723(低码率语音编码算法)
制定者:ITU-T
所需带宽:5.3Kbps/6.3Kbps
音频宽度:3.4KHZ
特性:语音质量接近良,带宽要求低,高效实现,便于多路扩展,可利用C5402片内16kRAM实现53coder。达到ITU-TG723要求的语音质量,性能稳定。可用于IP电话语音信源编码或高效语音压缩存储。优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定。
缺点:声音质量一般
备注:G.723语音编码器是一种用于多媒体通信,编码速率为5.3kbits/s和6.3kbit/s的双码率编码方案。G.723标准是国际电信联盟(ITU)制定的多媒体通信标准中的一个组成部分,可以应用于IP电话等系统中。其中,5.3kbits/s码率编码器采用多脉冲最大似然量化技术(MP-MLQ),6.3kbits/s码率编码器采用代数码激励线性预测技术。
7G.723.1(双速率语音编码算法)
制定者:ITU-T
所需带宽:5.3Kbps(29)
音频宽度:3.4KHZ
特性:能够对音乐和其他音频信号进行压缩和解压缩,但它对语音信号来说是最优的。G.723.1采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外,这种技术使发信机的调制解调器保持连续工作,并且避免了载波信号的时通时断。
优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定,避免了载波信号的时通时断。缺点:语音质量一般
备注:G.723.1算法是ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法,其目标应用系统包括H.323、H.324等多媒体通信系统。目前该算法已成为IP电话系统中的必选算法之一。
8G.728
制定者:ITU-T
所需带宽:16Kbps/8Kbps
音频宽度:3.4KHZ
特性:用于IP电话、卫星通信、语音存储等多个领域。G.728是一种低时延编码器,但它比其它的编码器都复杂,这是因为在编码器中必须重复做50阶LPC分析。G.728还采用了自适应后置滤波器来提高其性能。优点:后向自适应,采用自适应后置滤波器来提高其性能
缺点:比其它的编码器都复杂
备注:G.728 16kb/s短延时码本激励线性预测编码(LD-CELP)。1996年ITU公布了G.728 8kb/s的CS-ACELP算法,可以用于IP电话、卫星通信、语音存储等多个领域。16 kbps G.728低时延码激励线性预测。G.728是低比特线性预测合成分析编码器(G.729和G.723.1)和后向ADPCM编码器的混合体。G.728是LD-CELP编码器,它一次只处理5个样点。对于低速率(56~128 kbps)的综合业务数字网(ISDN)可视电话,G.728是一种建议采用的语音编码器。由于其后向自适应特性,因此G.728是一种低时延编码器,但它比其它的编码器都复杂,这是因为在编码器中必须重复做50阶LPC分析。G.728还采用了自适应后置滤波器来提高其性能。
9G.729
制定者:ITU-T
所需带宽:8Kbps
音频宽度:3.4KHZ
特性:在良好的信道条件下要达到长话质量,在有随机比特误码、发生帧丢失和多次转接等情况下要有很好的稳健性等。这种语音压缩算法可以应用在很广泛的领域中,包括IP电话、无线通信、数字卫星系统和数字专用线路。
G.729算法采用“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)算法。这种算法综合了波形编码和参数编码的优点,以自适应预测编码技术为基础,采用了矢量量化、合成分析和感觉加权等技术。
G.729编码器是为低时延应用设计的,它的帧长只有10ms,处理时延也是10ms,再加上5ms的前视,这就使得G.729产生的点到点的时延为25ms,比特率为8 kbps。
优点:语音质量良,应用领域很广泛,采用了矢量量化、合成分析和感觉加权,提供了对帧丢失和分组丢失的隐藏处理机制。
缺点:在处理随机比特错误方面性能不好。
备注:国际电信联盟(ITU-T)于1995年11月正式通过了G.729。ITU-T建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP),它是当前较新的一种语音压缩标准。G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。
10G.729A
制定者:ITU-T
所需带宽:8Kbps(34.4)
音频宽度:3.4KHZ
特性:复杂性较G.729低,性能较G.729差。
优点:语音质量良,降低了计算的复杂度以便于实时实现,提供了对帧丢失和分组丢失的隐藏处理机制 缺点:性能较G.729差
备注:96年ITU-T又制定了G.729的简化方案G.729A,主要降低了计算的复杂度以便于实时实现,因此目前使用的都是G.729A。MPEG-1 audio layer 1
制定者:MPEG
所需带宽:384kbps(压缩4倍)
音频宽度:
特性:编码简单,用于数字盒式录音磁带,2声道,VCD中使用的音频压缩方案就是MPEG-1层Ⅰ。
优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。可以达到“完全透明”的声音质量(EBU音质标准)
缺点:频宽要求较高
备注:MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:--层1(Layer 1):编码简单,用于数字盒式录音磁带
--层2(Layer 2):算法复杂度中等,用于数字音频广播(DAB)和VCD等
--层3(Layer 3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍
12MPEG-1 audio layer 2,即MP2
制定者:MPEG
所需带宽:256~192kbps(压缩6~8倍)
音频宽度:
特性:算法复杂度中等,用于数字音频广播(DAB)和VCD等,2声道,而MUSICAM由于其适当的复杂程度和优秀的声音质量,在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用。优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。可以达到“完全透明”的声音质量(EBU音质标准)
缺点:
备注:同MPEG-1 audio layer 1
13MPEG-1 audio layer 3(MP3)
制定者:MPEG
所需带宽:128~112kbps(压缩10~12倍)
音频宽度:
特性:编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍,2声道。MP3是在综合MUSICAM和ASPEC的优点的基础上提出的混合压缩技术,在当时的技术条件下,MP3的复杂度显得相对较高,编码不利于实时,但由于MP3在低码率条件下高水准的声音质量,使得它成为软解压及网络广播的宠儿。
优点:压缩比高,适合用于互联网上的传播
缺点:MP3在128KBitrate及以下时,会出现明显的高频丢失
备注:同MPEG-1 audio layer 1
14MPEG-2 audio layer
制定者:MPEG
所需带宽:与MPEG-1层1,层2,层3相同
音频宽度:
特性:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1, 层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。
优点:支持5.1声道和7.1声道的环绕立体声
缺点:
备注:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1, 层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。
15AAC-LD(dvanced Audio Coding,先进音频编码)
制定者:MPEG
所需带宽:48-64 kbps
音频宽度:22KHZ
特性:提供高质量的低延时的音频编码标准,以其20ms的算法延时提供更高的比特率和各种声音信号的高质量音频。
缺点:
备注:超宽带编解码器技术支持高达48KHz采样率的语音传输,与传统的窄带与宽带语音编解码器相比大幅提高了音质。该技术可提供接近CD音质的音频,数据速率高达48–64kbps,不仅提高了IP语音与视频应用的清晰度,而且支持电话音乐传输功能。高清语音通道支持更高的采样率,配合音频编解码器的高保真音效,显著丰富并扩展了频谱两端的音质范围,有效改善了语音回响性能,提高了清晰度。
第五篇:数字媒体处理技术综述及学习心得
数字媒体处理技术综述及学习心得
1、引言
随着Internet与数字媒体技术的飞速发展,信息安全问题日益突出,主要表现在数字媒体被非法复制、篡改、传播与攻击等。因此,数字媒体的版权保护与信息完整性保证已逐渐成为人们迫切需要解决的一个重要问题,数字水印技术就是在这种需求下迅速发展起来的。
数字水印是一类信息隐藏技术,其基本思想是通过一定的算法将一些标志性信息嵌入到公开信息中,以达到隐匿信息的目的。其在知识产权保护、保密通信与内容鉴别等领域都具有广泛的应用价值。数字水印技术最初由Van Schyndel等人在1994年的ICIP会议上提出,他们针对灰度图像提出了两种向图像最低有效位嵌入水印的算法。1996年在英国剑桥召开了信息隐藏领域的第一次学术研讨会,标志着信息隐藏作为一个新学科的诞生。十多年来,数字水印技术得到了长足的发展,在水印的嵌入和检测方面,都取得了较多的成果。
目前,国际上剑桥大学、IBM研究中心、NEC美国研究所、麻省理工学院等都对数字水印进行了深入的研究。国内在数字水印方面的研究起步稍晚,但发展迅速。1999年12月召开了第一届全国信息隐藏学术会议。2000年1月,由国家863计划智能计算机专家组织展开了“数字水印技术学术研讨会”,体现了我国对这一领域研究的高度重视。目前,国内清华大学、北京大学、北京邮电大学、中科院自动化所、浙江大学、国防科技大学等都在该领域取得了不菲的成果。
2、数字水印的研究现状 2.1文本水印
文本水印就是将代表著作人身份的信息(水印)嵌入到电子出版物中,在产生版权纠纷时来验证版权的归属。其主要分为三大类:基于文档结构的水印方法、基于自然语言处理技术的水印方法、基于传统图像的水印方法。基于文档结构的各种水印方法都只是提留在文本的表层,无法抵抗对于文本结构和格式的攻击,简单的重新录入攻击就能使之失效,因此这些水印方法普遍存在鲁棒性差的缺点。自然语言文本水印方法相对提高了抗攻击的能力,但普遍存在容量不足的问题。基于传统图像的文本水印普遍存在鲁棒性不高、操作复杂的缺点。2.2图像水印
根据水印的实现过程,图像水印算法可分为空域算法和变换域算法。空域算法是通过直接改变原始图像的像素值来嵌入水印,通常具有较快的速度,但鲁棒性差,且水印容量也会受到限制;变换域算法是通过改变某些变换系数来嵌入水印,通常具有很好的鲁棒性和不可见性。其实现一般是基于图像变换,如DCT、DFT、DWT等。重点介绍一下变换域算法。2.2.1离散傅里叶变换(DFT)
该方法是利用图像的DFT来嵌入信息。通信理论中调相信号的抗干扰能力比调幅信号的抗干扰能力强,同样在图像中利用相位信息嵌入的水印也比用幅值信息嵌入的水印更稳健。实验表明该方法的抗压缩能力比较弱。2.2.2离散余弦变换(DCT)
DCT能把空间域的图像转换到变换域上进行研究,从而能很容易了解到图像的各空间频域成分,进行相应处理。基于DCT的水印方法与基于DFT的水印方法相比有较好的鲁棒性,但是无法做到对图像信号内容的自适应,因此往往会造成对图像特征的明显损害,不可感知性不是最佳。2.2.3离散小波变换(DWT)
DWT是一种时间-频率信号的多分辨率分析方法,在时频两域都具有表征信号局部特征的能力。实验表明,与DFT、DCT变换相比较,基于DWT的水印算法的鲁棒性最优,且与JPEG2000,MPEG4压缩标准兼容,利用DWT产生的水印具有良好的视觉效果和抵抗多种攻击的能力,且不可感知性最好。2.3音频水印
音频水印利用音频文件的冗余信息和人耳听觉系统的特点来嵌入水印,其可以保护声音数字产品不被随意复制和篡改,如CD唱片,广播电台的节目内容等。有学者提出了音频水印的三种基本方法:扩频嵌入方法、回声隐藏方法和相位编码方法。2.4视频水印
视频水印是通过对视频载体的时间和空间冗余来嵌入水印,其既不影响视频质量,又能达到保护节目制作者的合法权益和控制数字产品的复制。视频水印从算法要求上同图像水印有许多相似之处,但视频水印也有一些独特之处,如能够在压缩和未压缩的格式下实时完成水印的检测,对MPEG压缩、串谋攻击、A/D和D/A转换等都有较好的稳健性。
3、数字水印算法
从水印嵌入方式的角度来看,数字水印算法主要分为两大类:空间域水印算法和变换域水印算法。3.1基于空间域的水印算法
空间域的水印算法将水印信息直接嵌入在图像的灰度值中,该算法大都是基于最不显著位LSB(Least Significant Bit)方法。这种水印算法的特点是对水印的嵌入和提取简单、快速,嵌入的水印信息量大,但由于它位于图像的LSB上,稳健性较差,容易受到有损压缩、量比、有噪信道传输的影响。比较典型的空间域算法包括Schyndel算法和Patchwork算法等。Schyndel算法把一个密钥输入一个m序列发生器来产生水印信号,然后将该序列重新排列成二维水印信号,并按像素点逐一插入到原始图像像素值的最低位。Patchwork算法处理对象为256个亮度级和线性量化的图像且所有的亮度级的概率相等,图像中的任一像素值与其余的像素值是不相关的。该算法首先随机选取N对像素点,然后通过增加像素对中一个点的亮度值,而相应降低另一个点的亮度值的调整来隐藏信息。李旭东等人分析了现有的抗几何攻击算法的不足,并提出了一个新的抗几何攻击的图像数字水印算法。该算法在水印嵌入时,先对原始图像进行分块,然后对各个子块图像根据量化策略重复嵌入相应的1bit水印信息;在水印提取时,先将含水印图像进行分块,然后对从各个子块图像中提取出的水印信息根据多数原则判定相应子块图像所含的1bit水印信息。3.2基于变换域的数字水印算法
基于变换域的水印算法是目前应用最广泛的方法,这种方法是将图像变换到频域中,然后通过改变某些频域系数来嵌入水印。频域中能量分布较集中,且图像像素点间有一定的相关性,这有利于保证水印的不可见性,鲁棒性好。常用的变换有:离散余弦变换(Discrete Cosine Transform,DCT)、离散傅立叶变换(Discrete Fourier Transform,DFT)、离散小波变换(Discrete Wavelet Transform,DWT)。Cox算法是典型的离散余弦变换水印算法,该算法首先计算图像DCT系数,然后选择那些视觉重要部分的系数嵌入水印。文献[6]首先把图像分成8×8的不重叠像素块,经过分块DCT变换后,得到由DCT系数组成的频率块,然后随机选取一些频率块,将水印信号嵌入到由密钥控制选择的一些DCT系数中,其特点是数据改变幅度小,透明性好,但抵抗几何变换等攻击的能力弱。C.T.Hsu等人提出了基于可视化模型的算法,在8×8图像块的DCT系数中,选择4×4个中频系数组成小块,通过比较相邻两个小中频系数块中相应位置上系数的大小,进行水印的嵌入,由于采用了可视化模型,提高了水印的不可见性。黄继武等人利用人类视觉系统的照度掩蔽特性和纹理掩蔽特性,将空域中的图像块(8×8)分成三类,然后将不同强度的伪随机序列的水印分量自适应地嵌入到不同类图像块的DCT低频系数中,实现水印的嵌入。肖俊等人将多级离散小波变换的“多级”思想引入到离散余弦变换中,并对多级离散余弦变换的特性进行了分析,在此基础上提出了一种基于多级离散余弦变换的数字水印算法,该算法从多级离散余弦变换系数中选择适当的位置嵌入水印信息。离散傅立叶变换可以很好地表达图像的构造分布,其平移、放缩和旋转特性常常被用来构造几何变换的鲁棒水印。V Solachdis等人构造了一个环带状对称水印,水印信息为(1,-1),将其嵌入到DFT的中频子带中,可以抵抗压缩、旋转、剪裁等操作。J.J.K.O.Ruanaidh等人在水印算法中使用Mellin-Fourier变换,将水印嵌入在只与傅立叶变换的振幅有关的子空间中。Jce Ruanaidh等人提出了一种基于相位调制的水印算法。赫明钊等人提出一种基于分数傅里叶变换和随机相位编码的光学加密数字水印技术,该数字水印技术对于噪音叠加和常见的图像处理操作具有较强的稳健性。
小波变换是一种比较特殊的变换方式,它具有多分辨率分析的特点,而小波基和小波变换级数的选择更是给小波变换域数字水印算法的设计带来了很大的灵活性和优越性。Hsu和Lwu提出了多分辨率分析的水印算法,首先对水印和原始图像同时进行多分辨率分析,然后将水印在分辨率下的分析系数嵌入到具有相应分辨率的图像块中,这样,即使含水印的图像质量受到了攻击,丢失了部分信息,较低分辨率的水印仍然保存在较低分辨率的图像块中,因此水印具有较高的稳健性。X.G.Xia等人选用满足正态分布的伪随机序列做水印,在整幅小波分解生成的图像中,用由高分辨率到低分辨率、同一分辨率下由高频到低频逐个子带添加水印的方法进行嵌入。这种水印算法的优点是水印检测按子带分级扩充水印序列进行,在水印图像质量破坏不大的情况下,水印检测可以在搜索少数几个子带后终止,提高了水印检测的效率。H.M.Wang等人在上述方法的基础上进一步利用渐进编码的思想进行水印的嵌入和检测。首先通过一定的阈值选择一个小波分解的重要子带,在子带中从处于高位平面的系数到处于低位平面的系数上,添加水印直到所有水印点嵌入到图像中,该算法给出了一种不使用原始图像的盲检测方案。Lu Jiang和ZhangRan采用基于2维离散小波变换的数字水印方法,可以在不影响图像视觉效果的情况下,将水印信息嵌入到高通小波系数中,可以在一定程度上抵制压缩攻击和几何攻击。3.3基于融合的数字水印算法
图像融合主要有两种方式。一种是将两幅图像按照某种方式叠加生成一个新的图像,使新图像中包含两个图像的信息。采用较好的融合算法能保证恢复时无需原始公开图像。另一种是利用数字图像的自相关性,通过放大原始公开图像来隐藏与公开图像同样大小的数字图像。此方法对于彩色图像的隐藏比较实用,尤其适用于BMP彩色图像的加密隐藏,而且对所要隐藏的图像进行置乱处理后,安全性更高。
除了以上数字水印算法外,还有其他一些算法,比如分形水印、基于特征的水印算法等。
4、数字水印的应用领域 4.1 版权保护
版权保护是数字水印的最主要应用领域,其思想是数字作品的所有者通过密钥产生水印,利用一定的嵌入方法,将水印嵌入原始数据(图像、声音、视频等),然后公开发布嵌入水印的作品。当该作品被盗版或出现版权纠纷时,所有者可利用水印提取、检测、验证等方法,使嵌入的水印成为鉴定、起诉非法侵权的证据,从而保护所有者的权益。4.2 来源追踪
为避免未经授权的拷贝和发行,出品人可以将不同用户的ID或序列号作为不同的水印(数字指纹)嵌入作品的合法拷贝中。如果发现未经授权的拷贝,就可以根据此拷贝所恢复出的水印(数字指纹)来确定它的来源。4.3 信息标注
数字作品具有很多属性信息,如作品的标题、创作者等,利用数字水印技术将这些信息嵌入到作品中,不但不需要额外的带宽和存储,而且不易丢失。另外,国防和情报部门还可以利用数字水印技术实现隐蔽通信。4.4 访问控制
利用数字水印技术可以将访问控制信息嵌入到媒体中,在使用媒体之前通过检测嵌入到其中的访问控制信息,以达到访问控制的目的,它要求水印具有很高的鲁棒性。DVD防拷贝系统是访问控制的一个典型的应用例子,它将数字水印信息加入DVD数据中,并在DVD播放机中增加验证模块,使用DVD播放机之前,可以事先检测DVD数据中的水印信息来判断其合法性和可拷贝性,从而保护制造商的商业利益。还可以通过计算使用次数和复制次数进行控制,防止用户无限制地复制使用。
4.5 认证和完整性校验
认证和完整性校验是为防止数据被非法篡改或伪造。通常采用脆弱水印,用惟一的与数据内容相关的密钥生成并嵌入水印。对嵌入水印的数字进行检验时,再利用与数据内容相关的密钥提取出水印,然后通过检验提取出的水印完整性来检验作品的完整性。其优点在于认证同内容密不可分,简化了处理过程。