基于Cool-Edit__Praat的语音信号音频文件制作11

第一篇：基于Cool-Edit__Praat的语音信号音频文件制作11

目录设计题目..................................................................1 2 Cool Edit Pro简介........................................................2 3 Cool Edit Pro的基本应用..................................................3 3.1 单音轨，多音轨编辑模式切换..........................................3 3.2音频文件的导入.......................................................4 3.3 格式的转换..........................................................5 3.4音频“绘画”.........................................................5 3.5 多种特效制作........................................................7 5音乐歌曲的制作...........................................................16 6 片头音乐的音频文件制作...................................................18 7 心得体会.................................................................20 8 参考文献.................................................................22

武汉理工大学《专业综合》课程设计说明书设计题目

基于Cool-Edit / Praat的语音信号音频文件制作Cool-Edit或Praat是常用的功能强大的多轨录音和音频处理软件，且均是非常出色的数字音乐编辑器和MP3制作软件，在实际中均有广泛的应用。

设计内容：

1）了解、熟悉Cool-Edit和Praat软件，试选择其中的一种软件，完成本课程设计； 2）录入语音信号或读入歌曲，使用该软件完成音乐的基本特性分析、格式转换、音频“绘画”和多种特效制作等功能，记录和分析相关结果；

3）掌握同时处理多个音频文件，实现在多个文件中进行剪切、粘贴、合并、重叠声音等操作，记录和分析相关结果；

4）使用该软件，完成一首自己的MP3音乐歌曲的制作；

5）使用该软件，仿照完成一个广播电台某专题节目用的片头音乐（含背景音乐及人声等）的音频文件制作。

武汉理工大学《专业综合》课程设计说明书 Cool Edit Pro简介

Cool Edit Pro是一个非常出色的数字音乐编辑器和MP3制作软件。不少人把Cool Edit形容为音频“绘画”程序。你可以用声音来“绘”制：音调、歌曲的一部分、声音、弦乐、颤音、噪音或是调整静音。而且它还提供有多种特效为你的作品增色：放大、降低噪音、压缩、扩展、回声、失真、延迟等。你可以同时处理多个文件，轻松地在几个文件中进行剪切、粘贴、合并、重叠声音操作。使用它可以生成的声音有：噪音、低音、静音、电话信号等。该软件还包含有CD播放器。其他功能包括：支持可选的插件；崩溃恢复；支持多文件；自动静音检测和删除；自动节拍查找；录制等。另外，它还可以在AIF、AU、MP3、Raw PCM、SAM、VOC、VOX、WAV等文件格式之间进行转换，并且能够保存为RealAudio格式。

武汉理工大学《专业综合》课程设计说明书 Cool Edit Pro的基本应用

3.1 单音轨，多音轨编辑模式切换单音轨模式：

图3-1 单音轨模式切换到多音轨模式时，点击按钮多音轨模式：

图3-2 3

武汉理工大学《专业综合》课程设计说明书

3.2音频文件的导入点击按钮，打开对话框如下所示，选中文件，点击确定即可。

图3-3 4

武汉理工大学《专业综合》课程设计说明书

3.3 格式的转换

点击按钮，则显示另存为话框如下所示，文件可以保存的格式如图所示：

图3-4 选择保存，则完成了文件的格式转换 3.4音频“绘画”

波形统计

武汉理工大学《专业综合》课程设计说明书

图3-5 频谱和相位分析器

图3-6

武汉理工大学《专业综合》课程设计说明书

3.5 多种特效制作 1）渐变效果

点击效果—波形振幅—渐变，渐变界面，如下：

图3-7 预置中Fade In 和Fade Out 为淡入效果和淡出效果。淡入效果如下：

武汉理工大学《专业综合》课程设计说明书

图3-8 2）消除原音

点击效果—波形振幅—声道重混缩，打开其界面，如下：

图3-9 预置中选择Vocal Cut，点击确定就可以消除原唱了，只是效果不太好。3）噪音消除

先选定部分只有噪音的波形，点击效果—噪音消除—降噪器，打开降噪器，其界面如下：

武汉理工大学《专业综合》课程设计说明书

图3-10

先点击噪音采样按钮，会得到如上图所示采样噪音，点击关闭。然后选定全部波形，再次打开降噪器，点击确定按钮，即可进行降噪处理。

选定全部波形，点击效果—噪音消除—破音修复，可打开修复界面，如下：

图3-11 9

武汉理工大学《专业综合》课程设计说明书

点击确定按钮即可进行破音修复。

选定全部波形，点击效果—噪音消除—嘶声消除，可打开消除界面，如下：

图3-12 点击确定按钮即可进行嘶声消除。

选定全部波形，点击效果—噪音消除—咔嗒声/噗声消除，可打开消除界面，如下：

图3-13

武汉理工大学《专业综合》课程设计说明书

点击确定按钮即可进行咔嗒声/噗声消除。4）音量控制

点击效果—波形振幅—音量标准化，打开音量标准化界面，如下：

图3-14 音量若过高降低百分比，若低了则增加百分比，点击确定即可进行音量标准化。5）混响

点击效果—常用效果器—混响，打开混响界面，如下：

图3-15 选择自然混响，点击确定即可。

武汉理工大学《专业综合》课程设计说明书

6）图形均衡器

点击效果—滤波器—图型均衡器，打开均衡器界面，如下：

图3-16 在10段均衡中可增加低音效果，也可削减高音效果，可使音乐更好听。6 录音

在某个音轨上录音，先点击按钮录音。，准备好后，点击左下角的录音按钮

即可开始 12

武汉理工大学《专业综合》课程设计说明书

图3-17

武汉理工大学《专业综合》课程设计说明书.同时处理多个音频文件

1）剪切

选中左右两个声道需要剪切的声波，然后剪切（Ctrl+X）、复制（Ctrl+C）、删除（Delete）

图4-1 2）粘贴

选中左右两个声道需要的声波，然后复制（Ctrl+C），在需要粘贴的地方粘贴(Ctrl+V)，图中白色的地方即为粘贴的部分

图4-2

武汉理工大学《专业综合》课程设计说明书

3）合并

在同一个音轨上将第一个音频文件的波形尾部和第二个音频文件的前部连接起来即可。

图4-3 4）重叠声音

在第一个音轨上放置第一个音频文件，在第二个音轨上合适的位置放置音频文件，所得的声音是重叠的。

图4-4

武汉理工大学《专业综合》课程设计说明书

5音乐歌曲的制作

首先，在单音轨中加载音乐《陈奕迅—十年》，经过效果处理消除原音，将其加载进多音轨1中，然后在音轨2上录音，先点击按钮即开始录音。录制完以后，单击停止按钮和，准备好后，点击左下角的录音按钮按钮，右击音轨2，编辑波形，进入单音轨模式，试听会发现有噪声，此时我们要对噪声进行消除。我依照Cool Edit Pro的基本应用中噪音消除的方法来消除噪音，然后试听感觉音量过高，那么就采用多种特效制作中的音量控制，降低音量百分比，我降低至70%，再试听感觉音量差不多，就是感觉不有些地方不完美，那么采用多种特效制作中的混响，可使得更好听一些。再试听感觉有些干涩，那么采用多种特效制作中的图形均衡化，可增加低音或者削减高音，使得音乐不再干涩。

然后对两个音轨进行混缩，混缩为一个音轨，并保存为MP3格式的歌曲，那么一首你自己制作的《陈奕迅—十年》歌曲就这样诞生了。

下图1中，音轨1中为《陈奕迅—十年》伴奏，音轨2为经过处理的录音。

图5-1

武汉理工大学《专业综合》课程设计说明书

下图2为混缩为文件《陈奕迅—十年》，保存格式为MP3。

图5-2

武汉理工大学《专业综合》课程设计说明书片头音乐的音频文件制作

片头音乐制作与歌曲制作有些类似，首先加载片头背景音乐《Leave out all the rest》，然后对背景音乐进行处理。我在处理过程中，首先对背景音乐的片头和片尾音乐的一部分进行了删除，然后对新的片头和片尾音乐进行了渐变效果处理，使其背景音乐不是突然进来或者突然消失。然后对背景音乐的中间的一部分进行音量变小处理。

把处理好的片头音乐加载进多音轨1中，在音轨2中进行录音。先点击按钮备好后，点击左下角的录音按钮，准

即开始录音。我录的一段话是：，观众朋友们，大家好，这里是体育频道，我是段暄，欢迎收看《天下足球》。欧洲杯的大幕，徐徐落下，全世界的人们都沉浸在足球带给我们的快乐中。这一期的节目，我将带您一同走进为本届欧洲杯所准备的特别节目《西班牙—一代王朝的崛起》。录制好以后，对所录的声音进行噪声消除处理。再经过一些效果处理，那么就可以制作为一首比较好的片头音乐。下图中，音轨1为背景音乐《Leave out all the rest》，音轨2为我的广播录音，并且经过了效果处理。

图6-1

武汉理工大学《专业综合》课程设计说明书

下图2为混缩为文件《Leave out all the rest终》的波形，保存格式为MP3。

图6-2

武汉理工大学《专业综合》课程设计说明书心得体会

学习了Cool Edit Pro 2.1软件的使用，体会很深。通过这次学习Cool Edit Pro 2.1软件，我对语音信号的处理有了更进一步的认识，而且也懂得了如何运用Cool Edit Pro 2.1这个软件编辑一首歌以及片头音乐等等。

初步学习Cool Edit Pro 2.1软件时，我觉得自己对这个软件的应用很多不会，我就上网查询有关这个软件的资料，但是查到的资料有些不全，所以就自己在那摸索着去用这个软件完成这次专业课程设计。所幸的是，最终我还是对Cool Edit Pro 2.1软件有了基本的认识，也基本完成了这次课程设计。当然，离不开同学以及老师的帮助。

首先，我上网搜寻了一些关于Cool Edit Pro 2.1软件的基本资料，然后就自己摸索着去认识Cool Edit Pro 2.1软件的操作界面，知道了如何录音，如何消噪，如果制作配乐音乐等知识。

在录音或者演唱的时候要做到吐字清楚、表达自然，尽量使用接近口语化的发音方式，发声时要特别注意齿音不要太大，一定要用胸腔吐气发声，不要从喉咙里憋声音出来演唱，同时运用好我头、鼻、咽等器官的共鸣腔，使声音听起来浑厚圆润。

当音乐旋律起来后不要紧张，做一个深呼吸来放松自己，起音时做到舒展流畅，注意音乐节奏和音调的高低，做到心中有数，避免跑调。演唱时气息要均匀、平稳，如果气息控制不好、不稳定，声音听起来就单薄、发颤儿，没有底气，没有力量。大多数初录歌的会员都会有“噗”“噗”的气流吹击话筒产生的噪声，这样的噪声在Cool Edit Pro 2.1后期任何效果处理器都无法消除的，应该在演唱的时候尽量的避免，演唱的时候不要把话筒和嘴距离太近，避免演唱以免有“破”音产生，注意距离的调整。

对于初学录音时尽可能熟悉歌词、音调及节奏，特别要把握好换气的地方。如果做不到，可以采用下策，那就是插入原唱音轨，用耳机监听原唱，跟着原唱的节奏录干声。但这容易让自己跟着别人的风格和节奏走，唱出来的歌往往缺乏自己的风格和应有的感情。

武汉理工大学《专业综合》课程设计说明书

通过这次专业课设，我完成了课程设计的内容要求，在这次课程设计中，我学会了Cool Edit Pro 2.1软件的基本应用，而且简单的制作了一首歌曲《再见》，而且还制作了片头音乐《Leave out all the rest》。

武汉理工大学《专业综合》课程设计说明书参考文献

[1] 黄新斌.我国高职精品课程研究的进展与展望［J］.当代职业教育，2010 [2] 刘瑞儒.声音编辑软件——Cool Edit Pro的使用与注意事项［J］.中国电化教育，2002 [3] 陆军.音频编辑软件在语言教学研究中的应用［J］.中国教育信息化，2007 [4] 曹撜申.教育电声系统［M］.北京：高等教育出版社，1996 [5] 陆军、缪海涛.Cool Edit Pro在外语听说教学研究中的应用［J］.外语电化教学，2008

第二篇：DSP语音信号处理

摘

要

语音信号处理是研究数字信号处理技术和语音信号进行处理的一门学科，是一门新型的学科，是在多门学科基础上发展起来的综合性技术，它涉及到数字信号处理、模式识别、语言学。语音信号处理是研究用数字信号处理技术对语音信号处理的一门学科。处理的目的是要得到一些语音参数以便高效的传输或存储；或者是通过处理的某种运算以达到某种用途的要求。语音信号处理又是一门边缘学科。如上所诉，它是“语言语音学”与“数字信号处理”两个学科相结合的产物。

语音信号处理属于信息科学的一个重要分支，大规模集成技术的高度发展和计算机技术的飞速前进，推动了这一技术的发展。在数字音频技术和多媒体技术迅速发展的今天，传统的磁带语音录放系统因体积大、使用不便、放音不清晰而受到了巨大挑战。本次课程设计提出的体积小巧，功耗低的数字化语音存储与回放系统，可以有效的解决传统的语音录放系统在电子与信息处理的使用中受到的限制。

本文提出了语音信号处理课程建设的实验环节中的一些考虑，作为专业课程的学习，实验内容不能仅仅停留在验证性实验上，还应增加实验延伸的设计要求，是学生加深对理论分析认识的同时，强调培养学生的实际动手能力和知识综合运用能力。从而提高语音信号的教学和实验的质量。实验内容采用MATLAB编程实现，不仅易于语音信号处理的实现，更易引导学生完成实验延伸的设计。

第一章绪论

1.1选题背景

在我们的现实生活中从磁带、录像带到CD、VCD、DVD；从黑白电视机、彩色电视机、高清晰度电视机到具有数字信号处理功能的电视机；从留声机、录音机到语音信箱；现在正出在模拟信息到数字信息的变革之中，传统的磁带语音录放系统因其体积大，使用不便，在电子与信息处理的使用中受到许多限制。

虽然，目前广播电视系统尚未实现真正的数字化，相信在不久的将来，真正的数字电视、数字收音机、数字收录机将进入家庭。所以，研究音频信号的数字化存储、处理和回放系统有着很重要的现实意义。

通过设计语音信号实验箱可以对语音信号实现各种形式的变换，因此学会对语音信号的处理，也可自行研究将此语音处理技术应用到现实生活中。

1.2课题意义

语音信号处理的一门比较实用的电子工程的专业课程，语音是人类获取信息的重要来源和利用信息的重要手段，通过语言相互传递信息是人类最重要的基本功能之一，语音是人类特有的功能，它是创造和记载几千年来人类文明史的根本手段，是人类最重要、最有效、最常用和最方便的交换信息的形式。

语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科，它是一门新兴的学科，同时又是综合性的多学科领域刚也涉及面很广的交叉学科。

第二章课程设计要求及系统原理

2.1 课程设计基本要求

（1）学会MATLAB的使用，掌握MATLAB的程序设计方法；

（2）掌握在windows环境下语音信号的采集方法；

（3）掌握数字信号处理的基本概念，基本理论和基本方法；

（4）掌握MATLAB设计方法；

（5）学会用MATLAB对信号进行分析和处理。

2.2 系统基本原理

语音采集原理是，人耳能听到的声音是一种范围为20Hz—20kHz，而一般语音频率最高为3.4kHz。语音的采集是指语音声波信号经麦克风和高频放大器转换成有一定幅度的模拟量电信号，然后再转换成数字量的全过程。

本次设计的基本原理是对语音的录音和放音进行数字化控制。其中，关键技术在于：为了增加语音存储时间，提高存储器的利用率，采用了非失真压缩算法对语音信号进行压缩后再存储，而在回放时再进行解压缩；同时，对输入语音信号进行数字滤波以抑制杂音和干扰，从而确保了语音回放的可靠质量。

通过设计一个GUI实验箱，并添加相应的控制控件，添加一个声音文件，通过MATLAB编程，使其通过各种按钮实现语音信号处理的各种功能，最后做成一个完整的语音信号处理实验箱。

第三章设计方案论证

3.1 设计理论依据

3.1.1采样定理：

在进行模拟/数字信号的转换过程中，当采样频率fs.max大于信号中最高频率fmax的2倍时，则采样之后的数字信号完整的保留了原始信号中的信号，一般实际应用中保证采样频率为信号最高频率的5—10倍；采样定理又称奈奎斯特定理。

3.1.2采样频率：

采样频率是指计算机每秒钟采集多少个声音样本，是描述声音文件的音质、音调、衡量声卡、声音文件的质量标准。采样频率越高，即采样的间隔时间越短，则在单位时间内计算机得到的声音样本数据就越多，对声音波形的表示也就越精确，采样频率与声音频率之间有一定的关系，根据奈奎斯特理论，只有采样频率高于声音信号最高频率的2倍的时候，才能把数字信号表示的声音还原成为原来的声音，这就是说采样频率是衡量声卡采集、记录和还原声音文件的质量标准。

3.1.3采样位数与采样频率

采样位数即采样值或取样值，用来衡量声音波动变化的参数，是指声卡在采集和播放声音文件时候使用数字声音信号的二进制为数。采样频率是指录音设备在一秒钟内对声音信号的采样次数，采样频率越高声音的还原就越真实越自然。

采样位数和采样频率对于音频接口来说是最为重要的两个基本指标，也是选择音频接口的两个重要标准。无论采样频率如何，理论上来说采样的位数决定了音频数据最大的力度范围。每增加一个采样位数相当于力度范围增加了6dB。采样位数越多则捕捉到的信号越精确。对于采样率来说你可以想象它类似于一个照相机。显然采样率越高，计算机提取的声音越多，对于原始的还原也越加精确。

第四章图形用户界面设计

4.1 图形用户界面概念

图形用户界面或图形用户接口是指采用图形方式显示的计算机操作环境由用户接口。与早期计算机使用的命令行界面相比，图形界面对于用户来说更为简便易用。

GUI是MATLAB提供的图形用户界面开发环境，提供了一系列用于创建图形用户界面的工具，从而简化界面布局和编程工作。

4.2用户界面设计

4.2.1 GUI设计模板

在MATLAB主窗口中，选择File菜单中的New菜单项，再选择其中的GUI命令，就会显示图形用户界面的设计模板。

MATLAB为GUI设计一共准备了四个模板，分别是Blank GUI、GUI with Uicontrols、GUI with Axes and Menu、Modal Question Dialog。

当用户选择不同的模板时，在GUI设计模板界面的右边就会显示出与该模板对应的GUI图形。

4.2.2 GUI设计窗口

在GUI设计模板中选中一个模板，然后单击OK按钮，就会显示GUI设计窗口，选择不同的GUI设计模式时，在GUI设计窗口中显示的结果是不一样的。

GUI设计窗口由菜单栏、工具栏、空间工具栏以及图形对象设计区等部分组成。GUI设计窗口的菜单栏有File、Edit、View、Layout、Tools和Help六个菜单项，使用其中的命令可以完成图形用户界面的设计操作。

4.2.3 GUI设计窗口的基本操作

（1）前面板的设计：在GUI设计窗口创建图形对象后，通过双击该对象，就会显示该对象的属性编辑器。如下图所示。例如，创建一个Push Button对象，并设计该对象的属性值。

图4-1 按钮属性编辑器

通过以上的按钮属性编辑器可以根据个人情况对按钮的名称、颜色、大小等方面的属性进行修改，使按钮在视觉上变的更加完美。

（2）按钮功能的实现：在GUI设计窗口创建按钮后，通过右键单击按钮，选择View callbacks下的callback对相应的按钮进行编程，使按钮实现相应的功能，如下图所示对按钮的响应功能进行设置。

图4-2 按钮功能编辑器

进入到按钮程序编辑窗口，通过编程即可实现按钮的相应功能，如下图：

图4-3 按钮的编程实现界面

通过对各个按钮控件的修改，和对m文件程序的添加就完成对GUI窗口的设计，最后得到的图形化操作界面如下图所示:

图4-4 图形化操作界面

4.2.4 语音的录入与打开

在MATLAB中，[y,fa,bits]=wavread(‘Blip’,[N1 N2]);用于读取语音，7

采样值放在向y中，fs表示采样频率，bits表示采样位数。[N1 N2]表示读取从N1点到N2点的值。

Suond(x，fs，bits)；用于对声音的回放，向量y则就代表了一个信号也就是说可以像处理一个信号表达式一样处理这个声音信号。

第五章课程设计的软件实现

5.1 部分函数语法格式

读wav文件： x=wavread(‘filename’)数组a及b中元素相乘： a.*b 创建图形窗口命令： figure 绘图函数： plot(x)坐标轴： axis([xmin xmax ymin ymax])坐标轴注解： xlabel(‘„’)ylabel(‘„’)图例注解： legend(‘„’)一阶高通滤波器： y=filter([1-0.09375],1,x)分帧函数： f=enframe(x,len,inc)x为输入语音信号，len指定了帧长，inc指定帧移，函数返回为nXlen的一个矩阵，每一行都是一帧数据。

5.2语音信号处理的相关函数

5.2.1语音信号的短时谱：

周期性声门波可表示为:

(5-1)其中，g[n]是声门波的单周期的波形，p[n]是间隔为P的周期采样序列。当u[n]通过线性非时变声道，且该声道的单位冲击响应为h[n]时，声道输出为：

(5-2)为了观察一段语音，需要降生到输出乘以一个一时刻τ 为中心的窗函数 w[n,τ] ,即得到：

（5-3）

这段语音信号的频域表达式为：

（5-4）

即语音信号的谱包络为

语谱图就是现实时变频谱幅度特征的图形表达式为：

（5-5）

将语音信号短时谱程序写入到MATLAB中得到单色语谱图的波形如下：

图5-1 语音信号单色语谱图

5.2.2 自相关方法估计语音信号的声道参数：

由均方预测误差最小的得到正则方程：

（5-6）

其中，（5-7）

在最佳解时的误差为

（5-8）

在自相关法中式5-6，式5-8变为

（5-9）

(5-10)由式5-9和式5-10可列出方程组式5-11

（5-11）

解方程组式5-9求出线性预测系数，通过误差式5-11可求出增益G

（5-12）

加窗后信号频谱图如下：

图5-2 加窗后信号频谱图

通过以上的方法，改变参数分别求得4极点模型频率响应和6极点模型频率响应，6极点波形如下图所示：

图5-3 六极点波形图

最后通过以上方法用一个函数分别实现以上三个功能，三个波形显示在一个界面，通过观察图形，查看它们之间的分别。三者比较所得到的波形如下：

图5-4 三者比较波形图

5.2.3 基音周期检测

数据为浊音语音信号speech1_10k(10000样点/秒)用25ms的汉明窗对语音信号speech1_10k进行加窗处理，并画出所得到的加窗信号的自相关函数，再用根据中心消波法及三电平中心消波法原理改进程序，最后对比中方法基音检测的效果并分析结果。

实验原理及方法

（1）自相关检测原理：对于离散的数字语音信号序列x(n)，如果周期N，则自相关函数也是同周期的周期函数。即：x(n)=x(n+N)。清音信号没有周期性，他的自相关函数也没有周期。浊音新海具有准周期性。自相关基音检测正是利用这一性质对语音信号进行基音检测的。

（2）中心消波法检测原理：中心消波处理是使用如下图所示的中心消波函数进行处理的：

图5-5 中心消波检测图

（3）三电平消波法原理：为了减少自相关计算中的乘法运算，可以把上述中心消波以后的信号y(n)的自相关用两个信号的互相关代替，其中一个信号是y(n)另一个信号是对y(n)进行三电平量化产生的结果。且这个信号有三种可能的取值，因而这里的互相关计算只需要做加减法，而这个互相关序列的周期性与y(n)的自相关序列是近似相同的。

三电平法对语音信号处理得到的波形如下：

图5-6 三电平法波形图

中心消波法得到的波形如下图：

图5-7 中心消波法波形图

5.3 GUI实验箱操作界面设计

通过对各个控件的编程和对参数的设计，最后得到的GUI实验箱操作界

面如下图所示，通过界面上的各个按钮即可实现相应的功能。

图5-8 GUI实验箱操作界面

第六章心得体会

通过本次课程设计完成了对语音信号的读取与打开，与课题的要求十分相符；初略的完成了界面的设计，但也存在相当的不足，达到了打开语音文件，显示已定波形。语音信号处理时语音学与数字信号处理技术相结合的交叉学科，将语音当做一种特殊的信号，即一种“复杂向量”来看待。也就是说，体现了数字信号处理技术。

本次课程设计时希望将数字信号处理技术应用与某一实际领域，这里就是指对语音的处理。作为存储与计算机中的语音信号，其本身就是离散化了的向量，我们只需要将这些离散的量提取出来美酒可以对其进行处理了。

本次课设，用到了处理数字信号的强有力工具MATLAB，通过MATLAB李的几个命令函数的调用，很轻易的在实际化语音与数字信号的理论之间搭了一座桥。

最后，还利用了MATLAB的另一强大功能——GUI界面设计。设计出了一个建议的用户应用界面，可以让人实现界面操作。

通过本次课程设计让我更加了解了语音信号处理在现实中的强大的应用空间，同时查阅了很多相关的资料，应用MTALAB软件来完成，熟练掌握了MATLAB软件，本次课程设计要求用GUI设计模块，查阅了很多资料，更加深刻的陆奥了了这方面知识。

本次课程设计，我明白了理论的学习需要在实践中才能得到巩固。在课程设计中，只有动手慢慢研究，才能真正了解MATLAB软件平台中可以直接设计数字滤波器的各个函数的调用，对设计GUI实验箱的所有函数的运用有了比较好的认识。

通过这个课程设计，我学到了很多MATLAB和语音信号的知识，提高了自己在语音信号设计方面的知识能力，动手能力和思维能力都得到了一定的提升，希望自己以后可以更多的继续学习这一门课程设计方面的知识。

附录

1.源程序代码:

参考文献

[1] 刘庆华陈紫强《基于MATLAB和DSP的语音信号处理课程的建设》电气电子教学学报 2006 10（3）：124-128 [2] 张力《MATLAB在语音信号处理辅助教学中的应用》电气电子教学学报 2005 27卷2期：96-99 [3] 邓立新杨震《信息技术融入“语音信号处理”课程的教学实践》电气电子教学学报 2005 27卷5期：13-16 [4] 胡航，《语音信号处理》哈尔滨工业大学出版社 2005年2月，第二版：135-137 [5] 张平，《MATLAB基础与应用》北京航空航天大学出版社 2007，第二版：85-92 [6] 谢德芳《数字信号处理》北京科学出版社 2005，第一版

[7] 张雄伟《现代语音处理技术及应用》机械工业出版社 2006，第二版 [8] 吴家安《语音编码技术及应用》机械工业出版社 2006 第一版 [9] 刘幺和宋庭新《语音识别与控制应用技术》科学出版社 2008 第二版

[10] 李昌立吴善培《数字语音编码实用教程》人民邮电出版社 2004 第一版

[11] 姚天仁《数字语音处理》华中科技大学出版社 1992 第二版 [12] 朱敏雄《计算机语音技术（修订版）》北京航空航天大学出版社 2002 第一版

[13] 王炳锡《语音编码》西安电子科技大学出版社 2002 第一版

第三篇：语音信号处理实验报告要求

实验一：

1.简述本次试验的目的，关于基音周期的理论；

2.使用相关法的同学，给出程序的同时要说明所使用语音段的长度（短时平稳性），解释怎样在matlab中实现三电平削波（for...end循环和if elseif else end判决的使用）。给出清浊音两组截取后的语音信号波形图、三电平削波后的信号图、自相关计算后的信号图。然后根据自相关信号图上最大峰值和次峰值之间的间隔点数，计算出基音周期和基音频率；

3.使用倒谱法的同学，要解释分帧后加窗的方法，给出清浊音其中各一帧的语音信号波形图，和计算后的倒谱图。并根据倒谱图上对应基音周期处的峰值的位置，给出基音周期。4.使用简化逆滤波的同学，要说明切比雪夫2型低通滤波器的使用方法（cheby2、freqz两个函数的使用方法、参数意义），给出低通滤波后的信号波形图、5倍抽取后的波形图、自相关计算后信号波形图、5倍插值后的信号波形图，根据浊音内插后的信号图上最大峰值和次峰值之间的间隔点数计算基音周期；5.比较所选用的两种方法的结果。

实验二：

1.给出倒谱法的程序，解释汉明窗宽度的选取要求（书上有简单解释），解释怎样实现倒谱窗的matlab编程方法和倒谱窗宽度的选取（男女生有一定的差别），给出加窗后的信号波形图、对数谱图、倒谱图、加窗后的信号频谱图，给出三个共振峰的估值。

2.给出LPC谱估计程序，不同LPC阶数时的LPC谱图，在n＝？时，学生自己估计的前三个共振峰的值。

实验三：

给出录音的内容，判断结果。解释端点检测的原理、MFCC系数的说明和DTW算法的简单原理（参考书上都有比较详细的解释）。识别的结果的表格和识别的结果正确率（正确的数目，错误的数目，正确率）。考虑一下识别错误的原因（录音的效果？端点检测算法的可靠性？DTW算法的可靠性？等）

第四篇：DSP语音信号处理

第一章绪

论.........................................................................................................1

1.1课程设计的目的及意义..................................................................................1 1.2设计要求..........................................................................................................1 1.3 研究内容.........................................................................................................1

第二章语音信号处理理论基础........................................................................3

第三章

系统方案论证.....................................................................................5 第四章

GUI设计实现.....................................................................................6

4.1 图形用户界面概念.........................................................................................6 4.2用户界面设计..................................................................................................6

4.2.1 GUI设计模板........................................................................................6 4.2.2 GUI设计窗口........................................................................................6 4.2.3 GUI设计窗口的基本操作....................................................................6 4.2.4 语音的录入与打开................................................................................9 4．3课程设计的软件实现....................................................................................9

4.3.1语音信号的短时谱.................................................................................9 4.3.2 自相关方法估计语音信号的声道参数..............................................10 4.3.3 基音周期检测......................................................................................12 4.4 GUI实验箱操作界面设计............................................................................14 第五章心得体会..................................................................................................15 参考文献...................................................................................................................16

摘

要

第一章绪

论

1.1课程设计的目的及意义

通过设计语音信号实验箱可以对语音信号实现各种形式的变换，因此学会对语音信号的处理，也可自行研究将此语音处理技术应用到现实生活中。

1.2设计要求

（1）学会MATLAB的使用，掌握MATLAB的程序设计方法；（2）掌握在windows环境下语音信号的采集方法；（3）掌握数字信号处理的基本概念，基本理论和基本方法；（4）掌握MATLAB设计方法；

（5）学会用MATLAB对信号进行分析和处理。

1.3 研究内容

1．理论依据

根据设计要求分析系统功能，掌握设计中所需理论（采样频率、采样位数的

概念，采样定理；时域信号的FFT分析；数字滤波器设计原理和方法，各种不同类型滤波器的性能比较），阐明设计原理。2．信号采集

采集语音信号，并对其进行FFT频谱分析，画出信号的时域波形图和频谱图。3．构造受干扰信号并对其进行FFT频谱分析

对所采集的语音信号加入干扰噪声，对语音信号进行回放，感觉加噪前后声音的变化，分析原因，得出结论。并对其进行FFT频谱分析，比较加噪前后语音信号的波形及频谱，对所得结果进行分析，阐明原因，得出结论。4．数字滤波器设计

根据待处理信号特点，设计合适数字滤波器，绘制所设计滤波器的幅频和相频特性。5．信号处理

用所设计的滤波器对含噪语音信号进行滤波。对滤波后的语音信号进行FFT频谱分析。画出处理过程中所得各种波形及频谱图。

对语音信号进行回放，感觉滤波前后声音的变化。比较滤波前后语音信号的波形及频谱，对所得结果和滤波器性能进行频谱分析，阐明原因，得出结论。6．设计图形用户界面

设计处理系统的用户界面,在所设计的系统界面上可以选择滤波器的参数,显示滤波器的频率响应,选择信号等。

第二章语音信号处理理论基础

语音检测算法是现在语音信号处理研究的一个热点。近些年来，语音信号处理技术伴随着人们对通讯技术升级的需求得到了迅猛的发展。IP电话已经走向大规模产业化应用，并以其低廉的成本和满意的话音质量成为通讯供应商竞争的利器，大有取代传统电话的趋势。语音识别技术也已经实现了与说话者无关的大词汇量连续语音识别，并试图从试验研究走向商用。说话者识别技术作为一个新一代的门禁安防技术也已经出现商业应用。很多单工的通讯设备可以通过语音检测技术的应用实现收发状态的自动转换而以比较小的代价达到双工设备的功能。语音检测技术作为这些语音处理算法中的核心预处理单元，成为这些技术能否走向成熟商业应用的关键技术之一。实际通讯环境中会遇到各种不同类型、不同强度的噪声。它们各自在时域或频域中有互不相同的特点，没有一致的统计参数。语音信号本身也是一个时变的复杂信号。不同的语言，不同的音位（语音中的最小发声单位）各不相同。

总之，实际中的噪声和语音信号都是复杂的时变信号。如果不是面向特定背景噪声的应用，通过寻找噪声的共同特征以构建一个噪声信号与语音信号的区分函数是不现实的。语音信号处理本身是一个涉及到传统数字信号处理、统计信号处理、模式识别与建模、发声学、语音语言学等多学科的综合技术。论文在前人研究的基础上，从语音信号的形制机理出发，对语音信号中的基本成分—轻音和浊音的特征进行了深入的研究。Source-Filter模型在语音信号建模中有着广泛的应用，论文在基于Source-Filter模型求取语音信号的LPC谱中发现，语音的短时稳定性（short time stationary）在LPC谱中有着不同于噪声信号的鲜明体现，从而提出了基于音位共振峰轨迹跟踪的语音检测新方法。论文对新算法与国际电信联盟（ITU）的G729B推荐语音检测标准算法进行了对比验证，证明在强背景噪声环境下新算法的性能有20％左右的提高。同时新算法也体现出比G729B更

强的背景噪声适应能力。在算法的实现中，局部大能量的噪声会形成LPC谱中的局部极大值点，它具有类似语音共振峰的特征。为了消除噪声极大值点对音位共振峰轨迹跟踪的不良影响，论文提出了一个共振峰的形态判别标准—音位共振峰的幅值峰谷比原则，并通过大量的试验研究确定了峰谷比的优化量值。试验证明，此方法是剔除局部噪声极值点的有效方法。论文工作将新算法在一个基于TI TMS320C6711的数字信号处理器平台上实时实现。在实现过程中，使用了幅值、步长的分段拟合和插值算法，大大降低了复杂数学函数的运算时间，满足了算法了实时性要求。

第三章

系统方案论证

一、采样频率是指计算机每秒钟采集多少个声音样本，是描述声音文件的音质、音调、衡量声卡、声音文件的质量标准。采样频率越高，即采样的间隔时间越短，则在单位时间内计算机得到的声音样本数据就越多，对声音波形的表示也就越精确，采样频率与声音频率之间有一定的关系，根据奈奎斯特理论，只有采样频率高于声音信号最高频率的2倍的时候，才能把数字信号表示的声音还原成为原来的声音，这就是说采样频率是衡量声卡采集、记录和还原声音文件的质量标准。

二、采样位数即采样值或取样值，用来衡量声音波动变化的参数，是指声卡在采集和播放声音文件时候使用数字声音信号的二进制为数。采样频率是指录音设备在一秒钟内对声音信号的采样次数，采样频率越高声音的还原就越真实越自然。

三、采样位数和采样频率对于音频接口来说是最为重要的两个基本指标，也是选择音频接口的两个重要标准。无论采样频率如何，理论上来说采样的位数决定了音频数据最大的力度范围。每增加一个采样位数相当于力度范围增加了6dB。采样位数越多则捕捉到的信号越精确。对于采样率来说你可以想象它类似于一个照相机。显然采样率越高，计算机提取的声音越多，对于原始的还原也越加精确。

第四章

GUI设计实现

4.1 图形用户界面概念

GUI是MATLAB提供的图形用户界面开发环境，提供了一系列用于创建图形用户界面的工具，从而简化界面布局和编程工作。

4.2用户界面设计

4.2.1 GUI设计模板

在MATLAB主窗口中，选择File菜单中的New菜单项，再选择其中的GUI命令，就会显示图形用户界面的设计模板。

MATLAB为GUI设计一共准备了四个模板，分别是Blank GUI、GUI with Uicontrols、GUI with Axes and Menu、Modal Question Dialog。

当用户选择不同的模板时，在GUI设计模板界面的右边就会显示出与该模板对应的GUI图形。

4.2.2 GUI设计窗口

在GUI设计模板中选中一个模板，然后单击OK按钮，就会显示GUI设计窗口，选择不同的GUI设计模式时，在GUI设计窗口中显示的结果是不一样的。

4.2.3 GUI设计窗口的基本操作

图4-1 按钮属性编辑器

通过以上的按钮属性编辑器可以根据个人情况对按钮的名称、颜色、大小等方面的属性进行修改，使按钮在视觉上变的更加完美。

图4-2 按钮功能编辑器

进入到按钮程序编辑窗口，通过编程即可实现按钮的相应功能，如下图：

图4-3 按钮的编程实现界面

通过对各个按钮控件的修改，和对m文件程序的添加就完成对GUI窗口的设计，最后得到的图形化操作界面如下图所示:

图4-4 图形化操作界面

4.2.4 语音的录入与打开

在MATLAB中，[y,fa,bits]=wavread(‘Blip’,[N1 N2]);用于读取语音，采样值放在向y中，fs表示采样频率，bits表示采样位数。[N1 N2]表示读取从N1点到N2点的值。

Suond(x，fs，bits)；用于对声音的回放，向量y则就代表了一个信号也就是说可以像处理一个信号表达式一样处理这个声音信号。

4．3课程设计的软件实现

4.3.1语音信号的短时谱

周期性声门波可表示为:

(4-1)其中，g[n]是声门波的单周期的波形，p[n]是间隔为P的周期采样序列。当u[n]通过线性非时变声道，且该声道的单位冲击响应为h[n]时，声道输出为：

(4-2)为了观察一段语音，需要降生到输出乘以一个一时刻τ 为中心的窗函数 w[n,τ] ,即得到：

（4-3）

这段语音信号的频域表达式为：

即语音信号的谱包络为

（4-4）

语谱图就是现实时变频谱幅度特征的图形表达式为：

（4-5）

将语音信号短时谱程序写入到MATLAB中得到单色语谱图的波形如下：

图4-5 语音信号单色语谱图

4.3.2 自相关方法估计语音信号的声道参数

由均方预测误差最小的得到正则方程：

其中，在最佳解时的误差为

在自相关法中式4-6，式4-8变为

(4-10)由式4-9和式4-10可列出方程组式4-11 10

（4-6）（4-7）（4-8）（4-9）

（4-11）

解方程组式4-9求出线性预测系数，通过误差式4-11可求出增益G

（4-12）

加窗后信号频谱图如下：

图4-6 加窗后信号频谱图

通过以上的方法，改变参数分别求得4极点模型频率响应和6极点模型频率响应，6极点波形如下图所示：

图4-7 六极点波形图

最后通过以上方法用一个函数分别实现以上三个功能，三个波形显示在一个界面，通过观察图形，查看它们之间的分别。三者比较所得到的波形如下：

图4-8 三者比较波形图

4.3.3 基音周期检测

实验原理及方法

相关检测原理：对于离散的数字语音信号序列x(n)，如果周期N，则自相关函数也是同周期的周期函数。即：x(n)=x(n+N)。清音信号没有周期性，他的自相关函数也没有周期。浊音新海具有准周期性。自相关基音检测正是利用这一性质对语音信号进行基音检测的。

中心消波法检测原理：中心消波处理是使用如下图所示的中心消波函数进行处理的：

图4-9 中心消波检测图

三电平消波法原理：为了减少自相关计算中的乘法运算，可以把上述中心消

波以后的信号y(n)的自相关用两个信号的互相关代替，其中一个信号是y(n)另一个信号是对y(n)进行三电平量化产生的结果。且这个信号有三种可能的取值，因而这里的互相关计算只需要做加减法，而这个互相关序列的周期性与y(n)的自相关序列是近似相同的。

三电平法对语音信号处理得到的波形如下：

图4-10 三电平法波形图

中心消波法得到的波形如下图：

图4-11 中心消波法波形图

4.4 GUI实验箱操作界面设计

通过对各个控件的编程和对参数的设计，最后得到的GUI实验箱操作界面如下图所示，通过界面上的各个按钮即可实现相应的功能。

图4-12 GUI实验箱操作界面

第五章心得体会

本次课设，用到了处理数字信号的强有力工具MATLAB，通过MATLAB李的几个命令函数的调用，很轻易的在实际化语音与数字信号的理论之间搭了一座桥。

最后，还利用了MATLAB的另一强大功能——GUI界面设计。设计出了一个建议的用户应用界面，可以让人实现界面操作。

参考文献

[1]陈怀琛.MATLAB及在电子信息课程中的应用【M】.北京电子工业出版社.2008.1 [2]张文.基于MATLAB的语音信号的滤波域实现【M】.山西电子技术.2008.2 [3]徐靖涛.基于MATLAB的语音信号分析与处理【M】.重庆科技学院学报.2008.1 [4]张威．MATLAB基础与编程入门【M】．西安电子科技大学出版社，2006． [5]周渊，王炳和，刘斌胜．基于MATLAB的噪声信号采集和分析系统的设计【J】．噪声控制．2004(7)：52-54．

[6]张雄伟，陈量，杨吉斌．现代语音处理技术及应用【M】．北京：机械工业出版社．2003

第五篇：专业英语7语音信号处理

1、演讲的目的是沟通。有几种方法表征语音通信的潜力。一个高度量化的方法是香农信息论思想的引入。根据信息变换理论，语音可以表示其消息内容或信息。语音特征的另一种表征方式是信号承载的消息信息，i.e.(注:i.e.意思是：即，也就是),如声波。虽然信息论思路在先进的通信系统中发挥了重要作用，但它是基于波形的语音表示，或一些在实际应用中一直是最有用的参数模型。

2、在考虑语音通信的过程中，开始在大脑中思考消息在扬声器中的一些抽象的表示形式是有帮助的。虽然产生语音的过程是复杂的，但该消息中的信息最终被转换成声学信号。在言语产生的过程中消息的信息可以被认为存在许多不同的表示方式。例如，该消息信息首先被转换成一组能控制发音机制的神经信号（即，运动舌头，嘴唇，声带等）。发音器官的运动响应于这些神经信号来完成一系列的手势，其结果是在原始消息中包含的信息的音响波形。

3、信息虽然连通但讲话本质上是一个离散的性质的信息，i.e.，即，它可以被有限集合中元素串联的符号表示，每一个声音的符号可以被分类，被称为音素。每种语言都有它自己的独特的音素，编号通常在30至50之间。例如英语可以表示为一组约42个编号的音素。

4、信息理论关注的中心问题是传达信息的速率。讲话的信息率可以通过发音器官物理上的运动速度粗略估计，人类讲话的平均速率每秒约10个音素。如果每个音素表示一个二进制数，那么6位数字代码足以代表所有的英语音素，设平均增长率为每秒10音素，并且忽略任何相邻音素的组合，我们得到了一个大约60比特/秒的平均信息语速。换句话说，书面讲话包含的信息相当于60位/秒正常讲话率。当然一个“真正”的语音信息内容的下界是大大高于这个速度的，上述估计确实需要考虑一些因素，如说话者的身份和情感状态，说话的速率，声音的响度，等。

5、在语音通信系统中,语音信号的传输、存储、和处理有许多方法。技术问题导致各种表示形式的语音信号的产生。一般来说,有两个主要的问题存在于任何一个系统中:一是保护消息内容的语音信号。另一个是语音信号便于传输和存储的表示形式。或者以一种灵活的形式表示，这样修改后不会对语音信号所表示的消息内容产生严重退化的影响。

6、语言信号必须这样表示，信息内容能被听众容易的提取，或自动被机器提取。

语音信号的表示形式（而不是消息的内容）可能需要从500到1百万比特每秒以上的提取速度。这些表示形式的设计和实现，信号处理的方法发挥基础性作用。

7、一般的信息处理问题可用图3-22描绘的框图表示。在语音信号的情况下，说话者就是信源。一般测量或观察声波的尺寸。

8、涉及信号处理，首先根据一个给定的模型获得信号，利用运用程序对信号进行一些更高层次的变换，以便把该信号转换成一个更方便的形式。在这个过程中的最后一步是报文信息的提取和利用。本步骤可以由人类听众或由机器自动进行。例如，一个系统，其功能是自动识别扬声器从一个给定的发言者发出的语音信号，该语音信号可能使用一个随时间变化的频谱表示。

9、因此，语音信号处理涉及两个任务。一，这是语音信号的波形或参数一般表示形式的获取手段；二，信号处理在转换的过程中提供函数帮助，这是信号一般性质的替代形式，但更适合特定的应用程序。

10、我们将探索数字技术在语音信号处理中的作用。数字信号处理涉及离散信号的获取与表示，伴随变换理论，涉及和数控程序的实施用来处理离散信号的表示。数字信号的处理目的类似于模拟信号的处理。因此，在语音通信的上下文中单独挑出数字信号处理技术做特别考虑是合理的。可以列举一些很重要的原因。首先，最重要的大概是一些极其复杂的信号处理功能可以用数字技术来实施的事实。此外，语音信号处理中常用的算法本质上是离散时间信号处理系统。它们大多不适合作为近似的模拟系统来观察，的确在许多情况下没有可用的模拟实施方案。

11、数字信号处理技术在语音处理问题中被首次运用，仿真复杂的模拟系统。最初的观点来看，模拟系统可以在计算机上进行模拟，避免为了试验参数选择和其他设计考虑系统建设的必要性。数字仿真模拟系统的首次应用，需要大量的处理时间。在1960年代中期，一次数字信号处理的革命发生了。主要的主要催化剂是发展快速的计算机和突飞猛进的数字信号处理技术理论。因此，数字信号处理系统具有的优点使得年轻一代有能力来模拟模拟系统的情况变得明朗。目前计算机语音处理系统在实验室中实现，他们作为一个数字系统，可以作为实施特殊用途的数字硬件或对专用的计算机系统进行精确模拟。

12、除理论发展外，伴随数字硬件的发展数字处理技术的优点进一步加强以致于超过模拟系统。数字系统非常可靠和紧凑。集成电路技术已经发展到可以把极其

复杂的系统实现在单个芯片上。逻辑运算的速度足以满足许多信号处理功能所需的巨大数量的计算，可以实现实时语音采样率。

13、在语音通信系统中使用数字技术有另外的原因。如，如果使用合适的编码，在非常嘈杂的信道，数字形式的语音信号能可靠地传输。语音信号的数字形式与其他形式的数据的相同。因此，可以使用一个通信网络同时传输话音和数据，除解码外没有必要区分它们。在安全方面语音信号的传输需要数字表示，它具有明显的优势超过了模拟系统。为了保密，对信息比特进行加扰，最终能在接收器解读。这些和许多其他的原因，数字技术正在被越来越多地应用于语音通信问题。

14、考虑应用数字信号处理技术来处理语音通信问题，专注于三个主题它是非常有帮助的：语音信号的数字表示形式，实施先进的处理技术和很大程度上依赖于数字信号处理的应用程序类。

基于Cool-Edit__Praat的语音信号音频文件制作11

第一篇：基于Cool-Edit__Praat的语音信号音频文件制作11

第二篇：DSP语音信号处理

第三篇：语音信号处理实验报告要求

第四篇：DSP语音信号处理

第五篇：专业英语7语音信号处理

相关范文推荐

语音信号处理与识别

TMS320C54XDSP语音信号处理（5篇范文）

语音背景音乐合成怎么制作

--基于MATLAB的语音信号的频谱分析

语音信号处理及加密课程总结

语音信号处理课程设计指导剖析

实验二语音信号分析与处理2010

基于+MATLAB+的语音信号分析与处理的课程设计