第一篇:《信号与系统》课程设计——语音信号的分析和处理
《信号与系统》课程设计——语音信号的分析和处理
【设计题目】基于时频域的分析方法对语音信号进行分析和处理 【设计目标】尝试对语音信号进行时频域分析和处理的基本方法 【设计工具】MATLAB 【设计原理】
通过MATLAB的函数wavread()可以读入一个.wav格式的音频文件,并将该文件保存到指定的数组中。例如下面的语句(更详细的命令介绍可以自己查阅MATLAB的帮助)中,将.wav读入后存放到矩阵y中。y = wavread('SpecialEnglish.wav');
对于单声道的音频文件,y只有一行,即一个向量;对于双声道的音频文件,y有两行,分别对应了两个声道的向量。我们这里仅对一个声道的音频进行分析和处理即可。注意:.wav文件的采样频率为44.1KHz,采样后的量化精度是16位,不过我们不用关心其量化精度,因为在MATLAB读入后,已将其转换成double型的浮点数表示。
在获得了对应音频文件的数组后,我们可以对其进行一些基本的分析和处理。可以包括:
1、对语音信号进行频域分析,找到语音信号的主要频谱成分所在的带宽,验证为何电话可以对语音信号采用8KHz的采样速率。
2、分析男声和女声的差别。我们知道男声和女声在频域上是有些差别的,一般大家都会认为女声有更多高频的成分,验证这种差别。同时,提出一种方法,能够对一段音频信号是男声信号、还是女声信号进行自动的判断。
3、语音与乐器音频的差别。比较语音信号与乐器音频信号的差别,尤其是在频域上的差别。
4、.wav文件的采样速率为44.1KHz,仍然远远高于我们通常说的语音信号需要的频谱宽度,例如在电话对语音信号的采样中,我们仅仅使用8KHz的采样速率。对读入的音频数据进行不同速率的降采样,使用wavplay()命令播放降采样后的序列,验证是否会对信号的质量产生影响。降采样的方法很简单,例如命令y = wavread('SpecialEnglish.wav');将语音文件读入后保存在向量y中,这时对应的采样频率为44.1KHz。使用y1 = y(1:2:length(y))命令,就可以将原序列y每隔1个采样后放入序列y1中,这时y1序列对应的采样频率即为22KHz。
5、自己下载获得一段中文语音信号(可以使用诸如“千千静听”等工具将.mp3文件转换成.wav文件),对中文语音与英文语音进行比较。以下对提供的语音信号进行说明:
SpecialEnglish.mp3:原始的语音信号,.mp3格式 Q2.wav:男声信号
Q3.wav、Q5.wav:女声信号
Q4.wav、Q6.wav:带有乐器伴奏的男声歌声信号 Q7.wav:音乐信号
【MATLAB参考命令】
绘图命令:plot、stem等 求频谱、频率响应:fft、freqz等 卷积、滤波:conv、deconv、filter等
声音文件读写:wavread、wavwrite、wavplay等
具体使用方法可以查阅MATLAB的帮助或者MATLAB参考书的基本使用。
第二篇:语音信号处理课程设计指导剖析
数字信号处理课程设计报告
学院:电子信息学院
班级:通信131
姓名:*** 2016年 月 日
语音信号处理
目录
一、设计目的.................................2
二、设计要求及任务...........................2 2.1 语音信号的采集........................2 2.2 语音信号的频谱分析;..................2
三、课程设计平台.............................3
四、设计原理与计算方法.......................3 4.1卷积运算..............................3 4.2 采样定理..............................3
五、设计内容.................................4 5.1利用带阻滤波器的进行滤波的具体步骤....4 5.1.1语音信号的录入与提取..............4 5.1.2加入噪声信号......................6 5.1.3 语音信号和噪声信号相加...........8 5.1.4滤波器设计........................9 5.1.5对信号进行滤波...................11 5.2利用低通滤波器进行滤波...............12 六:总结....................................14
语音信号处理
一、设计目的
1、学会MATLAB的使用,掌握MATLAB程序设计方法;
2、掌握在Windows环境下语言信号采集的方法;
3、掌握数字信号处理的基本概念、基本理论和基本方法;
4、掌握MATLAB设计IIR数字滤波器的方法;
5、学会用MATLAB对信号进行分析和处理;
二、设计要求及任务
2.1 语音信号的采集
本设计利用计算机Windows下的录音机录入一句语音信号,然后在Matlab软件平台下,利用函数waveread对语音信号进行采样,记住采样频率和采样点数。
2.2 语音信号的频谱分析;
在Matlab中,可以利用函数FFT对信号进行快速傅里叶变换,得到信号的频谱特性,然后加入一干扰信号,要求画出语音信号干扰前后的时域波形,并对其频谱进行分析。
1、设计数字滤波器,给出性能指标(参考指标);
(1)低通滤波器的性能指标:fp=1000Hz,fs=1200Hz,As=100dB,Ap=1dB(2)高通滤波器的性能指标:fs=4800Hz,fp=5000Hz,As=100dB,Ap=1dB(3)带通滤波器的性能指标:fp1=1200Hz,fp2=3000Hz,fs1=1000Hz, fps2=3200Hz,As=100dB,Ap=1dB;
采用双线性变换法设计上面一种类型的数字滤波器,要求使用切比雪夫II型滤波器。
2、用滤波器对信号进行滤波
语音信号处理
画出滤波后信号的时域波形及频谱,并对滤波前后的信号进行对比,分析信号的变化。
3、回放语音信号,分析滤波前后的语音变化。
在熟悉数字信号处理课程理论的基础上,通过MATLAB仿真实现语音信号的采集与处理,进一步加深对数字信号处理理论和技术的掌握。
三、课程设计平台
计算机、MATLAB6.5以上
四、设计原理与计算方法
4.1卷积运算
卷积和乘积运算在频域和时域是一一对应的,两个信号在时域的卷积可以转化为求两者在频域的乘积后再反变换,同理在频域的卷积等时域的乘积。而信号的频域求解有快速傅里叶FFT算法。
卷积与傅里叶变换有着密切的关系。利用这一点性质,即两函数的傅里叶变换的乘积等于它们卷积后的傅里叶变换,能使傅里叶分析中许多问题的处理得到简化。
由卷积得到的函数f*g 一般要比f 和g 都光滑。特别当g 为具有紧支集的光滑函数,f 为局部可积时,它们的卷积f * g 也是光滑函数。利用这一性质,对于任意的可积函数f,都可以简单地构造出一列逼近于f 的光滑函数列,这种方法称为函数的光滑化或正则化。
卷积的概念还可以推广到数列、测度以及广义函数上去。4.2 采样定理
采样定理,又称香农采样定理,奈奎斯特采样定理,是信息论,特别是通讯与信号处理学科中的一个重要基本结论。E.T.Whittaker(1915年发表的统计理论), 3
语音信号处理
克劳德·香农与Harry Nyquist都对它作出了重要贡献。另外,V.A.Kotelnikov也对这个定理做了重要贡献。
采样是将一个信号(即时间或空间上的连续函数)转换成一个数值序列(即时间或空间上的离散函数)。采样定理指出,如果信号是带限的,并且采样频率高于信号带宽的两倍,那么,原来的连续信号可以从采样样本中完全重建出来。带限信号变换的快慢受到它的最高频率分量的限制,也就是说它的离散时刻采样表现信号细节的能力是有限的。采样定理是指,如果信号带宽不到采样频率的一半(即奈奎斯特频率),那么此时这些离散的采样点能够完全表示原信号。高于或处于奈奎斯特频率的频率分量会导致混叠现象。大多数应用都要求避免混叠,混叠问题的严重程度与这些混叠频率分量的相对强度有关。
五、设计内容
5.1利用带阻滤波器的进行滤波的具体步骤
5.1.1语音信号的录入与提取
用电脑所带的录音工具录制一段录音,并将声音保存,因为录入的声音不是wav格式,因此用格式工厂软件将其进行转换位wav格式。
利用Matlab对语音信号进行FFT分析,并画出源语音信号的时域波形和频域波形。实验代码:
[x,fs]=wavread('c1.wav');%利用wavread函数对语音信号进行提取 figure(1)subplot(2,1,1);N=length(x);T=1/fs;
t=0:T:(N-1)*T;%时间间隔
plot(t,x)%以时间为横轴,x为纵轴画图 title('原语音信号时域分析')%图形命名 xlabel('t(s)')ylabel('x')
以上为时域分析,接下来为频域分析
语音信号处理
f=(0:N-1)*fs/N;X=fft(x);subplot(2,1,2)plot(f,abs(X))axis([0 25000 0 60]);title('原语音信号频域分析')xlabel('f(Hz)')ylabel('X')
语音信号图形:
语音信号处理
5.1.2加入噪声信号
在此选择余弦函数作为噪声信号,因为正弦和余弦函数的频域为两条竖直的线,便于滤波
实验代码:
y=0.003*sin(50000*t);
y1=[y' y'];%对噪音信号进行转换,便于信号相加(见下图有说明)Y=fft(y);figure(2)subplot(2,1,1)plot(t,y)
title('干扰信号时域波形')xlabel('t(s)')
ylabel('y=0.003*sin(50000*t)')Y=fft(y);subplot(2,1,2)plot(f,abs(Y))
axis([0 25000 0 60]);%取在语音信号范围内的噪声信号 title('干扰信号频域波形')xlabel('f(Hz)')ylabel('Y')
语音信号处理
通过图中划线的部分可以看出,通过y1=[y' y']此句可以将x和y这两个变量类型统一,以便噪声与语音信号的相加
语音信号处理
噪声信号图形:
5.1.3 语音信号和噪声信号相加
实验代码:
x1=wavread('c1.wav');x2=x1+y1;figure(3)subplot(2,1,1)plot(t,x2)
title('加入噪声信号时域波形')xlabel('t(s)')ylabel('x')X2=fft(x2);subplot(2,1,2)plot(f,abs(X2))
axis([0 25000 0 60]);title('加入噪声信号频域波形')
语音信号处理
xlabel('f(Hz)')ylabel('Y')
两信号相加图形:
5.1.4滤波器设计
fp1=0.5*10^4;fp2=4*10^4;fs1=0.6*10^4;fs2=3.7*10^4;Rp=1;As=100;Fs=80000;
wp11=2*pi*fp1/Fs;wp22=2*pi*fp2/Fs;ws11=2*pi*fs1/Fs;
语音信号处理
ws22=2*pi*fs2/Fs;
OmegaP11=2*Fs*tan(wp11/2);OmegaP22=2*Fs*tan(wp22/2);OmegaS11=2*Fs*tan(ws11/2);OmegaS22=2*Fs*tan(ws22/2);OmegaP=[OmegaP11,OmegaP22];OmegaS=[OmegaS11,OmegaS22];%预畸变化
[N,OmegaC]=cheb2ord(OmegaP,OmegaS,Rp,As,'s');[b,a]=cheby2(N,As,OmegaS,'stop','s');[bz,az]=bilinear(b,a,Fs);%AD转换 [H,w]=freqz(bz,az);db=20*log10(abs(H));figure(4)plot(w/pi,db)title('带阻滤波器')xlabel('w/pi')ylabel('Db')
滤波器图形:
语音信号处理
5.1.5对信号进行滤波
实验代码:
H=filter(bz,az,x2);figure(5)subplot(211)plot(t,H)
title('滤波后时域')xlabel('t(s)')ylabel('x')subplot(212)H1=fft(H);plot(f,abs(H1));axis([0 25000 0 60]);title('滤波后频域')xlabel('f(Hz)')
语音信号处理
ylabel('Y')
滤波后图形:
对比原图源信号已经被滤出来了 5.2利用低通滤波器进行滤波
前三步和上面带阻滤波器一样便不再重复叙述,从低通滤波器的设计开始 低通滤波器实验代码: fp1=0.25*10^4;fs1=0.5*10^4;Rp=1;As=100;Fs=30000;
wp11=2*pi*fp1/Fs;ws11=2*pi*fs1/Fs;
OmegaP=2*Fs*tan(wp11/2);OmegaS=2*Fs*tan(ws11/2);%频率预畸
语音信号处理
[N,OmegaC]=cheb2ord(OmegaP,OmegaS,Rp,As,'s');%为了得到N C [z0,p0,k0]=Cheb2ap(N,As);%归一化原型低通滤波器零极点 a0=real(poly(p0));b0=k0*real(poly(z0));
[b,a]=lp2lp(b0,a0,OmegaC);%将归一化原型低通转换成低通滤波器
[bz,az]=bilinear(b,a,Fs);%双线性变换AF到DF [H,w]=freqz(bz,az);db=20*log10(abs(H));figure(4)plot(w/pi,db)title('低通滤波器')xlabel('w/pi')ylabel('Db')
此处设计低通滤波器时与上面方法不同,此处先求出了归一化原型低通滤波器,在利用归一化原型低通滤波器转换成低通滤波器 低通滤波器图形:
语音信号处理
滤波后图形:
从图中可以看出,利用低通滤波器也还原出了源语音信号,并且比带阻的效果稍好一点
六、总结
这次课程设计虽然遇到了很多问题,很多困难,但是也学到了很多东西。不仅学到了书本上的东西,而且学到了很多课本上没有的东西,很多程序里的东西,特别是程序语法,总是有错误,但是总是不知道错在哪里,在细心的检查下,终于找出了错误和警告,排除困难后,程序编译就通过了,心里终于舒了一口气。还有各种各样问题,通过查网络和请教同学来弄明白,这个过程是痛苦的,有时候有些问题不能马上解决,感到很头痛,真想放弃这个问题,但是坚持下来,并且解决这些问题的时候,真的有种苦尽甘来的感觉。
应用MATLAB进行语音信号的处理是与我们所学课程及专业紧密相连的,有着很强的实践性。做这个课程设计的时候,并不是非常的顺利,我也有遇到很多困难。刚开始,我用自己的mp3录制的一个音频文件做语音信号处理,程序始终现实如下错误提示:
语音信号处理
??? Error using ==> wavread Error using ==> wavread Data compression format(IMA ADPCM)is not supported.我在查阅了很多资料,在网上也查阅相关信息,最后发现只有WAV格式的音频信号才能被wavread函数识别,这只是其中的一个小困难,当然后来也出现了许多错误,不过在我们的精心调试下,代码终于运行成功 通过这次设计,进一步加深了对数子信号处理的了解,让我对它有了更加浓厚的兴趣。通过这次课设使我懂得,平时的理论知识只有通过自己动手做一个课题,从做这个课题的过程中发现问题,解决问题,这个学习的过程,会比我们平时在课堂上听到的知识更加的生动立体,更能让人记忆深刻。
总的来说,通过这次的课程设计我对语音信号有了全面的认识,对数字信号处理又有了深刻的理解,让我们感受到只有在充分理解课本知识的前提下,才更更好的应用这个工具。同时我相信,matlab会对我以后的学习中起到更大的帮助
参考文献
[1] 高西全、丁玉美编著,数字信号处理。西安:西安电子科技大学出版社,2008.[2]丁玉美、高西全编著,数字信号处理学习指导。西安:西安电子科技大学出版社,2001.[3]郑君里等编,信号与系统。北京:高等教育出版社,2000.[4]刘树棠译,数字信号处理——使用MATLAB。西安:西安交通大学出版社,2002.[5]导向科技编著,MATLAB程序设计与实例应用。北京:中国铁道出版社,2001.[6]罗军辉等编著,MATLAB7.0在数字信号处理中的应用。北京:机械工程出版社,2005.[7]陈怀琛等编著,MATLAB及在电子信息课中的应用。北京:电子工业出版社,2002.[8]胡广书编组,数字信号处理——理论、算法与实现。北京:清华大学出版社,2002.[9]梁虹等编,信号与线性系统分析——机遇MATLAB的方法与实现。北京:高等教育出版社,2006.语音信号处理
[10]刘卫国主编,MATLAB程序设计与应用(第二版)。北京:高等教育出版社,2006.
第三篇:基于+MATLAB+的语音信号分析与处理的课程设计
目
录
1.课程设计目的………………………………………………………………(1)
2.课程设计基本要求……………………………………………...………….(1)
3.课程设计内容………………………………………..……………………..(2)
4.课程设计实现……………………………………………………..…..……………(3)
(1)语音信号的采集……………………………………………………..(5)
(2)语音信号的频谱分析………………………………………………..(6)
(3)设计滤波器和画出频率响应………………………………………..(6)
(4)用滤波器对信号进行滤波…………………………………………..(9)
(5)比较滤波前后语音信号的波形及其频谱…………………………..(9)
(6)回放语音信号………………………………………………………..(11)
(7)设计系统界面………………………………………………………..(13)
5、心得体会……………………………………………..……………………..(14)
6、参考文献…………………………………….……………………………..(14)
第四篇:语音信号处理与识别
信号系统课程设计报告
欧阳光亮
2012029020025
语音信号处理与识别
目的:理解时域和频域尺度变换基本概念,掌握信号时频域分析方法,正确理解采样定理,准确理解滤波器的概念。内容:
(1)使用Matlab中wavrecord命令录制一段3秒的语音信号,使用wavplay命令播放,录制命令和播放命令中的采样频率设置成相同和不同两种情况,对观察到的现象进行分析并结合课本中的知识对该现象进行解释;(2)使用不同的采样频率录制一段3秒的语音信号,画出信号的时域波形和频谱;找到语音信号的主要频谱成分所在的带宽;观察并分析不同采样频率对波形和频谱的影响;寻找声音信号不出现明显失真的最低采样频率;(3)录制一段男生的语音信号和一段女生的语音信号,对两段音频信号进行混合,设计滤波器将混合的语音信号分开成单独的男声和女声信号,如果分离效果不好,对原因进行解释。
Matlab命令:wavrecord, wavplay, wavwrite, wavread, save, load, fft, fftshift, filter, plot, subplot, figure.过程:(1)相同:
fs1=16000;
%取样频率 fs2=16000;
%播放频率 duration=5;
%录音时间
fprintf('Press any key to start %g seconds of recording...n',duration);
pause;
fprintf('Recording...n');
y=wavrecord(duration*fs1,fs1);
%duration*fs 是总的采样点数
fprintf('Finished recording.n');
fprintf('Press any key to play the recording...n');
pause;
wavplay(y,fs2);wavwrite(y,fs1,'E:matlabrecord3.wav
不同:
fs1=16000;
%取样频率 fs2=8000;
%播放频率 duration=5;
%录音时间
fprintf('Press any key to start %g seconds of recording...n',duration);
pause;
fprintf('Recording...n');
y=wavrecord(duration*fs1,fs1);
%duration*fs 是总的采样点数
fprintf('Finished recording.n');
fprintf('Press any key to play the recording...n');
pause;
wavplay(y,fs2);wavwrite(y,fs1,'E:matlabrecord3.wav');现象:第二次播放时,声音明显失真。
理由:采样频率和播放频率不一样时声音信号会失真。(2)
fs1=16000;
%取样频率 fs2=16000;
%播放频率 duration=5;
%录音时间
fprintf('Press any key to start %g seconds of recording...n',duration);
pause;
fprintf('Recording...n');
y=wavrecord(duration*fs1,fs1);
%duration*fs 是总的采样点数
fprintf('Finished recording.n');
fprintf('Press any key to play the recording...n');
pause;
wavplay(y,fs2);wavwrite(y,fs1,'E:matlabrecord3.wav');
wav=wavread('E:matlabrecord3.wav');Fs=16000;n=length(wav);f=(0:n-1)*16000/n;mag=abs(fft(wav));subplot(2,1,1);plot(wav);subplot(2,1,2);plot(f,mag)
采样频率为1600010.5y/幅度0-0.5-101234x/t采样频率为16000567x 1084600500400y/幅度***400060008000x/f***16000
fs1=8000;
%取样频率 fs2=8000;
%播放频率 duration=5;
%录音时间
fprintf('Press any key to start %g seconds of recording...n',duration);
pause;
fprintf('Recording...n');
y=wavrecord(duration*fs1,fs1);
%duration*fs 是总的采样点数
fprintf('Finished recording.n');
fprintf('Press any key to play the recording...n');
pause;wavplay(y,fs2);wavwrite(y,fs1,'E:matlabrecord3.wav');
wav=wavread('E:matlabrecord3.wav');Fs=8000;n=length(wav);f=(0:n-1)*16000/n;mag=abs(fft(wav));subplot(2,1,1);plot(wav);subplot(2,1,2);plot(f,mag)wavplay(wav,8000)
采样频率为8000hz1 0.5y/幅度0-0.5-1 00.511.52x/s采样频率为8000hz2.533.5x ***0500y/幅度***00x/hz***16000
由图可知:语音信号的主要频谱成分所在的带宽为(0—1200hz),带宽为1200hz。
当采样频率较小时,频谱图上显示带宽较大,波形较稀松。
最低采样频率应为,声音信号的最高频率的两倍,由图可知为2400hz。(3)女声:
wav1=wavread('E:matlabrecord1.wav');wav2=wavread('E:matlabrecord2.wav');wav=wav1+wav2;fp1=800;fp2=1500;fp=[fp1,fp2];fr1=650;fr2=1900;fr=[fr1,fr2];Fs=16000;ap=1;as=40;[n,fn]= buttord(fp/(Fs/2),fr/(Fs/2),ap,as,'z');[b,a]=butter(n,fn);Y1=filter(b,a,wav);Y=fft(Y1);mag=abs(Y);n=length(wav);f=(0:n-1)*16000/n;subplot(3,1,1);mag1=abs(fft(wav));plot(f,mag1)subplot(3,1,2);plot(f,mag);subplot(3,1,3);plot(Y1);wavplay(Y1,16000)
混合400300y/幅度***060008000x/频率女声***16000400300y/幅度 2001000 ***00f/hz***160000.20.1y/幅度0-0.1-0.201234x/t567x 1084
男声:
wav1=wavread('E:matlabrecord1.wav');wav2=wavread('E:matlabrecord2.wav');wav=wav1+wav2;fp1=200;fp2=600;fp=[fp1,fp2];fr1=100;fr2=1000;fr=[fr1,fr2];Fs=16000;ap=3;as=40;[n,fn]= buttord(fp/(Fs/2),fr/(Fs/2),ap,as,'z');[b,a]=butter(n,fn);Y1=filter(b,a,wav);Y=fft(Y1);mag=abs(Y);n=length(wav);f=(0:n-1)*16000/n;subplot(3,1,1);mag1=abs(fft(wav));plot(f,mag1)subplot(3,1,2);plot(f,mag);subplot(3,1,3);plot(Y1);wavplay(Y1,16000)
混合频谱图200150y/幅度***30004000x/hz男声频谱图***040y/幅度***8000x/hz男声时域图***160000.040.02y/幅度0-0.02-0.0401234x/s567x 1084
分离效果不佳,原因:男女声频率有很多重叠的地方。
第五篇:DSP语音信号处理
摘
要
语音信号处理是研究数字信号处理技术和语音信号进行处理的一门学科,是一门新型的学科,是在多门学科基础上发展起来的综合性技术,它涉及到数字信号处理、模式识别、语言学。语音信号处理是研究用数字信号处理技术对语音信号处理的一门学科。处理的目的是要得到一些语音参数以便高效的传输或存储;或者是通过处理的某种运算以达到某种用途的要求。语音信号处理又是一门边缘学科。如上所诉,它是“语言语音学”与“数字信号处理”两个学科相结合的产物。
语音信号处理属于信息科学的一个重要分支,大规模集成技术的高度发展和计算机技术的飞速前进,推动了这一技术的发展。在数字音频技术和多媒体技术迅速发展的今天,传统的磁带语音录放系统因体积大、使用不便、放音不清晰而受到了巨大挑战。本次课程设计提出的体积小巧,功耗低的数字化语音存储与回放系统,可以有效的解决传统的语音录放系统在电子与信息处理的使用中受到的限制。
本文提出了语音信号处理课程建设的实验环节中的一些考虑,作为专业课程的学习,实验内容不能仅仅停留在验证性实验上,还应增加实验延伸的设计要求,是学生加深对理论分析认识的同时,强调培养学生的实际动手能力和知识综合运用能力。从而提高语音信号的教学和实验的质量。实验内容采用MATLAB编程实现,不仅易于语音信号处理的实现,更易引导学生完成实验延伸的设计。
第一章 绪论
1.1选题背景
在我们的现实生活中从磁带、录像带到CD、VCD、DVD;从黑白电视机、彩色电视机、高清晰度电视机到具有数字信号处理功能的电视机;从留声机、录音机到语音信箱;现在正出在模拟信息到数字信息的变革之中,传统的磁带语音录放系统因其体积大,使用不便,在电子与信息处理的使用中受到许多限制。
虽然,目前广播电视系统尚未实现真正的数字化,相信在不久的将来,真正的数字电视、数字收音机、数字收录机将进入家庭。所以,研究音频信号的数字化存储、处理和回放系统有着很重要的现实意义。
通过设计语音信号实验箱可以对语音信号实现各种形式的变换,因此学会对语音信号的处理,也可自行研究将此语音处理技术应用到现实生活中。
1.2课题意义
语音信号处理的一门比较实用的电子工程的专业课程,语音是人类获取信息的重要来源和利用信息的重要手段,通过语言相互传递信息是人类最重要的基本功能之一,语音是人类特有的功能,它是创造和记载几千年来人类文明史的根本手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。
语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域刚也涉及面很广的交叉学科。
第二章 课程设计要求及系统原理
2.1 课程设计基本要求
(1)学会MATLAB的使用,掌握MATLAB的程序设计方法;
(2)掌握在windows环境下语音信号的采集方法;
(3)掌握数字信号处理的基本概念,基本理论和基本方法;
(4)掌握MATLAB设计方法;
(5)学会用MATLAB对信号进行分析和处理。
2.2 系统基本原理
语音采集原理是,人耳能听到的声音是一种范围为20Hz—20kHz,而一般语音频率最高为3.4kHz。语音的采集是指语音声波信号经麦克风和高频放大器转换成有一定幅度的模拟量电信号,然后再转换成数字量的全过程。
本次设计的基本原理是对语音的录音和放音进行数字化控制。其中,关键技术在于:为了增加语音存储时间,提高存储器的利用率,采用了非失真压缩算法对语音信号进行压缩后再存储,而在回放时再进行解压缩;同时,对输入语音信号进行数字滤波以抑制杂音和干扰,从而确保了语音回放的可靠质量。
通过设计一个GUI实验箱,并添加相应的控制控件,添加一个声音文件,通过MATLAB编程,使其通过各种按钮实现语音信号处理的各种功能,最后做成一个完整的语音信号处理实验箱。
第三章 设计方案论证
3.1 设计理论依据
3.1.1采样定理:
在进行模拟/数字信号的转换过程中,当采样频率fs.max大于信号中最高频率fmax的2倍时,则采样之后的数字信号完整的保留了原始信号中的信号,一般实际应用中保证采样频率为信号最高频率的5—10倍;采样定理又称奈奎斯特定理。
3.1.2采样频率:
采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调、衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也就越精确,采样频率与声音频率之间有一定的关系,根据奈奎斯特理论,只有采样频率高于声音信号最高频率的2倍的时候,才能把数字信号表示的声音还原成为原来的声音,这就是说采样频率是衡量声卡采集、记录和还原声音文件的质量标准。
3.1.3采样位数与采样频率
采样位数即采样值或取样值,用来衡量声音波动变化的参数,是指声卡在采集和播放声音文件时候使用数字声音信号的二进制为数。采样频率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。
采样位数和采样频率对于音频接口来说是最为重要的两个基本指标,也是选择音频接口的两个重要标准。无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。每增加一个采样位数相当于力度范围增加了6dB。采样位数越多则捕捉到的信号越精确。对于采样率来说你可以想象它类似于一个照相机。显然采样率越高,计算机提取的声音越多,对于原始的还原也越加精确。
第四章 图形用户界面设计
4.1 图形用户界面概念
图形用户界面或图形用户接口是指采用图形方式显示的计算机操作环境由用户接口。与早期计算机使用的命令行界面相比,图形界面对于用户来说更为简便易用。
GUI是MATLAB提供的图形用户界面开发环境,提供了一系列用于创建图形用户界面的工具,从而简化界面布局和编程工作。
4.2用户界面设计
4.2.1 GUI设计模板
在MATLAB主窗口中,选择File菜单中的New菜单项,再选择其中的GUI命令,就会显示图形用户界面的设计模板。
MATLAB为GUI设计一共准备了四个模板,分别是Blank GUI、GUI with Uicontrols、GUI with Axes and Menu、Modal Question Dialog。
当用户选择不同的模板时,在GUI设计模板界面的右边就会显示出与该模板对应的GUI图形。
4.2.2 GUI设计窗口
在GUI设计模板中选中一个模板,然后单击OK按钮,就会显示GUI设计窗口,选择不同的GUI设计模式时,在GUI设计窗口中显示的结果是不一样的。
GUI设计窗口由菜单栏、工具栏、空间工具栏以及图形对象设计区等部分组成。GUI设计窗口的菜单栏有File、Edit、View、Layout、Tools和Help六个菜单项,使用其中的命令可以完成图形用户界面的设计操作。
4.2.3 GUI设计窗口的基本操作
(1)前面板的设计:在GUI设计窗口创建图形对象后,通过双击该对象,就会显示该对象的属性编辑器。如下图所示。例如,创建一个Push Button对象,并设计该对象的属性值。
图4-1 按钮属性编辑器
通过以上的按钮属性编辑器可以根据个人情况对按钮的名称、颜色、大小等方面的属性进行修改,使按钮在视觉上变的更加完美。
(2)按钮功能的实现:在GUI设计窗口创建按钮后,通过右键单击按钮,选择View callbacks下的callback对相应的按钮进行编程,使按钮实现相应的功能,如下图所示对按钮的响应功能进行设置。
图4-2 按钮功能编辑器
进入到按钮程序编辑窗口,通过编程即可实现按钮的相应功能,如下图:
图4-3 按钮的编程实现界面
通过对各个按钮控件的修改,和对m文件程序的添加就完成对GUI窗口的设计,最后得到的图形化操作界面如下图所示:
图4-4 图形化操作界面
4.2.4 语音的录入与打开
在MATLAB中,[y,fa,bits]=wavread(‘Blip’,[N1 N2]);用于读取语音,7
采样值放在向y中,fs表示采样频率,bits表示采样位数。[N1 N2]表示读取从N1点到N2点的值。
Suond(x,fs,bits);用于对声音的回放,向量y则就代表了一个信号也就是说可以像处理一个信号表达式一样处理这个声音信号。
第五章 课程设计的软件实现
5.1 部分函数语法格式
读wav文件: x=wavread(‘filename’)数组a及b中元素相乘: a.*b 创建图形窗口命令: figure 绘图函数: plot(x)坐标轴: axis([xmin xmax ymin ymax])坐标轴注解: xlabel(‘„’)ylabel(‘„’)图例注解: legend(‘„’)一阶高通滤波器: y=filter([1-0.09375],1,x)分帧函数: f=enframe(x,len,inc)x为输入语音信号,len指定了帧长,inc指定帧移,函数返回为nXlen的一个矩阵,每一行都是一帧数据。
5.2语音信号处理的相关函数
5.2.1语音信号的短时谱:
周期性声门波可表示为:
(5-1)其中,g[n]是声门波的单周期的波形,p[n]是间隔为P的周期采样序列。当u[n]通过线性非时变声道,且该声道的单位冲击响应为h[n]时,声道输出为:
(5-2)为了观察一段语音,需要降生到输出乘以一个一时刻τ 为中心的窗函数 w[n,τ] ,即得到:
(5-3)
这段语音信号的频域表达式为:
(5-4)
即语音信号的谱包络为
语谱图就是现实时变频谱幅度特征的图形表达式为:
(5-5)
将语音信号短时谱程序写入到MATLAB中得到单色语谱图的波形如下:
图5-1 语音信号单色语谱图
5.2.2 自相关方法估计语音信号的声道参数:
由均方预测误差最小的得到正则方程:
(5-6)
其中,(5-7)
在最佳解时的误差为
(5-8)
在自相关法中式5-6,式5-8变为
(5-9)
(5-10)由式5-9和式5-10可列出方程组式5-11
(5-11)
解方程组式5-9求出线性预测系数,通过误差式5-11可求出增益G
(5-12)
加窗后信号频谱图如下:
图5-2 加窗后信号频谱图
通过以上的方法,改变参数分别求得4极点模型频率响应和6极点模型频率响应,6极点波形如下图所示:
图5-3 六极点波形图
最后通过以上方法用一个函数分别实现以上三个功能,三个波形显示在一个界面,通过观察图形,查看它们之间的分别。三者比较所得到的波形如下:
图5-4 三者比较波形图
5.2.3 基音周期检测
数据为浊音语音信号speech1_10k(10000样点/秒)用25ms的汉明窗对语音信号speech1_10k进行加窗处理,并画出所得到的加窗信号的自相关函数,再用根据中心消波法及三电平中心消波法原理改进程序,最后对比中方法基音检测的效果并分析结果。
实验原理及方法
(1)自相关检测原理:对于离散的数字语音信号序列x(n),如果周期N,则自相关函数也是同周期的周期函数。即:x(n)=x(n+N)。清音信号没有周期性,他的自相关函数也没有周期。浊音新海具有准周期性。自相关基音检测正是利用这一性质对语音信号进行基音检测的。
(2)中心消波法检测原理:中心消波处理是使用如下图所示的中心消波函数进行处理的:
图5-5 中心消波检测图
(3)三电平消波法原理:为了减少自相关计算中的乘法运算,可以把上述中心消波以后的信号y(n)的自相关用两个信号的互相关代替,其中一个信号是y(n)另一个信号是对y(n)进行三电平量化产生的结果。且这个信号有三种可能的取值,因而这里的互相关计算只需要做加减法,而这个互相关序列的周期性与y(n)的自相关序列是近似相同的。
三电平法对语音信号处理得到的波形如下:
图5-6 三电平法波形图
中心消波法得到的波形如下图:
图5-7 中心消波法波形图
5.3 GUI实验箱操作界面设计
通过对各个控件的编程和对参数的设计,最后得到的GUI实验箱操作界
面如下图所示,通过界面上的各个按钮即可实现相应的功能。
图5-8 GUI实验箱操作界面
第六章 心得体会
通过本次课程设计完成了对语音信号的读取与打开,与课题的要求十分相符;初略的完成了界面的设计,但也存在相当的不足,达到了打开语音文件,显示已定波形。语音信号处理时语音学与数字信号处理技术相结合的交叉学科,将语音当做一种特殊的信号,即一种“复杂向量”来看待。也就是说,体现了数字信号处理技术。
本次课程设计时希望将数字信号处理技术应用与某一实际领域,这里就是指对语音的处理。作为存储与计算机中的语音信号,其本身就是离散化了的向量,我们只需要将这些离散的量提取出来美酒可以对其进行处理了。
本次课设,用到了处理数字信号的强有力工具MATLAB,通过MATLAB李的几个命令函数的调用,很轻易的在实际化语音与数字信号的理论之间搭了一座桥。
最后,还利用了MATLAB的另一强大功能——GUI界面设计。设计出了一个建议的用户应用界面,可以让人实现界面操作。
通过本次课程设计让我更加了解了语音信号处理在现实中的强大的应用空间,同时查阅了很多相关的资料,应用MTALAB软件来完成,熟练掌握了MATLAB软件,本次课程设计要求用GUI设计模块,查阅了很多资料,更加深刻的陆奥了了这方面知识。
本次课程设计,我明白了理论的学习需要在实践中才能得到巩固。在课程设计中,只有动手慢慢研究,才能真正了解MATLAB软件平台中可以直接设计数字滤波器的各个函数的调用,对设计GUI实验箱的所有函数的运用有了比较好的认识。
通过这个课程设计,我学到了很多MATLAB和语音信号的知识,提高了自己在语音信号设计方面的知识能力,动手能力和思维能力都得到了一定的提升,希望自己以后可以更多的继续学习这一门课程设计方面的知识。
附 录
1.源程序代码:
参考文献
[1] 刘庆华 陈紫强《基于MATLAB和DSP的语音信号处理课程的建设》 电气电子教学学报 2006 10(3):124-128 [2] 张力 《MATLAB在语音信号处理辅助教学中的应用》 电气电子教学学报 2005 27卷2期:96-99 [3] 邓立新 杨震《信息技术融入“语音信号处理”课程的教学实践》电气电子教学学报 2005 27卷5期:13-16 [4] 胡航,《语音信号处理》 哈尔滨工业大学出版社 2005年2月,第二版:135-137 [5] 张平,《MATLAB基础与应用》 北京航空航天大学出版社 2007,第二版:85-92 [6] 谢德芳 《数字信号处理》 北京科学出版社 2005,第一版
[7] 张雄伟 《现代语音处理技术及应用》 机械工业出版社 2006,第二版 [8] 吴家安 《语音编码技术及应用》 机械工业出版社 2006 第一版 [9] 刘幺和 宋庭新 《语音识别与控制应用技术》 科学出版社 2008 第二版
[10] 李昌立 吴善培 《数字语音编码实用教程》 人民邮电出版社 2004 第一版
[11] 姚天仁 《数字语音处理》 华中科技大学出版社 1992 第二版 [12] 朱敏雄 《计算机语音技术(修订版)》 北京航空航天大学出版社 2002 第一版
[13] 王炳锡 《语音编码》 西安电子科技大学出版社 2002 第一版