第一篇:视频会议中的各种音频技术
视频系统术语---音频技术
音频技术
视频通讯过程是视频和音频的实时双向完整通讯过程。在这个过程中我们为了获得高清晰视频图像,有时却忽略了另外一个重要的过程——音频通讯过程。如果我们在观看高清晰视频图像的时候,不能得到一个更清晰、连续的音频效果。那么这个过程实际上就没有任何意义,所以其重要性甚至超过视频。在传统的视频会议系统中音频技术发展极其缓慢,原因在于目前应用于视频通讯的音频编解码压缩标准都是为了保持传输时的低带宽占用和较高的编解码效率,从而将音频信号的采样频率、采样精度和采样范围指标做了极大的降低,使得所能提供的音频清晰度和还原性都有很大程度上的衰减。与用于存储和回放非实时压缩协议的标准(如OGG、MP3等)相比,音频的保真度非常低。这样就在某种程度上对现场声音的还原达不到要求。目前传统视频通讯过程中主要采用的是G.711、G.722、G.721、G.728等音频标准,音频宽度仅有50Hz-7KHz单声道,而人耳所能感知的自然界的频响能力可以达到20Hz-20KHz,因此,在对现场环境音的还原过程中过多的音频信息的丢失造成了无法真实表现现场情况。所以在高清晰视频通讯过程中我们势必要有一种相辅助的音频处理方式解决此问题。使整个高清晰通讯过程更去近于完美。
目前国际上对音频处理技术上标准较多,在对下一代实时交互音频处理上可以采用MPEG-1 Layer 2或AAC系列音频,对选用标准的原则是,音频频响范围要达到22KHz,这样就几乎可以覆盖了人耳听觉的全部范围,甚至在高频方面还有所超越,能够使现场音频得到真实自然的还原,并且在还原时可以采用双声道立体声回放,使整个视频通讯的声音有更强的临近感,达到CD级音质。同时在对链路带宽的适应和编解码效率上达到最佳。下面是各种音频编码标准的说明:
1G.711
类型:Audio
制定者:ITU-T
所需频宽:64Kbps
特性:算法复杂度小,音质一般
优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)缺点:占用的带宽较高
备注:70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。
2G.721
制定者:ITU-T
所需带宽:32Kbps
音频频宽:3.4KHZ
特性:相对于PCMA和PCMU,其压缩比较高,可以提供2:1的压缩比。
优点:压缩比大
缺点:声音质量一般
备注:子带ADPCM(SB-ADPCM)技术。G.721标准是一个代码转换系统。它使用ADPCM转换技术,实现64 kb/s A律或μ律PCM速率和32 kb/s速率之间的相互转换。
3G.722
制定者:ITU-T
所需带宽:64Kbps
音频宽度:7KHZ
特性:G722能提供高保真的语音质量
优点:音质好
缺点:带宽要求高
备注:子带ADPCM(SB-ADPCM)技术
4G.721
制定者:ITU-T
所需带宽:32Kbps/24Kbps
音频宽度:7KHZ
特性:可实现比G.722 编解码器更低的比特率以及更大的压缩。目标是以大约一半的比特率实现G.722 大致相当的质量。
优点:音质好
缺点:带宽要求高
备注:目前大多用于电视会议系统。
5G.721附录C
制定者:ITU-T
所需带宽:48Kbps/32Kbps/4Kbps
音频宽度:14KHZ
特性:采用自Polycom 的Siren™14 专利算法,与早先的宽频带音频技术相比具有突破性的优势,提供了低时延的14 kHz 超宽频带音频,而码率不到MPEG4 AAC-LD 替代编解码器的一半,同时要求的运算能力仅为十分之一到二十分之一,这样就留出了更多的处理器周期来提高视频质量或者运行因特网应用程序,并且移动设备上的电池续航时间也可延长。
优点:音质更为清晰,几乎可与CD 音质媲美,在视频会议等应用中可以降低听者的疲劳程度。缺点:是Polycom的专利技术。
备注:目前大多用于电视会议系统
6G.723(低码率语音编码算法)
制定者:ITU-T
所需带宽:5.3Kbps/6.3Kbps
音频宽度:3.4KHZ
特性:语音质量接近良,带宽要求低,高效实现,便于多路扩展,可利用C5402片内16kRAM实现53coder。达到ITU-TG723要求的语音质量,性能稳定。可用于IP电话语音信源编码或高效语音压缩存储。优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定。
缺点:声音质量一般
备注:G.723语音编码器是一种用于多媒体通信,编码速率为5.3kbits/s和6.3kbit/s的双码率编码方案。G.723标准是国际电信联盟(ITU)制定的多媒体通信标准中的一个组成部分,可以应用于IP电话等系统中。其中,5.3kbits/s码率编码器采用多脉冲最大似然量化技术(MP-MLQ),6.3kbits/s码率编码器采用代数码激励线性预测技术。
7G.723.1(双速率语音编码算法)
制定者:ITU-T
所需带宽:5.3Kbps(29)
音频宽度:3.4KHZ
特性:能够对音乐和其他音频信号进行压缩和解压缩,但它对语音信号来说是最优的。G.723.1采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外,这种技术使发信机的调制解调器保持连续工作,并且避免了载波信号的时通时断。
优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定,避免了载波信号的时通时断。缺点:语音质量一般
备注:G.723.1算法是ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法,其目标应用系统包括H.323、H.324等多媒体通信系统。目前该算法已成为IP电话系统中的必选算法之一。
8G.728
制定者:ITU-T
所需带宽:16Kbps/8Kbps
音频宽度:3.4KHZ
特性:用于IP电话、卫星通信、语音存储等多个领域。G.728是一种低时延编码器,但它比其它的编码器都复杂,这是因为在编码器中必须重复做50阶LPC分析。G.728还采用了自适应后置滤波器来提高其性能。优点:后向自适应,采用自适应后置滤波器来提高其性能
缺点:比其它的编码器都复杂
备注:G.728 16kb/s短延时码本激励线性预测编码(LD-CELP)。1996年ITU公布了G.728 8kb/s的CS-ACELP算法,可以用于IP电话、卫星通信、语音存储等多个领域。16 kbps G.728低时延码激励线性预测。G.728是低比特线性预测合成分析编码器(G.729和G.723.1)和后向ADPCM编码器的混合体。G.728是LD-CELP编码器,它一次只处理5个样点。对于低速率(56~128 kbps)的综合业务数字网(ISDN)可视电话,G.728是一种建议采用的语音编码器。由于其后向自适应特性,因此G.728是一种低时延编码器,但它比其它的编码器都复杂,这是因为在编码器中必须重复做50阶LPC分析。G.728还采用了自适应后置滤波器来提高其性能。
9G.729
制定者:ITU-T
所需带宽:8Kbps
音频宽度:3.4KHZ
特性:在良好的信道条件下要达到长话质量,在有随机比特误码、发生帧丢失和多次转接等情况下要有很好的稳健性等。这种语音压缩算法可以应用在很广泛的领域中,包括IP电话、无线通信、数字卫星系统和数字专用线路。
G.729算法采用“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)算法。这种算法综合了波形编码和参数编码的优点,以自适应预测编码技术为基础,采用了矢量量化、合成分析和感觉加权等技术。
G.729编码器是为低时延应用设计的,它的帧长只有10ms,处理时延也是10ms,再加上5ms的前视,这就使得G.729产生的点到点的时延为25ms,比特率为8 kbps。
优点:语音质量良,应用领域很广泛,采用了矢量量化、合成分析和感觉加权,提供了对帧丢失和分组丢失的隐藏处理机制。
缺点:在处理随机比特错误方面性能不好。
备注:国际电信联盟(ITU-T)于1995年11月正式通过了G.729。ITU-T建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP),它是当前较新的一种语音压缩标准。G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。
10G.729A
制定者:ITU-T
所需带宽:8Kbps(34.4)
音频宽度:3.4KHZ
特性:复杂性较G.729低,性能较G.729差。
优点:语音质量良,降低了计算的复杂度以便于实时实现,提供了对帧丢失和分组丢失的隐藏处理机制 缺点:性能较G.729差
备注:96年ITU-T又制定了G.729的简化方案G.729A,主要降低了计算的复杂度以便于实时实现,因此目前使用的都是G.729A。MPEG-1 audio layer 1
制定者:MPEG
所需带宽:384kbps(压缩4倍)
音频宽度:
特性:编码简单,用于数字盒式录音磁带,2声道,VCD中使用的音频压缩方案就是MPEG-1层Ⅰ。
优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。可以达到“完全透明”的声音质量(EBU音质标准)
缺点:频宽要求较高
备注:MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:--层1(Layer 1):编码简单,用于数字盒式录音磁带
--层2(Layer 2):算法复杂度中等,用于数字音频广播(DAB)和VCD等
--层3(Layer 3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍
12MPEG-1 audio layer 2,即MP2
制定者:MPEG
所需带宽:256~192kbps(压缩6~8倍)
音频宽度:
特性:算法复杂度中等,用于数字音频广播(DAB)和VCD等,2声道,而MUSICAM由于其适当的复杂程度和优秀的声音质量,在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用。优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。可以达到“完全透明”的声音质量(EBU音质标准)
缺点:
备注:同MPEG-1 audio layer 1
13MPEG-1 audio layer 3(MP3)
制定者:MPEG
所需带宽:128~112kbps(压缩10~12倍)
音频宽度:
特性:编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍,2声道。MP3是在综合MUSICAM和ASPEC的优点的基础上提出的混合压缩技术,在当时的技术条件下,MP3的复杂度显得相对较高,编码不利于实时,但由于MP3在低码率条件下高水准的声音质量,使得它成为软解压及网络广播的宠儿。
优点:压缩比高,适合用于互联网上的传播
缺点:MP3在128KBitrate及以下时,会出现明显的高频丢失
备注:同MPEG-1 audio layer 1
14MPEG-2 audio layer
制定者:MPEG
所需带宽:与MPEG-1层1,层2,层3相同
音频宽度:
特性:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1, 层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。
优点:支持5.1声道和7.1声道的环绕立体声
缺点:
备注:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1, 层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。
15AAC-LD(dvanced Audio Coding,先进音频编码)
制定者:MPEG
所需带宽:48-64 kbps
音频宽度:22KHZ
特性:提供高质量的低延时的音频编码标准,以其20ms的算法延时提供更高的比特率和各种声音信号的高质量音频。
缺点:
备注:超宽带编解码器技术支持高达48KHz采样率的语音传输,与传统的窄带与宽带语音编解码器相比大幅提高了音质。该技术可提供接近CD音质的音频,数据速率高达48–64kbps,不仅提高了IP语音与视频应用的清晰度,而且支持电话音乐传输功能。高清语音通道支持更高的采样率,配合音频编解码器的高保真音效,显著丰富并扩展了频谱两端的音质范围,有效改善了语音回响性能,提高了清晰度。
第二篇:“教学用音频处理技术”学习心得
“教学用音频处理技术”学习心得
不知不觉 “教学用音频处理技术”已经学完了,对于这门课程,我学到的东西还是蛮多的。从最初的一无所知,到现在的初见成效,其间付出了时间和心血,也从中感受到无穷的乐趣。
大学里接触过“教学用音频处理技术”,但现在已经毕业这么久,该会的知识也忘记的差不多了。现在再次学习这么课程,觉得无比的亲切,虽然作业完成的不是很好。通过学习,我对“教学用音频处理技术”有了进一步的认识,知道了好多以前根本没有接触过的东西。就像一笼中之鸟见到了蔚蓝的天空,小河里的一条小鱼见到了大海。一点也不夸张,这只是心里的一些想法。
我们的作业,其实就是一次艺术创作的过程,从构思、选材到制作完成需要花费时间和精力,而每天的上网时间是有限的,因为我的课程比较多,所以只好下班后再进行学习。听自己做的“声音”我被感动了,很有成就感和自豪感。我并不是为自己骄傲,而是自己有了进步,我知道,“教学用音频处理技术”的知识是渊博的,我只是学了皮毛。
学习的过程就是一个提高的过程,只有不段地学习、不断地总结,才能不断地提高。
第三篇:华望视频会议技术介绍
视频会议技术介绍
视频会议是利用通信网络,传输多个与会者连续活动图像和声音的一种通信业务。在通信网络高速发展的今天,视频会议得到了越来越多的应用。究其原因不仅在于它的互动、实时等先进功能,而且能够节约传统会议的经费和时间。尤其在一些紧急情况下,视频会议更是能起到重要作用。
现在国内市场上的视频会议品牌众多,采用的技术也千差万别。但究其实质,视频会议最核心的技术指标还是编码标准、体系结构、流媒体服务。这里不妨做一个简单介绍。
一、编码标准
和一般的数据业务不同,视频是流特性业务,数据量很大。例如,目前的PAL制广播电视信号,在分辨率为720×576、帧率为25帧每秒的情况下,未经压缩的码率为165.888Mbps。这种码率的视频在网络上是无法传输的,会轻易地将网络资源吞没,造成网络拥塞甚至崩溃。因此,视频通信的第一步就是视频压缩。目前在众多的视频编码算法中,被广泛使用在视频会议系统中的压缩标准是H.26x和MPEG。
H.26x是国际电信联盟制定的标准,主要包括H.261和H.263。H.261也称为(P×64Kbit/s)标准(P=1,2,3„30),在P<6的情况下,只能传输QCIF格式的图像(176×144);在P=6~30时,也仅能传输CIF格式的图像(352×288)。它的视频效果较差,只适合低速率下相对静止图像传输。1996年ITU-T在H.261的基础上进行一定的改进推出了H.263标准,但它仍然不能实现高清晰度图像的传输,只适合低带宽下的应用。
MPEG本是Moving Pictures Experts Group,即“运动图像专家组”的英文缩写,这个专家组是由国际标准化组织ISO和国际电子委员会IEC于1988年联合成立的,致力于运动图像及其伴音编码的标准化工作,MPEG制定的标准主要有MPEG-
1、MPEG-2和MPEG-4。
MPEG-1制定于1992年,它主要是在1.5Mbps情况下,对352×288×25帧/秒的运动图像进行处理。它的算法框图基本与H.261相同,但在时间域正负方向进行的运动补偿的帧间内插使其具有以下优点:①具有更高的图像压缩倍数;②能够恰当地对待突发背景;③能较好地保存边缘轮廓,降低原始图像的噪声。但正由于它的双向帧间预测使得图像显示顺序与编码顺序不同,造成较大的系统延时,且压缩比越高,延时也会越大。
MPEG-2制定于1994年,主要应用在广播电视图像的传输和数字存贮媒体(DVD)。与MPEG-1的区别在于MPEG-2有了等级之分,共分为4个等级LL(352×288×25帧/秒)、ML(720×576×25帧/秒)、H1440L(1440×1152×25帧/秒)、HL(1920×1152×25帧/秒)。它在带宽充足的情况下MPEG-2可实现高清晰度图像的传输,甚至能满足HDTV的要求。但它和MPEG-1具有同样的缺点,即延时较大、带宽要求相对较高。在广播电视系统中,由于不要求交互且能提供足够的带宽(广播电视系统可为每路图像信号提供8M带宽),这些缺点体现不明显。但当它应用到视频会议系统中时,要达到ML(720×576×25帧/秒),需要3M以上的带宽,且会有1s以上的延时,不能完全适应当前视频会议系统的需求。
为了解决时延与压缩比的问题,ISO于1999年通过了MPEG-4标准,它与其它标准的最大区别在于MPEG-4是基于内容进行编码,将编码对象由原来的矩形图像改为单独的对象,即将每幅图像分为不同的自然对象单独进行编码。由于这种合成对象/自然对象混合编码SNHC可大大降低帧间图像的信息冗余,因此MPEG-4编码技术可利用最少的数据获得最佳的图像质量。在视频会议系统实际应用中,可在1.5Mbps情况下实现高清晰度图像(720×576×25帧/秒)的传输,同时将时延控制在300ms以内。另外,MPEG-4还把提高多媒体系统的交互性和灵活性作为一项重要的目标,因此它比其他编码方式更适合交互式的视频服务和远程监控。
二、体系结构
视频会议的体系结构有两种:ITU-T H.320和H.323。
H.320是一个传统的电视会议标准,在过去几年被广泛使用在ISDN网络中。它的网络结构主要是H.243标准下的主从星形汇接结构,每个终端必须与它对应的MCU建立电路连接,组网结构非常固定。由于基于电路交换,它能提供确定的带宽保证,充分保证视频会议的质量。
H.323的标准名称是基于包的多媒体通信系统,它凭借TCP/IP这一协议,使网络上的多媒体应用和业务与基础传输网络无关。视频会议也只是这一标准的应用之一,因此可以利用H.323将多种应用和业务(如视频点播、流媒体组播等)叠加到视频会议系统中。也正因为H.323视频会议系统建立在基于分组交换、QoS得不到保证的通信网的基础上,因而会议系统中的码流必须打包成一个一个分组,根据分组标签统计复用。由于不同信息码各有特点,所以对下层网络的承载要求各不相同。例如视音频码流对实时性要求较高,但可以容忍少量的分组丢失,因而它要求下层网络能提供实时性好的传送机制;而对于数据和控制信息,情况完全不同,要求下层提供可靠性传送。
H.323最大的缺点在于它的网络环境是一个QoS得不到严格保证的通信网,因此H.323结构的视频会议系统使用RTCP(实时传输控制协议)来测量网络的QoS,并采用RSVP(资源预留协议)来确保网络中预留一定的带宽,对不同特点的应用提供特定的通道。
H.323作为下一代多媒体通信平台代表着未来多媒体会议的的发展方向和潮流,它的传输网络无关性、灵活性,使它越来越得到普遍地应用,但H.320凭借其在带宽保证方面的优势,仍是很多视频会议用户的最终选择。为了满足不同客户的需要,充分保证用户投资,现阶段的视频会议系统最好能够同时支持H.320和H.323。
三、流媒体服务
随着视频会议技术的不断发展,流媒体服务概念也被引入到其中。流媒体指的是在网络上使用流式传输技术的连续时基媒体,如视频会议系统中的实时视音频流,流媒体的数据流总是随时传送随时播放的。在视频会议系统中主要使用的流式传输技术是实时流式传输,它保证媒体信号带宽与网络连接的匹配,且总是实时传送特别适合视频会议,同时也支持随机访问。在视频会议系统中主要有以下三种流媒体播放方式得到充分应用:
1.单播
在终端与MCU之间建立一个单独的数据通道,从一台MCU发送的每个数据流只能传送给一台终端。这种方式对网络带宽要求较高,但非常灵活,适合召开双向交互式视频会议时使用。
2.组播
IP组播技术通过构建一个具有组播能力的网络,可以让MCU只发送一个数据流给多个终端共享。这种方式非常节约带宽,适合在一些需要单向收看视频会议的场合中应用。
3.点播
点播是指用户可以通过选择内容项目来初始化终端连接,对数据流可以开始、停止、后退、快进或暂停。它主要应用于会议录像的点播。
编码标准、体系结构、流媒体服务是视频会议众多技术中比较重要的三项指标,各种视频会议系统的区别也主要集中于此。至于视频会议配套的显示系统、扩声系统、控制系统等技术透明度高,应用普遍,各个厂家大同小异。所以在建设视频会议系统时结合自身组网情况,充分考虑编码标准、体系结构、流媒体服务三方面因素来选择最适合的产品是极有必要的。
信息来自:华望云视频会议
http://
第四篇:视频会议中礼仪的要求
视频会议中礼仪的要求中国自古以来就是礼仪之邦。国人办事对礼仪的要求很高,尤其是一些十分正式的场合,那么对于礼仪的要求就更加严格。会议,作为一种传统的集会方式,其对参与者的礼仪要求就很多,即使是视频会议,同样对参会者有些要求。据调查,多数参与过视频会议的受访者认为有必要设立视频会议的礼仪与规则,良好的视频会议礼仪准则,可以帮助人们在工作中更好地使用视频会议。
1、预留时间做一些会议前的准备,视频会议音视频调试、文档共享等;
2、会议主持人掌握发言顺序,发言人员合理控制时间;
3、与会人员不讲话时候,关闭麦克风;
4、与会人员衣着得体,尽量穿纯色衣服。
在进行视频会议时,受访者对以下行为最为不满,应予以避免:
进行会议时手机响起(58%)
与会者在不适当场所参与会议,例如公共交通工具或者商场内(52%)
与会者同时进行多项工作或看来不专心,例如正在打字(51%)
背景干扰,例如同事、音乐、噪音(50%)
…
第五篇:视频会议
XX委教育工委组织参加教育部召开的教育系统“在创先争优活动
中深入开展基层组织建设年活动”视频会议
2月24日,全国教育系统“在创先争优活动中深入开展基层组织建设年活动”视频会议在北京召开,会议交流了近期各地各学校开展创先争优活动典型经验和有益做法,安排部署了教育系统在创先争优活动深入开展基层组织建设年活动。
天津市委教育工委、北京师范大学、江苏扬州商务高级中学、云南昆明第三中学等单位负责人结合实际,交流了本单位在开展创先争优活动中加强基层党组织建设等方面的总体思路和主要经验。
教育系统创先争优活动领导小组组长,教育部党组书记、部长袁贵仁在会上作了重要讲话。他要求,在创先争优活动中开展基层组织建设年活动中要紧紧围绕“强组织、增活力,创先争优迎十八大”这个主题,按照抓落实、全覆盖、求实效、受欢迎” 四项要求,有计划有步骤地推进基层组织建设年各项工作。
袁贵仁进一步明确深入开展“基层组织建设年”活动的目标任务和方法步骤。他强调:在深入开展基层组织年中,要实现党支部战斗力进一步提升,党支部书记素质进一步提升,党员队伍生机活力进一步提升,基层保障水平进一步提升,基层党组织制度化水平进一步提升的“五个一目标。要通过调查摸底,分类定级,健全制度、理顺关系,对照整改、定位升级,学习先进、创先争优四个步骤推进活动开展。
袁贵仁强调,抓好这项活动的关键是选优训强一个好书记、研究谋划一个好思路、建立完善一套好制度、建设管理一个好阵地、健全落实一个好机制。同时,要落实工作责任,建立机关干部联系群发、服务群众制度,联述联评联考制度,加强组织领导,保障活动深入开展。
袁贵仁最后强调,各地教育部门和各地各类学校,要按照中央和教育系统的部署要求,迅速行动起来,全面推进基层党组织建设工作。
教育部会议结束后,省委教育工委副书记丛懋林同志就我省教育系统贯彻落实教育部的会议精神,如何抓好基层组织建设年活动进行了动员部署。
市委教育工委XX书记,各辖市、区、在X高校教育系统创先争优活动领导小组负责人及部分局属学校党组织负责人参加了会议。