第四章音频媒体及其应用.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第四章音频媒体及其应用.ppt》由会员分享,可在线阅读,更多相关《第四章音频媒体及其应用.ppt(78页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、浙江师范大学教育技术系第四章第四章 音频媒体及其应用音频媒体及其应用浙江师范大学教育技术系学习内容学习内容一、声音一、声音二、模拟音频与数字音频二、模拟音频与数字音频三、音频的采样、量化和数字化三、音频的采样、量化和数字化(重点)(重点)四、数字音频的格式四、数字音频的格式五、音频文件的读取五、音频文件的读取(重点)(重点)六、声音质量的度量六、声音质量的度量浙江师范大学教育技术系学习目标学习目标1 1、了解声音相关概念及、了解声音相关概念及要素要素2 2、掌握音频采样、量化和、掌握音频采样、量化和数字化数字化原理原理3 3、了解数字音频的文件格式、了解数字音频的文件格式 4 4、理解、理解W
2、AVWAV文件的文件的文件结构文件结构浙江师范大学教育技术系一、声音一、声音声音是通过空气传播的一种连续的波,叫声波。声音是通过空气传播的一种连续的波,叫声波。声音的强弱体现在声波压力的大小上声音的强弱体现在声波压力的大小上音调的高低体现在声音的频率上音调的高低体现在声音的频率上浙江师范大学教育技术系一、声音一、声音有关概念有关概念复合信号复合信号:声音信号由许多频率不同的信号组成:声音信号由许多频率不同的信号组成分量信号分量信号:单一频率的信号:单一频率的信号带宽带宽:描述组成复合信号的频率范围。如:描述组成复合信号的频率范围。如:高保真声音的频率范围为高保真声音的频率范围为10Hz20KH
3、z,它的带宽它的带宽约为约为20KHz。浙江师范大学教育技术系一、声音一、声音三要素三要素v音强音强(volume)v音调音调(pitch)v音色音色响度,由振幅决定响度,由振幅决定由频率决定由频率决定指声音频率组成成分指声音频率组成成分浙江师范大学教育技术系一、声音一、声音分类分类v次音频信号次音频信号20kHZ(人听不到人听不到,有很强的方向有很强的方向性性,可以形成波束可以形成波束)浙江师范大学教育技术系二、模拟音频与数字音频二、模拟音频与数字音频模拟信号模拟信号数字信号数字信号浙江师范大学教育技术系二、模拟音频与数字音频二、模拟音频与数字音频模拟模拟音频:在时间和幅度上都是音频:在时间
4、和幅度上都是连续连续变化的变化的数字数字音频:在时间和幅度上都是音频:在时间和幅度上都是离散、不连续离散、不连续的的浙江师范大学教育技术系三、音频的数字化三、音频的数字化模拟音频模拟音频数字音频数字音频采样、量化、编码采样、量化、编码浙江师范大学教育技术系数字化音频:信号变化过程图示数字化音频:信号变化过程图示模拟信号模拟信号采样信号采样信号数字信号数字信号211多媒体技术基础及应用浙江师范大学教育技术系数字化音频:离散时间信号图示数字化音频:离散时间信号图示212多媒体技术基础及应用浙江师范大学教育技术系数字化音频:离散幅度信号图示数字化音频:离散幅度信号图示213多媒体技术基础及应用浙江师
5、范大学教育技术系三、音频的数字化(采样)三、音频的数字化(采样)音频采样:音频采样:当把模拟声音变成数字声音时,需要每当把模拟声音变成数字声音时,需要每隔一个时间间隔在模拟声音波形上取一个幅度值。隔一个时间间隔在模拟声音波形上取一个幅度值。信号转换示意图信号转换示意图浙江师范大学教育技术系三、音频的数字化(采样)三、音频的数字化(采样)采样:采样:将将时间时间上连续的取值变为有限个离散取值的过程上连续的取值变为有限个离散取值的过程浙江师范大学教育技术系三、音频的数字化(采样)三、音频的数字化(采样)奈奎斯特采样定理:奈奎斯特采样定理:设连续信号设连续信号X(t)的最高频率分量为的最高频率分量为
6、Fm,以等间隔以等间隔Ts(Ts称称采样间隔,采样间隔,fs=1/Ts称为称为采样频率采样频率)对)对X(t)进行采进行采样,得到样,得到Xs(t)。如果如果Fs=2Fm,则,则Xs(t)保留了保留了X(t)的全部信息(从的全部信息(从Xs(t)可以可以不失真地恢复出不失真地恢复出X(t))。)。只要采样频率高于信号中最高频率的只要采样频率高于信号中最高频率的2倍,就可倍,就可以从采样中完全恢复原始信号的波形。以从采样中完全恢复原始信号的波形。浙江师范大学教育技术系三、音频的数字化(量化)三、音频的数字化(量化)音频量化:音频量化:将经采样后将经采样后幅度幅度上无限多个连续的样值上无限多个连续
7、的样值变为有限个离散值的过程变为有限个离散值的过程浙江师范大学教育技术系三、音频的数字化(量化)三、音频的数字化(量化)量化过程:量化过程:先将整个幅度划分成为有限个幅度(量化阶距)先将整个幅度划分成为有限个幅度(量化阶距)的集合,把落入某个阶距内的样值归为一类,并赋予相同的的集合,把落入某个阶距内的样值归为一类,并赋予相同的量化值。量化值。量化等级的划分量化等级的划分浙江师范大学教育技术系均匀量化和非均匀量化均匀量化和非均匀量化如果采用如果采用相等的量化间隔相等的量化间隔对采样所对采样所得信号作量化,则这种量化称为得信号作量化,则这种量化称为均均匀量化匀量化或或线性量化线性量化。若若量化间隔
8、不相等量化间隔不相等则为则为非均匀量化非均匀量化。量化后的样本值量化后的样本值Y Y和原始值和原始值X X的差的差E=Y-XE=Y-X称为称为量化误差量化误差或或量化噪声量化噪声。2.3 音频编码基础和标准19多媒体技术基础及应用浙江师范大学教育技术系三、音频的数字化三、音频的数字化模拟信号模拟信号采样采样量化量化编码编码浙江师范大学教育技术系A/D转换中,影响质量及数据量的主要因素:转换中,影响质量及数据量的主要因素:每秒钟需要采集多少个声音样本即每秒钟需要采集多少个声音样本即采样频率采样频率每个声音样本的位数每个声音样本的位数(bps)应该是多少即应该是多少即量化位数量化位数三、音频的数字
9、化三、音频的数字化例子例子:每个声音样本用每个声音样本用16位表示位表示,测得声音样本值测得声音样本值是在是在065536的范围里的范围里,它的精度就是输入信号的它的精度就是输入信号的1/65536浙江师范大学教育技术系声音质量与数据率声音质量与数据率三、音频的数字化三、音频的数字化质量质量采样频率采样频率kHz样本精度样本精度(b/s)单单/立体立体声声数据率数据率(kB/s)频率范围频率范围电话电话88单道声单道声82003400AM11.0258单道声单道声112015000FM22.05016立体声立体声88.2507000CD44.116立体声立体声176.4202000DAT481
10、6立体声立体声192.0202000浙江师范大学教育技术系音频编码的分类音频编码的分类波形编码波形编码音源编码音源编码基于人的听觉特性进行编码基于人的听觉特性进行编码利用人耳掩蔽效应,利用人耳掩蔽效应,设计心理声学模型实设计心理声学模型实现高效音频压缩。现高效音频压缩。(图图3.5)基于音频数据的统计特性,目标是使生成的波形尽可能与原始波形保持一致;音质高,数据率也很高;编译码器的复杂程度较低。它企图从声音波形它企图从声音波形中提出生成声音的声中提出生成声音的声学参数,利用生成模学参数,利用生成模型重构出声音;型重构出声音;数据率低数据率低(2.4kb/s左右左右),自然度差,保,自然度差,保
11、密性好。密性好。2.3 音频编码基础和标准23多媒体技术基础及应用浙江师范大学教育技术系脉冲编码调制脉冲编码调制(PCM)脉冲编码调制概念上最简单、理论脉冲编码调制概念上最简单、理论上最完善,最早研制成功、使用最上最完善,最早研制成功、使用最广,但数据量也最大。广,但数据量也最大。PCM的原理框图如图所示。的原理框图如图所示。PCM的概念的概念2.3 音频编码基础和标准24多媒体技术基础及应用浙江师范大学教育技术系脉冲编码调制脉冲编码调制(PCM)均匀量化和非均匀量化均匀量化和非均匀量化均匀量化、非均匀量化和量化误差均匀量化、非均匀量化和量化误差非线性量化的基本思想非线性量化的基本思想在非线性
12、量化中,采样输入信号幅度和量化输出数据之间定义了两种对应关系,这是基于对语音信号的统计分析后由CCITT建议的:m 律压扩算法和律压扩算法和A律压扩算法律压扩算法2.3 音频编码基础和标准25多媒体技术基础及应用浙江师范大学教育技术系PCM示意图226多媒体技术基础及应用浙江师范大学教育技术系自适应脉码调制概念自适应脉码调制概念APCM是根据输入信号幅度大小来是根据输入信号幅度大小来改变量化阶大小的一种波形编码技改变量化阶大小的一种波形编码技术。自适应可以是:术。自适应可以是:瞬时自适应瞬时自适应音节自适应音节自适应2.3 音频编码基础和标准27多媒体技术基础及应用浙江师范大学教育技术系APC
13、M的量化阶的量化阶改变量化阶大小的方法有两种:改变量化阶大小的方法有两种:前向自适应前向自适应根据未量化的样本值的均方根值来估算输入信号的电平,以此来确定量化阶的大小,并对其电平进行编码作为边信息(side information)传送到接收端。后向自适应后向自适应2.3 音频编码基础和标准28多媒体技术基础及应用浙江师范大学教育技术系APCM示意图示意图插入林图插入林图3-13APCM方块图方块图2.3 音频编码基础和标准29多媒体技术基础及应用浙江师范大学教育技术系差分脉码调制差分脉码调制(DPCM)DPCM的思想的思想:根据过去的样本根据过去的样本去估算下一个样本信号的幅度大去估算下一个
14、样本信号的幅度大小小(称为预测值称为预测值),然后对实际信,然后对实际信号值与预测值之差进行量化编码,号值与预测值之差进行量化编码,从而就减少了表示每个样本信号从而就减少了表示每个样本信号的位数。的位数。DPCM原理示意图原理示意图2.3 音频编码基础和标准30多媒体技术基础及应用浙江师范大学教育技术系DPCM示意图示意图插入林图插入林图3-14DPCM方块图方块图2.3 音频编码基础和标准31多媒体技术基础及应用浙江师范大学教育技术系自适应差分脉码调制自适应差分脉码调制ADPCM的核心思想:的核心思想:自适应量化:利用自适应的思想改自适应量化:利用自适应的思想改变量化阶的大小;变量化阶的大小
15、;自适应预测:使用过去的样本值估自适应预测:使用过去的样本值估算下一个输入样本的预测值,使实算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是际样本值和预测值之间的差值总是最小。最小。ADPCM框图。框图。2.3 音频编码基础和标准32多媒体技术基础及应用浙江师范大学教育技术系ADPCM示意图示意图插入林图插入林图3-15ADPCM方块图方块图2.3 音频编码基础和标准33多媒体技术基础及应用浙江师范大学教育技术系ADPCM解码器示意图解码器示意图插入林图插入林图3-16b.ADPCM解码器解码器2.3 音频编码基础和标准34多媒体技术基础及应用浙江师范大学教育技术系LD_CELP低
16、延时低延时-码激励码激励线性预测编码线性预测编码是以美国AT&T公司贝尔实验室提出的LD_CELP(低延时码激励线性预测低延时码激励线性预测)算法为基础,它充分考虑了听觉特性它充分考虑了听觉特性。其基本思想如下:2.3 音频编码基础和标准36多媒体技术基础及应用浙江师范大学教育技术系DL_CELP编码思想编码思想(a)1.语音输入每帧5个取样值,并附上10bit的描述激励信号波形与增益的信息;2.编码时用事先准备好的激励矢量的所有组合去合成语音;2.3 音频编码基础和标准37多媒体技术基础及应用浙江师范大学教育技术系DL_CELP编码思想编码思想(b)3.将合成结果与输入信号相比较,选出听觉加
17、权后距离最小的码元作为信息传输;4.解码端将发送端制定的激励矢量、3 bit增益码以及自身已经合成过的语音波形一起合成为语音。2.3 音频编码基础和标准38多媒体技术基础及应用浙江师范大学教育技术系MPEG中的音频中的音频编码器编码器2.3 音频编码基础和标准39多媒体技术基础及应用浙江师范大学教育技术系MPEG中的音频编码层次中的音频编码层次MPEG声音标准提供三个独立的压声音标准提供三个独立的压缩层次:层缩层次:层1、层、层2和层和层3后继层次的压缩比更高,编码解码后继层次的压缩比更高,编码解码器也更复杂器也更复杂每层都自含每层都自含SBC编码器,高层的编码器,高层的SBC可以使用低层可以
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 音频 媒体 及其 应用
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内