第二章作业
2.1 音频信号的频率范围大约多少?话音信号频率范围大约多少?
答:音频信号的频率范围是20Hz~20KHz ,话音信号频率范围大约在30Hz-1000Hz
之间。
2.3 什么叫做采样?什么叫做量化?什么叫做线性量化?什么叫做非线性量化?
答:采样就是采集模拟信号的样本.采样是将时间上、幅值上都连续的模拟信
号,在采样脉冲的作用,转换成时间上离散(时间上有固定间隔)、但幅值上仍连续的离散模拟信号。所以采样又称为波形的离散化过程。量化就是把某些事物
用数字、数量来表示,从而使这一事物能让人们更清楚地看透它的本来面目。线性量化
就是将模拟信号所代表的连续范围分成一段一段的区间(Interval),每一段区间我们定义一个数字化的值.区间的数目是跟采样大小有关,举例来说,有一种最简单的量化法称为”线性量化法”(Linear quantization),这种量化法采用等距离的间隔空间,架设一个讯号它的最大值是5.0,采样大小为3位,则每个量化区间就时5.0/2^3,也就是0.625单位.另外一种相反的量化方法就是”非线性量化法”(Nonlinear quantization),这种量化法采用不同的间隔空间.以”对数量化
法”(Logarithm quantization)为例.低振幅范围的量化区间就比高振幅的范围的区间较为接近,用这种量化的法产生的结果就是在低振幅时我们会得到佳好的效果.通常如果使用同样的采样大小,非线性量化法会比线性量化法得到更好的声音品质.但是如果是要对声音做滤波(filtered)或一些运算的时候,使用线性量化法会比较容易处理.。非线性量化采用均匀间隔量化级进行量化的方法称为均匀量化或线性量
化。这种量化方式会造成大信号时信噪比有余而小信号时信噪比不足的缺点。如果较小信号时量化级间度小些,而大信号时景化级间宽度大些,就可以使小信号时和大信号时的信噪比趋于—致。 这种非均匀量化级的安排称为非均匀量化或非线性量化。数字电视信号大多数采用非均匀量化方式,这是由于模拟视频信号要经过伽玛校正,而伽玛校正类似非线性量化特性,可减轻小信号时误差的影响。当前的音/视频设备做A/D转换时多采用非线性量化。
2.4 采样频率根据什么原则来确定?
答:采样就是对一个模拟信号每过一段时间取一个值,采样的根据是根据采样定理确定的,即采样信号的最小频率不小于被采样信号带宽的二倍,否则有原信号就会有所丢失,不再能还原成原来的号,一般采样信号要比被采样信号的带宽大,如间频信号的带宽是20KHZ,实际采样频率则为44.1KHZ
2.7 选择采样频率为22.050 kHz和样本精度为16位的录音参数。在不采用压缩技术的情况下,计算录制2分钟的立体声需要多少MB(兆字节)的存储空间(1MB=1024×1024B) 2.8 什么叫做MIDI?它有什么特点?
答:MIDI 本身只是Musical Instrument Digital Interface 的缩写,意思是音乐设备数字接口。
这种接口技术的作用就是使电子乐器与电子乐器,电子乐器与电脑之间通过一种通用的通讯协议进行通讯, 这种协议自然就是MIDI协议了。特点:数据量小,可以比同时间长度的
1
音频文件小1000倍。3字节一个midi消息。编辑器可以很方便的修改编辑。
2.9 用自己的语言说明FM合成声音和乐音样本合成声音的思想。
答:就是采用频率调制合成语音信号大多数廉价的声卡都采用的FM合成方式,FM合成是通过振荡器产生正弦波,然后再叠加成各种乐器的波形。由于振荡器成本较高,即使是OPL3这类高档的FM合成器也只提供了4个振荡器,仅能产生20种复音,所以发出音乐听起来生硬呆板,带有明显的人工合成色彩。与FM合成不同,波表合成是采用真实的声音样本进行回放。声音样本记录了各种真实乐器的波形采样,并保存在声卡上的ROM或RAM中(要分辨一块声卡是否波表声卡,只需看卡上有没有ROM或RAM存储器即可)。目前中高档声卡大都采用了波表合成技术
2.13什么叫做μ律压扩?什么叫做A律压扩? 答:μ律压扩
G.711标准建议的μ律压扩主要用在北美和日本等地区的数字电话通信中,按下面的式子(归一化)确定量化输入和输出的关系:
式中:x为输入信号幅度,规格化成 -1≤< /SPAN> x≤ 1; sgn(x)为x的极性,x<0时为-1,否则为1;
μ为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,取100≤μ≤ 500,现在多取μ=255。
由于μ律压扩的输入和输出关系是对数关系,所以这种编码又称为对数PCM。具体计算时,用μ=255,可以把对数曲线变成8条折线以简化计算过程。
A律压扩
G.711标准建议的A律压扩主要用在中国大陆和欧洲等地区的数字电话通信中,按下面的式子确定量化输入和输出的关系: 0 ≤ | x| ≤ 1/A 1/A < |x| ≤ 1
式中:x为输入信号幅度,规格化成 -1 ≤< /SPAN > x ≤ 1; sgn(x)为x的极性,x<0时为-1,否则为1;
A为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,通常取A=87.6。 A律压扩的前一部分是线性的,其余部分与μ律压扩相同。A律压扩具有与μ律压扩相同的基本性能(在大信号区信噪比高于μ律量化器,但在小信号区不如μ律量化器)和实现方面的优点,尤其是还可以用直线段很好地近似,以便于直接压扩或数字压扩,并易于与线性编码格式相互转换。具体计算时,A=87.56,为简化计算,同样把对数曲线部分变成13条折线。
对于采样频率为8 kHz,样本精度为13比特、14比特或者16比特的输入信号,使用m率压扩编码或者使用A率压扩编码,经过PCM编码器之后每个样本的精度为8比特,输出的数据率为64 kbps。这个数据就是CCITT推荐的G.711标准:话音频率脉冲
2
编码调制(Pulse Code Modulation (PCM) of Voice Frequencies)。通常的听觉主观感觉认为8位压扩量化有不低于12位均匀量化A/D的信噪比及动态范围。
2.14 差分脉冲编码调制(DPCM)的基本思想是什么?
答:PCM是为了用数字方式传输或存储模拟信号,对模拟信号进行数字化的一种方法。 PCM被广泛用于电话通信中的语音传递和利用无线电传输的遥测系统中。它把模拟信号变为一系列在时间和幅度上都离散化的数字信号,然后再进一步把已离散的信号以一定的编码方法将其变为二进制代码。其编码过程分为抽样、量化、压缩、编码几个步骤。 差分PCM(DPCM)
在PCM中,波形的每个样本独立进行编码。然而,以奈奎斯特速率或更高速率采样的绝大多数信号(包括语音信号),其相邻的样本之间呈现明显的相关性,换言之,相邻采样幅度间的平均变化较小。所以,利用采样中多余度的编码方案将使语音信号的码率降低。一种简单的解决方法就是对相邻样本之差编码而不是对样本本身编码,由于相邻样本之差比实际样本幅度小,所以表示差信号需要较小的位数。这种普通方法的一种改进方案是用前面的n个样本根据一定的规律来预测当前的样本,然后将预测值与实际值的误差进行量化后传输,在根据误差信号,采用和发送端相同的预测方法恢复出原始信号。
2.15自适应差分脉冲编码调制(ADPCM)的两个基本思想是什么?
答:DPCM处理器是一款专用数字信号处理(DSP)芯片,已被优化为执行三种不同速率的自适应差分脉冲编码调制(ADPCM)语音压缩功能。芯片可被编程为压缩(扩展)64kbps话音数据至(由)32kbps、24kbps或16kbps。32kbps压缩遵循CCITT推荐标准G.726规定的算法。DS2164Q可以动态切换压缩算法。这使用户能够以动态方式最大限度利用现有带宽。 按照CCITT/ITU G.726规范压缩/扩展64kbps PCM话音至/由32kbps、24kbps或16kbps 两个完全独立的通道结构;器件可以通过编程实现以下功能: 两路扩展 两路压缩 一路扩展和一路压缩 直接与CODEC组合器件互联 输入至输出延迟小于375μs 通过简单串行端口配置器件 片上时隙分配电路(TSAC)可以在不同的时隙输入/输出数据 支持随路信令 各通道可被独立闲置或旁路 硬件模式不需要主处理器,特别适合于语音存储应用 反向兼容于DS2165 ADPCM处理器 +5V单电源供电;低功耗CMOS技术 28引脚PLCC封装
3