ITU-T G.728标准

2020-02-21 17:30

附录A: ITU-T G.728标准

16kbit/s LD-CELP语音编码

1. 概述

这个建议包含用低延迟码激励线性预测方法进行16kbit/s语音编码算法的描述。该建议由以下几个部分组成。

在第2节给出了LD-CELP算法的简要原理。在第3节和第4节,分别讨论了LD-CELP编码器和解码器的原则。在第5节,定义了与每个功能算法块有关的计算细节。附件A、B、C和D包含了用于LD-CELP算法的常数表格。在附件E中,给出了可变自适应序列及其用途。最后在附录I(略)中提供了用于验证算法实现的信息。 2. LD-CELP概述

LD-CELP算法由一个编码器和一个解码器组成,分别在2.1节和2.2节描述它们,原理图示于图A.1。

CELP技术的本质,是用分析—合成的方法对码书进行搜索,该方法被保留在LD-CELP中。但是,LD-CELP用反向自适应预测器和增益来获得一种延迟0.625ms 的算法,只有激励码书的索引被传送。预测器系数通过对以前量化语音的LPC分析来更新,激励增益通过利用以前嵌入在量化激励中的增益信息来修正。激励矢量和增益自适应块的体积仅为5个采样值。一个感觉加权滤波器利用未量化语音的LPC分析来更新。

2.1 LD-CELP编码器

从A-律或μ-律PCM变换到均匀PCM后,输入信号被分成五个连续输入信号样值的各个块,对每一个输入块,编码器让1024个候选码书矢量(存储在一个激励码书中)中的每一个通过一个增益调节单元和一个综合滤波器。从这1024个候选量化信号矢量中,编码器鉴别出一个使频域加权均方误差最小的量代表输入信号矢量。对应代表最佳候选量化信号矢量的最佳码书矢量(或“码矢量 ”)的10位码书索引被传送到解码器。然后,最佳码矢量通过增益调节单元和综合滤波器准备为下一个信号矢量而建立正确的滤波器存储。综合滤波器参数和增益被以反向自适应的方式周期地更新,而这种反向自适应的方式是以以前量化信号和增益调节激励为基础的。

239

64kbit/s A-律或μ-律PCM输入变换成均匀PCM矢量缓冲器+激励VQ码书增益综合滤波器_听觉加权滤波器均匀误差VQ 16kbit/s输出 最小化索引反向自适应增益反向自适应预测器图A.1(a) LD-CELP编码部分

VQ索引16kbib/s输入激励VQ码书增益综合滤波器后滤波器转换为PCM反向自适应增益反向自适应预测器64kbit/sA-律或μ-律PCM输出语音图A.1(b) LD-CELP解码部分

2.2 LD-CELP 解码器

解码操作也是以一块接一块的方式被执行。每接收到一个10bit索引,解码器执行一次查表操作以从激励码书中提取对应的码矢量。然后这个码矢量通过一个增益调节单元和一个综合滤波器以产生正确的解码信号矢量。然后综合滤波器系数和增益以与在编码器中相同的方式被更新。接着,解码信号矢量通过一个自适应后滤波以提高听觉质量。后滤波器参数的周期更新是利用解码器端的有效信息。后滤波器矢量的5个采样值接着被变换成5个A-律或μ-律PCM输出值。

240

3. LD-CELP编码原则

图A.2是LD-CELP编码器的详细方框原理图。这个图与前面的图A.1信号在数学上是等价的,但对于实现更为有效。

64kbit/s A-律或μ-律PCM输入语音线性PCM输入PCM输入语音格式转换器s( k )u12矢量缓冲器3量化语音调节器sq( n )23综合滤波器后向调节器10感觉加权滤波器12r( n )感觉加权滤波器调节器W( z )4感觉加权滤波器v( n )11VQ目标矢量计算x( n )VQ目标矢量归一化?(n)x逆时卷积模块16输入语音矢量s( n )so( k )仿真译码器 819激励y( n )VQ码书21增益e( n )20后向矢量增益调节器567P( z )9综合滤波器冲激响应矢量计算h(n )波形码矢卷积模块17码书搜索模块 24误差计算18最佳码矢标号选择最佳码矢标号送最佳码矢标号到信道Ej能量表计算22综合滤波器σ( n )Yj141315p( n )图A.2 16 kbit/s LD-CELP 编码器原理图

28 输出 PCM 格式变换 64kbit/s A律或 μ律PCM 输出语音

最佳码矢标号 29 激励VQ 码书 31 增益 30 后向矢量 增益调节器 32 综合 滤波器 33 综合滤波器 后向调节器 合成 语音 34 后滤波器 35 后滤波器 调节器 图A.3 LD-CELP解码器

241

对图A.2做下列说明:

a.对每一个要描述的变量,k是采样索引,样值以125μs的间隔被采样。

b.在一个已给信号中,一组5个连续样值被叫做这个信号的一个矢量。例如,5个连续语音采样值形成一个语音矢量,5个连续激励样值形成一个激励矢量等等。

c.我们用n表示矢量索引,它不同于采样索引k。 d.四个连续的矢量构成一个自适应周期。在后面章节里,我们也把自适应周期叫做帧,两个名称可互换使用。

激励矢量量化(VQ)码书索引明显地是从编码器向解码器传送的唯一信息。三种其它参数被周期地更新,它们是:激励增益、综合滤波器和感觉加权滤波器参数。这些参数是从出现在当前信号矢量以前的信号中以一种反向自适应的方式推导出来的。激励增益对每一个矢量更新一次,而综合滤波器系数和感觉加权滤波器系数每四个矢量更新一次(即20个采样值或2.5ms更新周期)。注意,虽然算法中的处理序列有4个矢量(20个采样值)的自适应周期,但基本缓冲器体积仍然是一个矢量(5个采样值)。这样小的缓冲体积使得到一个少于2ms的延迟方式成为可能。

编码器的每个方框的说明在下面给出。因为LD-CELP编码器主要用于对语音编码,为便于描述,在下面我们将假定输入信号是语音,虽然实际上它也能用于非语音信号。

3.1 输入PCM格式转换

这个方框把输入A–律或?–律PCM信号s0(k)转换成一个均匀PCM信号su(k)。

3.1.1 内部线性PCM电平

在从A–律或?–律变换为线性PCM过程中,不同的内部表示是可能的。这决定于仪器。例如,对于?–律PCM标准表格定义的线性范围是-4015.5~+4015.5。这对应于A–律PCM的范围是-2016~+2016。两种表列出的某些输出值有0.5的小数部分;这些小数部分在整数仪器中并不能表示出来。除非整个表格乘以2以使所有的值都成为整数。事实上,这一点在定点DSP芯片上是很普遍的。相反,浮点DSP芯片能表示列在表中同样的值。这篇文章假定输入信号有最大范围-4095~+4095,这包括了?–律和A–律的情况。在A–律的情况下,它意指当线性变换的结果在-2016~+2016范围时,在继续对信号编码之前,这些值应被一个2的因子调节(乘2)。在?–律情况下,对一个定点处理器,输入范围被变换到 -8031~+8031。它意指在开始编码处理以前,输入值应除以2。换句话说,这些值能被作为Q1格式来处理,意指有一位在十进制小数点的右边,那么所有涉及到这个数据的计算都应把这一位考虑进去。

对于16-bit线性PCM输入的情况,有满动态范围-32768~+32768,输入值应被考虑成Q3格式,这就是说,输入值应被除以8。在解码器输出端,这个因子8将被恢复。

242

3.2 矢量缓冲器

这个方块缓冲5个连续语音样值su(5n),su(5n+1),?,su(5n+4)以形成一个5维语音矢量s(n)?[su(5n),su(5n?1),?su(5n?4)]。

3.3 感觉加权滤波器自适应

图A.4显示了感觉加权滤波器调节器的细节操作(块3)。这个调节器对每四个语音矢量计算一次感觉加权滤波器的系数,而这四个语音矢量是基于未量化语音的线性预测分析(常被叫做LPC分析)上的。系数更新出现在每四个矢量自适应周期的第三个语音矢量处,这些系数在每两次更新间保持为常数。

输入语音 3 36 混合窗 37 Levinson- Durbin 递推计算 38 感觉加权 滤波器 系数计算 感觉加权 滤波器系数 图A.4(a) 感觉加权滤波器系数更新

参考图A.4(a),这个计算按下列步骤执行。首先,输入(未量化)语音矢量通过一混合(hybrid)窗模块(块36)即加一窗在以前的语音矢量上,然后计算加窗语音信号的头11个自相关系数。Levinson-Durbin递推模块(块37)变换这些自相关系数成为预测器系数。以这些预测器系数为基础,权滤波器系数计算器(块38)能得出期望的权滤波器系数。下面我们仔细讨论这三部分。

递归部分b非递归部分bαbα2wm( n ):窗函数当前帧下一帧时间m + 2L -1m - N - 1m - Nm - 1mm + L -1m + L图A.4(b) 混合窗

我们先描述混合窗的原理。因为这个混合窗技术将被用于三种不同的LPC分析中,我们先给出它的总体描述,然后再针对不同情况专门讲述。假定LPC分析对每L个信号样值执行一次,为一般化,认为对应于当前LD-CELP自适应周期的信号样值是su(m),su(m?1),su(m?2),?,su(m?L?1)。那么,对于反向自适应LPC分析,混合窗

243


ITU-T G.728标准.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:学生成绩管理系统课程设计报告

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: