3.2 音频信号的数字化
将自然声或其他种类的声音转换成可处理的标准数字音频信号,就是数字音频的采样。这是获得数字化声音的基本手段。
3.2.1 音频信号的数字化过程
由于音频信号是一种连续变化的模拟信号,而计算机只能处理和记录二进制的数字信号,因此,由自然音源而得的音频信号必须经过一定的变化和处理,变成二进制数据后才能送到计算机进行再编辑和存储。
PCM(Pulse Code Modulation,脉冲编码调制)是一种模数转换的最基本编码方法,它把模拟信号转换成数字信号的过程称为模数转换,主要包括如下三部分内容。①采样,在时间轴上对信号数字化;②量化,在幅度轴上对信号数字化;③编码,按一定格式记录采样和量化后的数字数据。
编码的过程,是首先用一组脉冲采样时钟信号与输入的模拟音频信号相乘,相乘的结果即为输入信号在时间轴上的数字化。然后对采样以后的信号幅值进行量化,最简单的量化方法是均衡量化,这个量化的过程由量化器来完成。最后对经量化器模数变换后的信号再进行编码,即把量化的信号电平转换成二进制码组,就得到了离散的二进制输出数据序列x(n),n表示量化的时间序列,x(n)的值就是n时刻量化后的幅值,以二进制的形式表示和记录。
3.2.2 影响音频信号的技术参数
1.采样频率
采样频率是指一秒钟内采样的次数。奈奎斯特(Harry Nyquist)采样理论认为:如果对某一模拟信号进行采样,则采样后可还原的最高信号频率只有采样频率的一半。或者说,只要采样频率高于输入信号最高频率的两倍,就能由采样信号系列重构原始信号。
根据该采样理论,CD激光唱盘采样频率为44 kHz,可记录的最高音频为22 kHz,这样的音质与原始声音相差无几,也就是我们常说的超级高保真音质(Super High Fidelity)。采样的三个标准频率分别为44.1 kHz、22.05 kHz和11.025 kHz。
2.量化位数
量化位数是对模拟音频信号的幅度轴进行数字化,它决定了模拟信号数字化后的动态范围,如表3-1所示。由于计算机按字节运算,一般的量化位数为8位和16位。量化位越高,信号的动态范围越大,数字化后的音频信号就越可能接近原始信号,但所需要的存储空间也越大。
表3-1 模拟音频信号量化位数
3.声道数
有单声道和双声道之分。双声道又称为立体声,音质、音色好,但在硬件中要占两条线路,立体声数字化后所占空间比单声道多一倍。
4.编码算法
编码的作用有两个:一是采用一定的格式来记录数字数据,二是采用一定的算法来压缩数字数据。压缩编码的基本指标之一就是压缩比,压缩比通常小于 1。压缩算法包括有损压缩和无损压缩。有损压缩是指解压后数据不能完全复原,要丢失一部分信息。压缩比越小,丢掉的信息越多、信号还原后失真越大。根据不同的应用,可以选用不同的压缩编码算法,如PCM、ADPC、MP3、RA等。