多媒体动态网页设计
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第3章 音频/视频的处理与制作

数字音频信号是多媒体技术经常采用的一种形式,它的主要表现形式是语音、自然声和音乐。通过这些媒介,能够有力地烘托主题的气氛,尤其对于学习型多媒体系统和多媒体广告、视频特技等领域,数字音频信号显得更加重要。

数字音频信号的处理主要表现在数据采样和编辑加工两个方面。其中,数据采样的作用是把自然声转换成计算机能够处理的数据音频信号;对数字音频信号的编辑加工,则主要表现在剪辑、合成、静音、增加混响、调整频率等方面。

3.1 音频基础知识

声音是振动的波,是随时间连续变化的物理量。声音有三个重要指标。

(1)振幅(Amplitude)。波的高低幅度,表示声音的强弱。

(2)周期(Period)。两个相邻波之间的间隔时间长度。

(3)频率(Frequency)。每秒钟振动的次数,以赫兹为单位。

3.1.1 音频信号的特征

1.声音的传播方向

声音依靠介质的振动进行传播。声源实际上是一个振动源,它使周围的介质(空气、液体、固体)产生振动,并以波的形式进行传播,人耳如果感觉到这种传播过来的振动,再反应到大脑,就意味着听到了声音。

声音以振动波的形式从声源向四周传播,人类在辨别声源位置时,首先依靠声音到达左、右两耳的微小时间差和强度差异进行辨别,然后经过大脑综合分析而判断出声音来自何方。从声源直接到达人类听觉器官的声音称为“直达声”,直达声的方向辨别最容易。

在现实生活中,森林、建筑、各种地貌和景物存在于我们周围,声音从声源发出后,须经过多次反射才能被人们听到,这就是“反射声”。就理论而言,反射声会影响方向的准确辨别,但实际上,反射声不会使人丧失方向感,起关键作用的是大脑的综合分析能力。经过大脑的分析,不仅可以辨别声音的来源,还能丰富声音的层次,感觉声音的厚度和空间效果。

2.声音的三要素

声音的三要素是音调、音色和音强。就听觉特性而言,这三者决定了声音的质量。

(1)音调代表了声音的高低。音调与频率有关,频率越高,音调越高,反之亦然。当人们提高唱盘的转速时,声音频率提高,音调也提高。当使用音频处理软件对声音进行处理时,频率的改变可造成音调的改变。如果改变了声源特定的音调,则声音会发生质的转变。

(2)音色是具有特色的声音。声音分纯音和复音两种类型。纯音是指振幅和周期均为常数的声音;复音则是具有不同频率和振幅的混合音。大自然中的声音大部分是复音,复音中的低频音是“基音”,它是声音的基调。其他频率音称为“谐音”,也称为“泛音”。各种声源都有自己独特的音色,如各种乐器、不同的人、各种生物等,人们根据音色辨别声源种类。

(3)音强指声音的强度,也称为“响度”。“音量”也是指音强。音强与声波的振幅成正比,振幅越大,强度越大。CD音乐盘、MP3音乐及其他形式的声音强度是一定的,可以通过播放设备的音量控制改变聆听的响度。使用音频处理软件可以改变声源的音强。

3.声音的频谱与质量

声音的频谱有线性频谱和连续频谱之分。线性频谱是具有周期性的单一频率声波;连续频谱是具有非周期性的带有一定频带所有频率分量的声波。纯粹的单一频率的声波只能在专门的设备中创造出来,声音效果单调而乏味。自然界中的声音几乎全部属于非周期性声波,这种声波具有广泛的频率分量,听起来声音饱满、音色多样且富有生气。

声音的质量简称“音质”,音质的好坏与音色和频率范围有关。悦耳的音色、宽广的频率范围,能够获得非常好的音质。

4.声音的连续时基性

声音在时间轴上是连续信号,具有连续性和过程性,属于连续时基性媒体形式。构成声音的数据前后之间具有强烈的相关性。除此之外,声音还具有实时性,对处理声音的硬件和软件提出了很高的要求。

3.1.2 音频信号的指标

(1)频带宽度。音频信号的频带越宽,所包含的音频信号分量越丰富,音质越好。

(2)动态范围。动态范围越大,信号强度的相对变化范围越大,音响效果越好。

(3)信噪比。信噪比(Signal to Noise Ratio,SNR)是有用信号的平均功率与噪声的平均功率之比的简称,即

信噪比越大,声音质量越好。

(4)主观度量法。人的感觉机理对声音的度量最有决定意义。感觉上的、主观上的测试是评价声音质量不可缺少的部分。当然,可靠的主观度量值是较难获得的。

3.1.3 常见音频文件格式

(1)WAVE,扩展名为.wav。该格式记录声音的波形,故只要采样率高、采样字节长、机器速度快,利用该格式记录的声音文件就能够和原声基本一致,质量非常高,但这样做的代价是文件太大。

(2)MOD,扩展名为.mod、.st3、.xt、.s3m、.far、.669等。该格式的文件里存放乐谱和乐曲使用的各种音色样本,具有回放效果明确、音色种类无限等优点。但它也有一些致命弱点,以至于现在已经逐渐被淘汰,目前只有MOD迷及一些游戏程序中尚在使用。

(3)MPEG-3,扩展名为.mp3。现在最流行的声音文件格式,因其压缩率大,在网络可视电话通信方面应用广泛,但和CD唱片相比,音质不能令人非常满意。

(4)Real Audio,扩展名为.ra。这种格式真可谓是网络的灵魂,强大的压缩量和极小的失真使其在众多格式中脱颖而出。和 MP3 相同,它也是为了解决网络传输带宽资源而设计的,因此其主要目标是压缩比和容错性,其次才是音质。

(5)Creative Musical Format,扩展名为.cmf。Creative公司的专用音乐格式,它和MIDI差不多,只是音色、效果上有些特色,专用于FM声卡,但其兼容性很差。

(6)CD Audio,扩展名为.cda。唱片采用的格式,又称为“红皮书”格式,记录的是波形流。其缺点是无法编辑,文件太大。

(7)MIDI,扩展名为.mid。目前最成熟的音乐格式,实际上已经成为一种产业标准,其科学性、兼容性、复杂程度等各方面远远超过本文前面介绍的所有标准(除交响乐CD、Unplug CD外,其他CD往往都是利用MIDI制作出来的),它的General MIDI是最常见的通行标准。作为音乐工业的数据通信标准,MIDI 能指挥各音乐设备的运转,而且具有统一的标准格式,能够模仿原始乐器的各种演奏技巧甚至实现无法演奏的效果,而且文件的长度非常小。

总之,如果有专业的音源设备,那么同一首曲子的HIFI程度依次是:原声乐器演奏>MIDI>CD唱片>MOD>声卡上的MIDI>CMF,而MP3及RA,则要看它的节目源是采用MIDI、CD还是MOD了。