1.3 认识模拟与数字音频技术

随着经济和生产力的不断完善和发展,记录和处理音频信号的方式越来越复杂,因此部分专家学者们试图开发出了模拟的音频技术和数字音频技术。在这两种技术中,信号的波形、传输方式和存储媒介是完全不同的。本节主要向读者介绍模拟音频与数字音频的基础知识。

1.3.1 了解模拟音频技术的诞生

模拟音频技术的诞生,一共经历了多个阶段,下面简单向读者介绍一下。

1857年

法国人斯科特根据人类耳鼓膜随声波振动的现象发明了声波振记器,它是在实验室研究声学时发明的,这是最早的记录声音的仪器。这项装置通过转动的柱面上的一层膜记录下声波振动留下的痕迹,用来测定一个音调的频率,并研究声音及语言。斯科特发明的声波振记器如图1-11所示。

图1-11 声波振记器

1877年

美国人爱迪生发明了一种录音装置,他将声波转换成金属针的振动,同时转动圆筒的摇把,随着声音强弱高低的不同,金属针可以将波形在圆筒的锡箔上刻录出深浅不一的沟纹。当金属针再次沿着刻录的轨迹行进时,便可以重新发出留下的声音。

1885年

美国人奇切斯特·贝尔和查尔斯·吞特发明了用涂有蜡层的圆形卡纸板来录音的留声机装置。

1887年

旅美德国人伯利纳研制成功了蝶形唱片和平面式留声机。

1888年

爱迪生又把留声机上的大圆筒和小曲柄改进成类似时钟发条的装置,改为由马达带动一个薄薄的蜡制大圆盘转动的样式,大大增强了播放的稳定性。

1895年

爱迪生成立了国家留声机公司(National Phonograph Company),生产并销售这种用发条驱动的留声机,从此以后留声机才得以普及。同年,德国人艾米利和伯利纳推出了一款新的留声机,使用扁圆形涂蜡锌版作为播放和录音的媒体,同时也可以制成母版进行复制,这就大大增加了唱片商业化量产的可能性。

1891年

伯利纳研制成功了以虫胶(也称洋干漆)为原料的唱片,发明了制作唱片的方法,这种方法成为唱片工业历史性的起点。

20世纪初

在20世纪最初的10年中,留声机和唱片得到了很快普及,虽然当时的留声机产生的音质还很差,但毕竟是第一次把音乐从音乐厅传播到人们的家中,这表明了机械方式的模拟音频技术正在走向实用化。

1.3.2 了解模拟音频技术的特点

模拟音频是一种对声音波形进行1:1比例记载和传输的信号表示方式,它的波形是连续的,可以用机械、磁性、电子或光学形式来表现。模拟音频信号的振幅除了可以通过电压与位移(如留声机和模拟光学声迹)的直接模拟来表现外,还可以通过信号电压与磁通量强度(模拟磁带录音)的直接模拟来表现。

模拟音频也可以用调频方式使信号被载频或被解调,因为不管是在调制还是在解调周期内,其信号仍保持其模拟形态。

模拟音频技术反映了真实的声音波形,技术成熟,声音温暖动听,尤其在声/电能相互转换的功能(拾音与还音)方面是其他技术无法替代的,直到今天还在使用。但它是工业化时代的产物,在记录、编辑和传输时受到很多技术本身的限制,主要缺点是动态范围小,信号/噪声比较差,音频信号编辑十分不便,以及设备复杂昂贵等,尤其是其薄弱的信息承载能力,无疑是一个致命的弱点。

1.3.3 了解数字音频技术的诞生

20世纪90年代,国外学者尼葛洛庞帝、比尔·盖茨等人的著作,对未来数字时代中的人类生存与发展之路进行了解说,阐述了独特观点,也指明了音频技术的发展方向。

1928年,奈奎斯特通过实验首次提出这样的观点,在进行模拟信号转换为数字信号的过程中,当采样频率大于信号中最高频率的两倍时,采样之后的数字信号可以完整地保留原信号中的信息。由于奈奎斯特是最先发现采样规律的科学家,因此采样定理也被称为奈奎斯特定理。

1933年,前苏联工程师科捷利尼科夫首次用公式严格地表述了这一定理,因此在前苏联文献中称为科捷利尼科夫采样定理。

1948年,信息论的创始人C.E·香农对这一定理加以明确说明,并正式作为定理引用,因此在许多文献中又称为香农采样定理。

直到20世纪70年代晚期,数字音频技术才逐渐成熟起来,第一代数字音频媒体CD于1982年开始推向消费者市场,得以普及使用。

1.3.4 了解数字音频的采样

采样频率是指音频信号采样时每秒的数字快照数量,这个速度决定了一个音频文件的频率范围或称为频响带宽。采样频率越高,数字波形的形状越接近原来的模拟波形;采样频率越低,数字音频的波形越容易被扭曲,从而背离原始音频,造成频率失真。

1.3.5 了解数字音频的量化

所谓数字音频的量化,是指按照一定的数值量把经过采样得到的瞬时幅度值离散化,这个规定的数值量称为位深度,也称为量化精度或量化比特数,它决定了数字音频的动态范围,较高的位深度可以提供更多可能性的振幅值,从而产生更大的动态范围和更高的信号噪声比,提高信号的保真度。

采用16bit(位)位深度的数字音频是最常见的,它能达到CD音质,但有些Hi-Fi音频系统使用32 bit(位)的位深度,而在有些对音质要求较低的场合,如网络电话,也可能使用8bit(位)的位深度。不同的数字音频位深度对应的声音品质如表1-4所示。

表1-4 不同的数字音频位深度对应表

专家提醒

在数字音频中,离散化是指将连续问题的解用一组离散要素来表征而近似求解的数字方法。

1.3.6 了解数字音频技术的特点

由于数字音频电路一旦过载就会产生无法消除的数字噪声,所以数字音频系统中所有的信号必须保持在某种基准电平值以下。在数字音频电路中,表述音频信号的大小除了继续沿用电平(dB)这一参量外,还使用dBFS这一特殊参量。

数字音频技术提高了声音记录过程中的动态范围和信噪比,保证了声音的复制与重放无损,提高了传输过程中的抗干扰能力,便于加密,并且在编辑处理以及与其他媒体的结合上更加方便。因此,数字音频技术逐渐成为当代声音处理领域中的主流技术。