2.1 音频信号的简介

音频是个专业术语,人类能够听到的所有声音都称为音频,它可能包括噪声等。声音被录制下来以后,无论是说话声、歌声、乐器声,都可以通过数字音乐软件处理,或是把它制作成CD,这时候所有的声音没有改变,因为CD本来就是音频文件的一种类型,而音频只是储存在计算机里的声音。本节主要向读者介绍关于音频的基础知识。

2.1.1 熟悉音频信号

音频信号是带有语音、音乐和音效的有规律的声波的频率、幅度变化信息载体。根据声波的特征,可把音频信息分类为规则音频和不规则声音。其中规则音频又可以分为语音、音乐和音效。规则音频是一种连续变化的模拟信号,可用一条连续的曲线来表示,称为声波。声音的三个要素是音调、音强和音色。声波或正弦波有三个重要参数:频率、幅度和相位,这也就决定了音频信号的特征。

1. 基频与音调

频率是指信号每秒钟变化的次数。人对声音频率的感觉表现为音调的高低,在音乐中称为音高。音调正是由频率所决定的。

2. 幅度与音强

人耳对于声音细节的分辨只有在强度适中时才最灵敏。人的听觉响应与强度成对数关系。一般的人只能察觉出3分贝的音强变化,再细分则没有太多意义。我们常用音量来描述音强,以分贝(dB=20log)为单位。在处理音频信号时,绝对强度可以放大,但其相对强度更有意义,一般用动态范围定义:动态范围=20×log(信号的最大强度/信号的最小强度)。

3. 采集方式

电台等由于其自办频道的广告、新闻、广播剧、歌曲和转播节目等音频信号电平大小不一,导致节目播出时,音频信号忽大忽小,严重影响用户的收听效果。在转播时,由于传输距离等原因,在信号的输出端也存在信号大小不一的现象。过去,对大音频信号采用限幅方式,即对大信号进行限幅输出,小信号不予处理。这样,仍然存在音频信号过小时,用户只能自行调节音量,这会影响用户的收听效果。随着电子技术、计算机技术和通信技术的迅猛发展,数字信号处理技术已广泛地深入到人们生活的各个领域。其中,语音处理是数字信号处理最活跃的研究方向之一,在IP电话和多媒体通信中得到广泛应用。语音处理可采用通用数字信号处理器DSP和现场可编程门阵列(FPGA)实现,其中,DSP实现方法具有实现简便、程序可移植性强、处理速度快等优点。在DSP的基础上对音频信号做AGC算法处理可以使输出电平保持在一定范围内,能够解决不同节目音频不均衡等问题。

2.1.2 熟悉音频信号压缩

因为音频信号数字化以后需要很大的存储容量来存放,所以很早就有人开始研究音频信号的压缩问题。音频信号的压缩不同于计算机中二进制信号的压缩,在计算机中,二进制信号的压缩必须是无损的,也就是说,信号经过压缩和解压缩以后,必须和原来的信号完全一样,不能有一个比特的错误。这种压缩称为无损压缩。但是音频信号的压缩就不一样,它的压缩可以是有损的,只要压缩以后的声音和原来的声音听上去一样就可以了。因为人的耳朵对某些失真并不灵敏。所以,压缩时的潜力就比较大,也就是压缩的比例可以很大。音频信号在采用各种标准的无损压缩时,其压缩比顶多可以达到1.4倍,但在采用有损压缩时其压缩比就可以很高。