首先我们需要知道几个相关的概念,有助于理解不同音频格式的质量及属性。
取样率
指的是每一秒钟取样的数目,其单位为赫兹(Hz),通常CD的采样率为44.1 kHz;DAT (Digital Audio Tape) 的采样率为32,44.1 和 48 kHz,其他常见的采样率还有22.05 和 11.025 kHz等。取样频率越高,所能描述的声波频率就越高。
量化精度
是指可以将模拟信号分成多少个等级。量化精度越高,音乐的声压振幅越接近原音乐。具体来说就是在数字音频技术里取得采样值后,要对数据进行量化。量化后的数值与原来的采样值是有误差的,这个数值就是量化精度。量化精度越高,量化值与采样值之间的误差就越小,声音听起来就越逼真,越细腻。其单位是Bit,通常CD标准的量化精度是16Bit,DVD标准的量化精度是24Bit。
更直观的,我们可以把数字音频分为以下几个等级:
声音不仅有音质属性,同样需要用于传播,太大的体积不利于即时传送,因此就要对声音文件进行压缩,以便日常生活的应用。从下表,我们可以大致了解声音品质与压缩比之间的关系。
以上两个表格不难看出,整个音质呈升序排列,压缩比越大,同等音频压缩后的体积越小,损失也就越多。下面具体认识下常见音频格式。
常见的10种音频格式1CDA格式
要讲音频格式,CD自然是打头阵的先锋。在大多数播放软件的“打开文件类型”中,都可以看到*.cda格式,这就是CD音轨了。其实唱片上的一首首歌曲,并非我们通常理解的一个个文件。要知道,CD唱片格式标准的确定之时,比诸电脑上用的CD-ROM格式还要早一程,所以当初定标准的时候当然不会考虑要让CD-ROM驱动器也能认出CD唱片。
到后来,为了在电脑上更方便地使用CD音轨,就在电脑上规定:一个CD音轨为一个*.cda文件。所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。cda文件是CD中音轨信息记录文件,cda文件只是个信息文件,不能在自制到硬盘中播放的,也就是说,只能带碟播放,若要复制音轨到硬盘播放,要用到抓音轨软件转成wav、mp3等格式文件。
2WAV波形音频格式
WAV是微软和IBM共同开发的PC标准声音格式,文件后缀名.wav,是一种通用的音频数据文件。通常使用WAV格式用来保存一些没有压缩的音频,也就是经过PCM编码后的音频,因此也称为波形文件,依照声音的波形进行存储,因此要占用较大的存储空间。
3MP3/MP3 Pro格式
MP3是一种音频压缩技术,其全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III),简称为MP3。它被设计用来大幅度地降低音频数据量。利用MPEG Audio Layer 3 的技术,将音乐以1:10 甚至 1:12 的压缩率,压缩成容量较小的文件,而对于大多数用户来说重放的音质与最初的不压缩音频相比没有明显的下降。用MP3形式存储的音乐就叫作MP3音乐,能播放MP3音乐的机器就叫作MP3播放器。最高参数的MP3(320Kbps)的音质较之CD的,FLAC和APE无损压缩格式的差别不多,其优点是压缩后占用空间小,适用于移动设备的存储和使用。
人耳等响度曲线图
为了使mp3能在未来仍然保持生命力,mp3PRO格式诞生了。这种格式与之前的mp3相比最大的特点是能在低达64kbps的比特率下仍然能提供近似CD的音质(mp3是128K)。该技术称为SBR(Spectral Band Replication),它在原来mp3技术的基础上专门针对原来mp3技术中损失了的音频细节进行独立编码处理并捆绑在原来的mp3数据上,在播放的时候通过再合成而达到良好的音质效果。mp3PRO格式与mp3是兼容的,所以它的文件类型也是mp3。
4WMA格式
WMA(Windows Media Audio),它是微软公司推出的与MP3格式齐名的一种新的音频格式。由于WMA在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质。一般使用Windows Media Audio编码格式的文件以WMA作为扩展名,一些使用Windows Media Audio编码格式编码其所有内容的纯音频ASF文件也使用WMA作为扩展名。WMA 7之后的WMA支持证书加密,未经许可(即未获得许可证书),即使是非法拷贝到本地,也是无法收听的。
同时,微软公司开始时宣称的:同文件比MP3体积小一倍而音质不变,也得到了兑现。事实上,这个说法,仅仅适用于低比特率的情况,另外,微软公司在WMA 9大幅改进了其引擎,实际上几乎可以在同文件同音质下比MP3体积少1/3左右,因此非常适合用于网络串流媒体及行动装置。
5RA格式
RA采用的是有损压缩技术,由于它的压缩比相当高,因此音质相对较差,但是文件也是最小的,因此在高压缩比条件下表现好,但若在中、低压缩比条件下时,表现却反而不及其他同类型档案格式了。此外RA可以随网络带宽的不同而改变声音质量,以使用户在得到流畅声音的前提下,尽可能高地提高声音质量。由于RA格式的这些特点,因此特别适合在网络传输速度较低的互联网上使用,互联网上许多的网络电台、音乐网站的歌曲试听都在使用这种音频格式。
6MIDI格式
直观的MIDI音符
经常玩音乐的人应该常听到MIDI(Musical Instrument Digital Interface)这个词,该技术最初应用在电子乐器上用来记录乐手的弹奏,以便以后重播。不过随着在电脑里面引入了支持MIDI合成的声音卡之后MIDI才正式地成为了一种音频格式。MID文件格式由MIDI继承而来,它并不是一段录制好的声音,而是记录声音的信息,然后在告诉声卡如何再现音乐的一组指令。这样一个MIDI文件每存1分钟的音乐只用大约5~10KB。
今天MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。
*.mid文件重放的效果完全依赖声卡的档次。
*.mid格式的最大用处是在电脑作曲领域。
*.mid文件可以用作曲软件写出,也可以通过声卡的MIDI口把外接音序器演奏的乐曲输入电脑里,制成*.mid文件。普通的MIDI文件许多播放器都支持。
7OGG(Ogg Vorbis)格式
Ogg全称应该是OGG Vobis(ogg Vorbis)是一种较新的音频压缩格式,类似于MP3等现有的音乐格式。但有一点不同的是,它是完全免费、开放和没有专利限制的。OGG Vobis有一个很出众的特点,就是支持多声道,随着它的流行,以后用随身听来听DTS编码的多声道作品将不会是梦想。
Vorbis是这种音频压缩机制的名字,而Ogg则是一个计划的名字,该计划意图设计一个完全开放源码的多媒体系统。 Ogg Vorbis文件的扩展名是.OGG。这种文件的设计格式是非常灵活的,它最大特点是在文件格式已经固定下来后还能对音质进行明显的调节和新算法。在压缩技术上,Ogg Vorbis的最主要特点是使用了VBR(可变比特率)和ABR(平均比特率)方式进行编码。与MP3的CBR(固定比特率)相比可以达到更好的音质。
8APE格式
APE是目前流行的数字音乐文件格式之一。APE是一种无损压缩音频技术,也就是说当你将从音频CD上读取的音频数据文件压缩成APE格式后,你还可以再将APE格式的文件还原,而还原后的音频文件与压缩前的一模一样,没有任何损失。APE的文件大小大概为CD的一半,随着宽带的普及,APE格式受到了许多人的喜爱,特别是对于希望通过网络传输音频CD的朋友来说,APE可以帮助他们节约大量的资源。
当然,目前只能把音乐CD中的曲目和未压缩的WAV文件转换成APE格式,MP3文件还无法转换为APE格式。事实上APE的压缩率并不高,虽然音质保持得很好,但是压缩后的容量也没小多少。一个34MB的WAV文件,压缩为APE格式后,仍有17MB左右。对于一整张CD来说,压缩省下来的容量还是可观的。
9FLAC格式
FLAC与MP3相仿,都是音频压缩编码,但FLAC是无损压缩,也就是说音频以FLAC编码压缩后不会丢失任何信息,将FLAC文件还原为WAV文件后,与压缩前的WAV文件内容相同。这种压缩与ZIP的方式类似,但FLAC的压缩比率大于ZIP和RAR,因为FLAC是专门针对PCM音频的特点设计的压缩方式。而且可以使用播放器直接播放FLAC压缩的文件,就像通常播放你的MP3文件一样。
FLAC文件的体积同样约等于普通音频CD的一半,并且可以自由地互相转换,所以它也是音乐光盘存储在电脑上的最好选择之一,它会完整保留音频的原始资料,用户可以随时将其转回光盘,音乐质量不会有任何改变,而在播放当中,FLAC文件的每个数据帧都包含了解码所需的全部信息,中间的错误不会影响其它帧的正常播放,这保证了它的实用有效和最小的网络时间延迟。目前在国内市场上,FLAC已经是和APE齐名的两大最常用无损音频格式之一,并且它的编码技术原理使得它在未来有超过APE的巨大的发展空间。
10AAC格式
AAC实际上是高级音频编码的缩写,苹果ipod、诺基亚手机也支持AAC格式的音频文件。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式,它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他的功能来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。
1幅图总结