本文的目的是針對MP3機上使用的數碼音頻格式而撰寫的,所以,在播放格式上我隻介紹目前MP3上常用的兩種格式:MP3與WMA。如果從數碼音頻格式的角度來說,除了提到的這兩個格式外,還有很多其他的格式:RA、MIDI、VQF、ATRAC、ATRAC3、Vorbis、AIF/AIFF、MP3PRO、Ogg、Dolby®Pro Logic®、Dolby Digital 5.1、Qdesign QDX、ATRAC3、VoiceAge等等。
1.音頻格式
數字化音頻格式的出現,是為了滿足複製、存儲、傳輸的需求。簡單的說,早期的模擬音頻格式,存在著複製失真和因為介質磨損而失效的問題。從CD盤的存儲開始,數字格式音頻文件開始普及,但又產生了一個問題——存儲體積上的限製,同時CD盤仍然存在磨損的現象,如果保存到硬盤上(相對存儲時間更長),在當時存儲介質(主要是硬盤)仍然昂貴的情況下,也不是好的解決方法。而互聯網的出現,更產生了遠距離傳輸文件的要求,在帶寬的製約下,縮小文件體積的需求變得更加強烈,這些都從外部因素上導致了有損壓縮數字音頻格式產生!
而從內部因素來說,隨著電腦運算、編碼能力的提高、各種聲學心理模式的進步,促進了各種有損壓縮數字音頻格式的層出不窮。如果光從曆史及現在曾經湧現出的編碼格式來看,應該會列舉出很多,而在MP3機上使用的音頻格式,我們向大家介紹的主要有如下幾種——MP3(CBR、VBR、ABR)、WMA、ADPCM。
(1)MP3(CBR、VBR、ABR)
MP3應該算目前使用用戶最多的有損壓縮數字音頻格式了。它的全稱是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3,1993年由德國夫朗和費研究院和法國湯姆生公司合作發展成功。剛出現時它的編碼技術並不完善,它更像一個編碼標準框架,留待人們去完善。早期的MP3編碼采用的的是固定編碼率的方式(CBR ),我們常看到的128KBPS,就是代表它是以128KBPS固定數據速率編碼——你可以提高這個編碼率,最高可以到320KBPS,音質會更好,自然,文件的體積會相應增大。
因為MP3的編碼方式是開放的,你可以在這個標準框架的基礎上自己選擇不同的聲學原理進行壓縮處理,所以,很快由Xing公司推出可變編碼率的壓縮方式(VBR)。它的原理就是利用將一首歌的複雜部分用高 bitrate 編碼,簡單部分用低 bitrate 編碼,通過這種方式,進一步取得質量和體積的統一。當然,早期的Xing 編碼器的 VBR 算法很差,音質與 CBR (固定碼率)相去甚遠。但是,這種算法指明了一種方向,其他開發者紛紛推出自己的VBR算法,使得效果一直在改進。目前公認比較好的首推 LAME,它完美地實現了 VBR 算法,而且它是是完全免費的軟件,並且由愛好者組成的開發團隊一直在不斷的發展完善。
而在VBR的基礎上,LAME更加發展出ABR算法。ABR(Average Bitrate)平均比特率,是VBR的一種插值參數。LAME針對CBR不佳的文件體積比和VBR生成文件大小不定的特點獨創了這種編碼模式。ABR在指定的文件大小內,以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量,可以做為VBR和CBR的一種折衷選擇。
(2)WMA
WMA是Windows Media Audio的縮寫,是微軟力推的數字音樂格式。微軟官方宣布的資料中稱WMA格式的可保護性極強,甚至可以限定播放機器、播放時間及播放次數,具有相當的版權保護能力。應該說,WMA的推出,就是針對MP3沒有版權限製的缺點而來——普通用戶可能很歡迎這種格式,但作為版權擁有者的唱片公司來說,它們更喜歡難以複製拷貝的音樂壓縮技術,而微軟的WMA則照顧到了這些唱片公司的需求,可以預見,唱片業可能將全力支持WMA標準。
除了版權保護外,WMA還在壓縮比上進行了深化,它的目標是在相同音質條件下文件體積可以變的更小(當然,隻在MP3低於192KBPS碼率的情況下有效,實際上當采用LAME算法壓縮MP3格式時,高於192KBPS時普遍的反映是MP3的音質要好於WMA)。
不管怎麼說,微軟想介入的領域,它總能憑著自己的強大實力和在軟件上的壟斷地位,獲得它想要的東西(盡管技術上它並不總是最出色)——這場戰爭應該是微軟在數碼音頻格式領域的另一個IE與Netscape的戰爭版本。