計算機對音頻信號的處理,PC機用戶都不陌生。對於玩多媒體的計算機用戶,音頻處理更是輕車熟路了。實際上,數字音頻應該追溯到1983年的CD音樂,全數字式的錄音設備和混頻係統,它早就進入了專業的音頻製作領域。
同視頻處理一樣,要在計算機內處理音頻,也要通過A/D轉換把模擬信號轉換為數字音頻信號。當然,對於以數字方式存儲的音頻,要另當別論。A/D轉換過程,同樣由采樣和量化構成,但其采樣速度要比視頻處理低得多。人耳能聽到的聲音,最高頻率為20KHz,因此音頻的最大帶寬為20KHz,故而采樣率需要介於40KHz和50KHz之間,這與視頻采樣速率比較起來是相當低的,但它們對每個樣本需要更多的量化比特數。在前麵對視頻量化的分析中,46dB的信噪比被認為是最合理的。但具有同樣信噪比的音頻信號,則是不可接受的。實驗證明,要在正常收聽期間聽不到噪聲,必須達到大於70dB的信噪比。當考慮到製作的附加要求時,音頻數字化的標準就變成了每個樣本16位,從而得到96dB的信噪比。
16位數字音頻的標準量化是線性脈衝編碼調製PCM,每一量化都具有相等的長度。在音樂CD製作中,采用的正是這一格式。如果采樣的速率低於每個樣本16位,則可以使用其他的幾種量化方法。當每個樣本為12位或14位時,最好使用一種非線性PCM格式,在這種方法中,低信號電瓶的量化步長小於高信號電平的步長。
對於數字音頻,同樣也可以采取壓縮處理,以減少文件長度。較高級壓縮使用差分脈衝編碼調製DPCM來實現,在這種方法中,隻有相鄰之間的插值被量化器編碼,而不是樣本值本身的問題。如果相鄰值具有類似的幅度,則這種方法十分有效。但是,如果信號含有大量的接近奈奎斯特極限頻率的成分,則相鄰值將是很不相同的,DPCM係統將不能夠維持,而且會引起高頻部分的嚴重失真。
針對DPCM 存在的固有問題,人們引入了自適應係統來加以解釋,這就形成了自適應差分脈衝編碼調製ADPCM。它根據音頻信號的電平或高頻成分,把一個比例因子用於可動態變化的差分位。因此,當信號小時,差分位控製小的幅度步長;而當信號大時,它們控製大得多的增量。由於采用ADPCM的播放係統必須知道這個比例因子,所以要將比例包含在解碼器處理的差分位流中。ADPCM是一種有損壓縮技術,它的缺點是能引起信號質量的降低。
和視頻信號相比,由於缺乏類似的視頻的結構信息,數字音頻的壓縮較為困難。因此目前高質量的壓縮方案,都是通過模擬人耳聽覺來確定哪些成分在音頻信號內可能是冗餘的,像前麵提到的MPEG壓縮標準一樣,利用人耳的音頻掩蓋特性,進行了數字音頻壓縮。不過,即使如此,壓縮比也僅限於6∶1。
另外,計算機處理音頻信號,既可以是雙聲道立體聲,也可以是單聲道,這要根據最終的需要加以決定。無謂的采用立體聲,會增加計算時間,增加文件容量。在計算機中,音頻的采樣速度、采樣位數都是可以調整的,這也要根據最終的用途加以選擇。
WAV格式的音頻文件是聲音通常的存儲方式,它可以在Windows的媒體播放機中播放,是一種通用的聲音文件格式。另外,還有一種聲音文件格式為MIDI,這種文件存儲的不是聲音的波形信號,而是各種樂器的演奏信號,非常類似於樂譜,需要用聲卡中的MIDI處理電路把它轉換為波形信號後,才能在音頻設備中播出。MIDI文件沒有存儲實際的波形信號,因而其容量是相當小的,其缺點是播放的時候,需要聲卡硬件的支持。因此,在我們的非線性編輯軟件核心——Premiere 6.0中,並不支持MIDI格式的文件。
MP3格式的音頻文件是利用 MPEG Audio Layer 3技術, 將聲音用 1:10 甚至 1:12 的壓縮比率,壓縮成為一個較小的音頻文件。在Adobe Premiere以前的版本中是不支持MP3格式音頻文件的,在最新的Adobe Premiere 6.0中才增加了MP3的壓縮編碼。我們可以輸入MP3文件,並可以對它進行任意的非線性編輯,如同WAV格式的音頻格式一樣。