多媒體涉及到多方麵的音頻處理技術,如:音頻采集、語音編碼/解碼、文一-語轉換、音樂合成、語音識別與理解、音頻數據傳輸、音頻一-視頻同步、音頻效果與編輯等。其中數字音頻是個關鍵的概念,它指的是一個用來表示聲音強弱的數據序列,它是由模擬聲音經抽樣(即每隔一個時間間隔在模擬聲音波形上取一個幅度值)量化和編碼(即把聲音數據寫成計算機的數據格式)後得到的。計算機數字CD、數字磁帶(DAT)中存儲的都是數字聲音。模擬一-數字轉換器把模擬聲音變成數字聲音;數字一-模擬轉換器可以恢複出模擬來的聲音。
一般來講,實現計算機語音輸出有兩種方法:一是錄音/重放,二是文一-語轉換。第二種方法是基於聲音合成技術的一種聲音產生技術,它可用於語音合成和音樂合成。而第一種方法是最簡單的音樂合成方法,曾相繼產生了應用調頻(FM)音樂合成技術和波形表(wavetable)音樂合成技術。
2.樂器數字接口MIDI的概念
現在我們用的最多的音頻名詞之一MIDI(musical instrument digital interface)是作為“樂器數字接口”的縮寫出現的,並用它來泛指數字音樂的國際標準。由於它定義了計算機音樂程序、合成器及其他電子設備交換信息和電子信號的方式,所以可以解決不同電子樂器之間不兼容的問題。另外,標準的多媒體PC平台能夠通過內部合成器或連接到計算機MIDI端口的外部合成器播放MIDI文件,利用MIDI文件演奏音樂,所需的存儲量最少。
至於MIDI文件,是指存放MIDI信息的標準文件格式。MIDI文件中包含音符、定時和多達16個通道的演奏定義。文件包括每個通道的演奏音符信息:鍵通道號、音長、音量和力度(擊鍵時,鍵達到最低位置的速度)。由於MDDI文件是一係列指令,而不是波形,它需要的磁盤空間非常少;並且現裝載MIDI文件比波形文件容易的多。這樣,在設計多媒體節目時,我們可以指定什麼時候播放音樂,將有很大的靈活性。在以下幾種情況下,使用MIDI文件比使用波形音頻更合適:需要播放長時間高質量音樂,如想在硬盤上存儲的音樂大於4分鍾,而硬盤又沒有足夠的存儲容量;需要以音樂作背景音響效果,同時從CD-ROM中裝載其它數據,如圖像、文字的顯示;需要以音樂作背景音響效果,同時播放波形音頻或實現文一語轉換,以實現音樂和語音的同時輸出。
3.常見的聲音文件格式
再接下來我們介紹七種目前最為流行的多媒體聲音文件效果讓你認識認識:
★ WAVE,擴展名為WAV:該格式記錄聲音的波形,故隻要采樣率高、采樣字節長、機器速度快,利用該格式記錄的聲音文件能夠和原聲基本一致,質量非常高,但這樣做的代價就是文件太大。
★ MOD,擴展名MOD、ST3、XT、S3M、FAR、669等:該格式的文件裏存放樂譜和樂曲使用的各種音色樣本,具有回放效果明確,音色種類無限等優點。但它也有一些致命弱點,以至於現在已經逐漸淘汰,目前隻有MOD迷及一些遊戲程序中尚在使用。
★ MPEG-3,擴展名MP3:現在最流行的聲音文件格式,因其壓縮率大,在網絡可視電話通信方麵應用廣泛,但和CD唱片相比,音質不能令人非常滿意。
★ Real Audio,擴展名RA:這種格式真可謂是網絡的靈魂,強大的壓縮量和極小的失真使其在眾多格式中脫穎而出。和MP3相同,它也是為了解決網絡傳輸帶寬資源而設計的,因此主要目標是壓縮比和容錯性,其次才是音質。
★ Creative Musical Format,擴展名CMF:Creative公司的專用音樂格式,和MIDI差不多,隻是音色、效果上有些特色,專用於FM聲卡,但其兼容性也很差。
★ CD Audio音樂CD,擴展名CDA:唱片采用的格式,又叫“紅皮書”格式,記錄的是波形流,絕對的純正、HIFI。但缺點是無法編輯,文件長度太大。
★ MIDI,擴展名MID:目前最成熟的音樂格式,實際上已經成為一種產業標準,其科學性、兼容性、複雜程度等各方麵當然遠遠超過本文前麵介紹的所有標準(除交響樂CD、Unplug CD外,其它CD往往都是利用MIDI製作出來的),它的General MIDI就是最常見的通行標準。作為音樂工業的數據通信標準,MIDI能指揮各音樂設備的運轉,而且具有統一的標準格式,能夠模仿原始樂器的各種演奏技巧甚至無法演奏的效果,而且文件的長度非常小。
總之,如果有專業的音源設備,那麼要聽同一首曲子的HIFI程度依次是:
原聲樂器演奏 > MIDI > CD唱片 > MOD > 所謂聲卡上的MIDI > CMF,而MP3及RA要看它的節目源是采用MIDI、CD還是MOD了。
另外,在多媒體材料中,存儲聲音信息的文件格式也是需要認識的,共有:
WAV文件、VOC文件、MIDI文件、RMI文件、PCM文件以及AIF文件等若幹種。
★ WAV文件:Microsoft公司的音頻文件格式,它來源於對聲音模擬波形的采樣。用不同的采樣頻率對聲音的模擬波形進行采樣可以得到一係列離散的采樣點,以不同的量化位數(8位或16位)把這些采樣點的值轉換成二進製數,然後存入磁盤,這就產生了聲音的WAV文件,即波形文件。Microsoft Sound System軟件Sound Finder可以轉換AIF SND和VOD文件到WAV格式。
★ VOC文件:Creative公司波形音頻文件格式,也是聲霸卡(sound blaster)使用的音頻文件格式。每個VOC文件由文件頭塊(header block)和音頻數據塊(data block)組成。文件頭包含一個標識版本號和一個指向數據塊起始的指針。數據塊分成各種類型的子塊。如聲音數據靜音標識ASCII碼文件重複的結果重複以及終止標誌,擴展塊等。
★ MIDI文件:Musical Instrument Digital Interface(樂器數字接口)的縮寫。它是由世界上主要電子樂器製造廠商建立起來的一個通信標準,以規定計算機音樂程序 電子合成器和其它電子設備之間交換信息與控製信號的方法。MIDI文件中包含音符定時和多達16個通道的樂器定義,每個音符包括鍵通道號持續時間音量和力度等信息。所以MIDI文件記錄的不是樂曲本身,而是一些描述樂曲演奏過程中的指令。
★ RMI文件:Microsoft公司的MIDI文件格式,它可以包括圖片標記和文本。
★ PCM文件:模擬音頻信號經模數轉換(A/D變換)直接形成的二進製序列,該文件沒有附加的文件頭和文件結束標誌。在聲霸卡提供的軟件中,可以利用VOC-HDR程序,為PCM格式的音頻文件加上文件頭,而形成VOC格式。Windows的Convert工具可以把PCM音頻格式的文件轉換成Microsoft的WAV格式的文件。
★ AIF文件:Apple計算機的音頻文件格式。Windows的Convert工具同樣可以把AIF格式的文件換成Microsoft的WAV格式的文件。