鍾國旺 (廣東電視台新聞中心綜合組) 來自:《西部廣播電視》
摘要:介紹了基於PC平台的非線性編輯係統,其視音頻子係統的硬件結構,用於視音頻子係統中的視頻壓縮技術和數據存儲技術。
1 概論
非線性編輯這個名稱是為了與傳統的線性編輯相區別而產生的。傳統的電子編輯方法是線性編輯。在非線性編輯係統中,視音頻素材存放在盤體表麵同心圓狀的磁道中,磁頭在二維的極坐標環境中定位和讀寫。對於存儲在盤上的任意位置的素材,磁盤與磁頭二者的聯動一般用幾ms就可以找到,找點時間基本上沒有差別,所以稱為非線性編輯。因此,通常把基於磁帶的編輯係統稱為“線性編輯係統”,而把基於磁盤的編輯係統稱為非線性編輯係統。
由於非線性編輯係統的信息存儲位置與接受信息的順序不相關,盤上所存任何文件均可隨時調用或修改,插入內容不需要重錄,大大提高了編輯效率。不僅如此,更重要的是,它還具有許多線性編輯所不具有的功能,可以處理文字、圖形、圖像、動畫等多種形式的素材,實現了完整意義上的非線性編輯,極大豐富了影視製作的手段。 常見的非編係統分為三類:
1)基於工作站平台的係統。該係統大多建立在SGI圖形工作站基礎上,一般圖形、動畫和特技功能較強,但價格昂貴,軟硬件支持不充分。
2)基於MAC平台的係統。該係統在非線性編輯發展的早期應用得比較廣泛,未來的發展在一定程度上受到蘋果硬件平台的製約。
3)基於PC平台的係統。這類係統以Intel及其兼容芯片為核心,型號豐富,性價比高,裝機量大,發展速度也非常快,是當今的主導型係統。另外,這類非線性編輯係統正在向網絡化發展,大大提高了電視台內部的製作播出效率。
下麵以基於PC平台的係統為例,介紹非編係統的硬件技術。
2 非編係統的硬件結構
非線性編輯係統技術的重點在於處理圖像和聲音信息。這兩種信息具有數據量大、實時性強的特點。實時的圖像和聲音處理需要有高速的處理器、寬帶數據傳輸裝置、大容量的內存和外存等一係列的硬件環境支持。普通的PC機難於滿足上述要求,經壓縮後的視頻信號要實時地傳送仍很困難,因此,提高運算速度和增加帶寬需要另外采取措施。這些措施包括采用數字信號處理器DSP、專門的視音頻處理芯片及附加電路板,以增強數據處理能力和係統運算速度。在電視係統處於數字島時期,幀同步機、數字特技發生器、數字切換台、字幕機、磁盤錄像機和多軌DAT(數字錄音磁帶)技術已經相當成熟,而借助當前的超大規模集成電路技術,這些箱級的數字視頻功能已可以在標準長度的板卡上實現。非線性編輯係統板卡上的硬件能直接進行視音頻信號的采集、編解碼、重放,甚至直接管理素材硬盤,計算機則提供GUI(圖形用戶界麵)、字幕、網絡等功能。同時,計算機本身也在迅速發展,PC機軟硬件的發展已能使操作係統直接支持視音頻操作。下麵主要介紹非編係統的視音頻子係統的硬件結構。
視音頻處理子係統通常是以板卡的形式實現的。它有單通道、雙通道和多通道形式。在非線性編輯中,通常應用的是雙通道係統,其視音頻子係統包括:外部視音頻輸入模塊、壓縮采集和解壓縮重放模塊、圖文產生模塊、二維數字特技模塊、三維數字特技模塊、多層疊加模塊、預覽輸出及主輸出模塊。其結構如圖1所示。
視頻信號輸入後有一路進入數字混合器,可有一路活動背景信號在數字混合器中與其他存儲在硬盤中的視頻文件混合。需要壓縮保存的視頻信號進入壓縮/解壓縮通道,經壓縮後變為標準的視頻文件,存放在硬盤中。音頻信號經A/D變換後存入硬盤。使用應用程序將視音頻文件從硬盤中調出,可有兩路視頻信號通過解壓縮進入視頻混合器,由視頻效果控製DSP運行,對進入混合器的視頻信號進行二維、三維特技變換,在混合器中完成掃換、疊化、鍵控等效果。當重放時,由32bit RGB & Alpha圖文幀存產生的圖文在混合器中作實時混合處理,完成圖像和圖文字幕的疊加。音頻信號經數字音頻處理後輸出。3非編係統中應用的硬件技術視音頻處理係統中的硬件之所以能夠完成上述許多功能,主要在於各種硬件技術的應用。這些技術主要有:視頻壓縮技術、數據存儲技術、數字圖像處理技術和圖文字幕疊加技術等。
31 視頻壓縮技術
在非線性編輯係統中,數字視頻信號的數據量非常龐大,必須對原始信號進行必要的壓縮。常見的數字視頻信號的壓縮方法有M-JPEG、MPEG和DV等。
311 M-JPEG壓縮格式
目前非線性編輯係統絕大多數采用M-JPEG圖像數據壓縮標準。1992年,ISO(國際標準化組織)頒布了JPEG標準。這種算法用於壓縮單幀靜止圖像,在非線性編輯係統中得到了充分的應用。JPEG壓縮綜合了DCT編碼、遊程編碼、霍夫曼編碼等算法,既可以做到無損壓縮,也可以做到質量完好的有損壓縮。完成JPEG算法的信號處理器在上世紀90年代發展很快,可以做到以實時的速度完成運動視頻圖像的壓縮。這種處理法稱為Motion-JPEG(M-JPEG)。在錄入素材時,M-JPEG編碼器對活動圖像的每一幀進行實時幀內編碼壓縮,在編輯過程中可以隨機獲取和重放壓縮視頻的任一幀,很好地滿足了精確到幀的後期編輯要求。
Motion-JPEG雖然已大量應用於非線性編輯中,但Motion-JPEG與前期廣泛應用的DV及其衍生格式(DVCPRO 25、50和Digital-S等),以及後期在傳輸和存儲領域廣泛應用的MPEG-2都無法進行無縫連接。因此,在非線性編輯網絡中應用的主要是DV體係和MPEG格式。
312 DV體係
1993年,包括索尼、鬆下、JVC以及飛利浦等幾十家公司組成的國際集團聯合開發了具有較好質量、統一標準的家用數字錄像機格式,稱為DV格式。從1996年開始,各公司紛紛推出各自的產品。DV格式的視頻信號采用4∶2∶0取樣、8bit量化。對於625/50製式,一幀記錄576行,每行的樣點數:Y為720;CR、CB各為360,且隔行傳輸。視頻采用幀內約5∶1數據壓縮,視頻數據率約25Mbit/s。DV格式可記錄2路(每路48kHz取樣、16bit量化)或4路(32kHz取樣、12bit量化)無數據壓縮的數字聲音信號。
DVCPRO格式是日本鬆下公司在家用DV格式基礎上開發的一種專業數字錄象機格式,用於標準清晰度電視廣播製式的模式有兩種,稱為DVCPRO 25 模式和DVCPRO 50 模式。在DVCPRO 25 模式中,視頻信號采用4∶1∶1取樣、8bit量化,一幀記錄576行,每行有效樣點,Y為720,CR、CB各為180,數據壓縮也為5∶1,視頻數據率亦為25Mbit/s。在DVCPRO 50 模式中,視頻信號采用4∶2∶2取樣、8bit量化,一幀記錄576行,每行有效樣點,Y為720,CR、CB各為360,采用幀內約33∶1數據壓縮,視頻數據率約為50Mbit/s。DVCPRO 25模式可記錄2路數字音頻信號,DVCPRO 50 模式可記錄4路數字音頻信號,每路音頻信號都為48kHz取樣、16bit量化。
DVCPRO格式帶盒小、磁鼓小、機芯小,這種格式的一體化攝錄機體積小、重量輕,在全國各地方電視台都用得非常多。因此,在建設電視台的非線性編輯網絡時,DVCPRO是非編係統硬件必須支持的數據輸入和壓縮格式。
313 MPEG壓縮格式
MPEG是Motion Picture Expert Group(運動圖像專家組)的簡稱。開始時,MPEG是視頻壓縮光盤(VCD、DVD)的壓縮標準。MPEG-1是VCD的壓縮標準,MPEG-2是DVD的壓縮標準。現在,MPEG-2係列已經發展成為DVB(數字視頻廣播)和HDTV(高清晰度電視)的壓縮標準。非編係統采用MPEG-2為壓縮格式將給影視製作、播出帶來極大方便。MPEG-2壓縮格式與Motion-JPEG最大的不同在於它不僅有每幀圖像的幀內壓縮(JPEG方法),還增加了幀間壓縮,因而能夠獲得比較高的壓縮比。在MPEG-2中,有I幀(獨立幀)、B幀(雙向預測幀)和P幀(前向預測幀)三種形式。其中B幀和P幀都要通過計算才能獲得完整的數據,這給精確到幀的非線性編輯帶來了一定的難度。現在,基於MPEG-2的非線性編輯技術已經成熟,對於網絡化的非編係統來說,采用MPEG2-IBP作為高碼率的壓縮格式,將會極大減少網絡帶寬和存儲容量,對於需要高質量後期合成的片段可采用MPEG2-I格式。MPEG2-IBP與MPEG2-I幀混編在技術上也已成熟。
32 數據存儲技術
由於非線性編輯要實時地完成視音頻數據處理,係統的數據存儲容量和傳輸速率也非常重要。通常單機的非編係統需應用大容量硬盤、SCSI接口技術,對於網絡化的編輯,其在線存儲係統還需使用RAID硬盤管理技術,以提高係統的數據傳輸速率。
321 大容量硬盤
硬盤的容量大小決定了它能記錄多長時間的視音頻節目和其他多媒體信息。以廣播級PAL製電視信號為例,壓縮前,1s視音頻信號的總數據量約為32MB,進行3∶1壓縮後,1min視音頻信號的數據量約為600MB,1h視音頻節目需要約36GB的硬盤容量。近年來硬盤技術發展很快,一個普通家用電腦的硬盤就可以達到40GB,通常專業使用的硬盤容量在100GB左右,因此,現有的硬盤容量完全能夠滿足非線性編輯的需要。
322 SCSI接口技術
數據傳輸率也稱為“讀寫速率”或“傳輸速率”,一般以MB/s表示。它代表在單位時間內存儲設備所能讀寫的數據量。在非線性編輯係統中,硬盤的數據傳輸率是最薄弱的環節。普通硬盤的轉速還不能滿足實時傳輸視音頻節目的需要。為了提高數據傳輸率,計算機使用了SCSI接口技術。SCSI是Small Computer System Interface(小型計算機係統接口)的簡稱。目前SCSI總線支持32bit的數據傳輸,並具有多線程I/O功能,可以從多個SCSI設備中同時存取數據。這種方式明顯加快了計算機的數據傳輸速率,如果使用兩個硬盤驅動器並行讀取數據,則所需文件的傳輸時間是原來的1/2。目前8位的SCSI 最大數據傳輸率為20MB/s,16位的Ultra Wide SCSI(超級寬SCSI)為40MB/s,最快的SCSI接口Ultra 320最大數據傳輸率能達到320MB/s。SCSI接口加上與其相配合的高速硬盤,能滿足非線性編輯係統的需要。
對非線性編輯係統來說,硬盤是目前最理想的存儲媒介,尤其是SCSI硬盤,其傳輸速率、存儲容量和訪問時間都優於IDE接口硬盤。SCSI的擴充能力也比IDE接口強。增強型IDE接口最多可驅動4個硬盤,SCSI-Ⅰ規範支持7個外部設備,而SCSI-Ⅱ一般可連接15個設備,Ultra 2以上的SCSI可連接31個設備。
323 RAID管理技術
網絡化的編輯對非編係統的數據傳輸速率提出了更高的要求。處於網絡中心的在線存儲係統通常由許多硬盤組成硬盤陣列。係統要同時傳送幾十路甚至上百路的視音頻數據就需要應用RAID管理電路。該電路把每一個字節中的位元分配給幾個硬盤同時讀寫,提高了速度,整體上等效於一個高速硬盤。這種RAID管理方式不占用計算機的CPU資源,也與計算機的操作係統無關,傳輸速率可以做到100Mbit/s以上,並且安全性能較高。
33 圖像處理技術
在非線性編輯係統中,我們可以製作豐富多采的“數字視頻特技”(Digital Video Effects,DVE)效果。數字視頻特技有硬件和軟件兩種實現方式。軟件方式以幀或場為單位,經計算機的中央處理器(CPU)運算獲得結果。這種方式能夠實現的特技種類較多,成本低,但速度受CPU運算速度的限製。硬件方式製作數字特技采用專門的運算芯片,每種特技都有大量的參數可以設定和調整。在質量要求較高的非編係統中,數字特技是由硬件或軟件協助硬件完成的,一般能實現部分特技的實時生成。
電視節目鏡頭的組接可分為混合、掃換(劃像)、鍵控、切換4大類。多層數字圖像的合成實際上是圖像的代數運算的一種。它在非線性編輯係統中的應用有兩大類,即全畫麵合成與區域選擇合成。在電視節目後期製作中,前者稱為“疊化”,後者在視頻特技中用於“掃換”和“摳像”。多層畫麵合成中的層是隨著新型數字切換台的出現而引入的。視頻信號經數字化後在幀存儲器中進行處理才能使層得到實現。所謂的層實際上就是幀存,所有的處理包括劃像、色鍵、亮鍵、多層淡化疊顯等數字處理都是在幀存中進行的。數字視頻混合器是非線性編輯係統中多層畫麵疊顯的核心裝置,主要提供疊化、淡入淡出、掃換和鍵控合成等功能。
隨著通用和專用處理器速度的提高,圖像處理技術和特級算法的改進,以及MMX(Multimedia Extensions,多媒體擴展)技術的應用,許多軟件特技可以做到實時或準實時。隨著由先進的DSP技術和硬件圖像處理技術所設計的特技加速卡的出現,軟件特技處理時間加快了8~20倍。軟件數字特技由於特級效果豐富、靈活、可擴展性強,更能發揮製作人員的創意,因此,在圖像處理中的應用越來越多。
34 圖文字幕疊加技術
字幕是編輯中不可缺少的一部分。在傳統的電視節目製作中,字幕總是疊加在圖像的最上一層。字母機是串接在係統最後一級上的。在非線性編輯中,插入字幕有硬件和軟件兩種方式。軟件字幕是利用作圖軟件的原理把字幕作為圖形鍵處理,生成帶Alpha鍵的位圖文件,將其調入編輯軌對某一層圖像進行摳像貼圖,完成字幕功能。
硬件字幕的硬件構成通常由一個圖形加速器和一個圖文幀存組成。圖形加速器主要用於對單個像素、專用像素和像素組等圖形部件的管理,它具有繪製線段、圓弧和顯示模塊等高層次圖形功能,因而明顯減輕了由於大量的圖形管理給CPU帶來的壓力。圖形加速器的效率和功能直接影響圖文字幕的速度和效果。疊加字幕的過程是將漢字從硬盤的字庫中調到計算機內存中,以線性地址寫入圖文幀存,經屬性描述後輸出到視頻混合器的下遊鍵中,將視頻圖像合成後輸出。
4 結束語
非線性編輯技術的發展經曆了20多年的時間。近年來數字電視技術和電腦多媒體技術的高速發展,硬件技術的日趨成熟,使非線性編輯在影視製作中的應用越來越多。隨著設備的不斷小型化,相信這種高質量、高效率的影視製作手段將得到更加廣泛普及的應用。