一 取樣過程產生的信號損傷
在取樣的過程中對信號造成的損傷主要有:孔闌效應、混疊效應、過衝和振鈴。為了說明這些損傷所產生的原因,我們在以下敘述中給出分析結果。
取樣是指用每隔一定時間的信號樣值序列來代替原來在時間上連續的信號,也就是在時間上將模擬信號離散化。根據奈奎斯特取樣定理:對於最大頻率為fm的信號f(t),當取樣頻率fs不低於2fm時,由截止頻率為fm矩形低通濾波器可以從取樣信號中完全恢複原信號。但實際的物理過程與數字模型有不同的工程結果。
1. 孔闌效應
在數學模型的理想化狀態下理想的取樣脈衝寬度為無窮窄,取樣情況及其頻域情況如圖一所示,但在實際設備中取樣脈衝隻能是有限寬度的脈衝,它的取樣情況及其頻域情況如圖一所示,很顯然具有不等於零的實際的有限寬度的取樣脈衝所引起的孔闌效應會產生高頻衰落。
由於信號的高頻部分反映的是視頻圖象的細節,因此高頻衰落會導致視頻畫麵的細節模糊。針對這種情況實際工程中一般采用在將數字信號恢複成模擬信號以後通過提升高頻的辦法對這種失真進行補償和校正。 一般來講,由於取樣信號的頻率fs必須滿足fs>2fm,而為了減少孔闌效應要求取樣脈衝的寬度τ盡量小,因此要滿足τ遠遠小於取樣信號的周期T,即取樣信號的脈衝寬度要滿足1/τ>>2fm。
2.混疊效應
在實際應用中,為滿足奈奎斯特定理在取樣之前應使用截止頻率為取樣頻率一半的濾波器對原信號進行濾波,濾除可能產生頻譜混疊的高頻成分,以保證新處理的信號是一個有限帶寬的處理信號。理想低通濾波器特性如圖二所示,但實際的低通濾波器性能如圖三所示,因此為了盡量濾除大於1/2fc的頻率成分,就要選擇多階濾波器。如果濾波器的階數不足以達到濾除1/2fc以上的高頻分量,會引起恢複的信號中頻譜混疊效應。混疊效應在視頻圖象上表現為一種被稱為morie的漣漪狀的幹擾。
3.過衝和振鈴
在保證有效的消除混疊效應時,在上述情況已建議采用多階濾波器以滿足濾波器的帶外特性,但是取樣前的低通濾波器如果階數太大,會引起過衝和振鈴從而造成恢複的視頻信號過渡的邊沿不清晰。
針對以上兩種信號損傷造成的矛盾,主觀上選用階數少的濾波器會有利一些,因為頻譜混疊效應隻有在圖象有超過二分之一取樣頻率以上分量時,特別是有單頻分量時才會明顯感覺到,因此是偶發事件。但過衝和振鈴效應卻是隻要有過渡邊沿就回出現的經常性現象。因此就主觀感覺來說,減少過衝和振鈴留有一些混疊相對來講更有利一些。一般工程上出於平衡考慮取樣頻率選為fc=(2.2---2.5)fm。
另外為克服這一矛盾的方法是采用過抽樣方式,即在抽樣時用兩倍抽樣頻率抽樣,這時頻譜按兩倍抽樣頻率周期重複,重複頻譜中心頻率之間的間隔比正常情況大一倍,如圖四所示。這時抽樣前的濾波相對簡單,可以用階數少、頻率特性緩降的無振鈴濾波器,然後在數字域用線形相位濾波器進行二分之一抽取濾波器恢複到原抽樣頻率樣值。另外,在此過程中,取樣頻率增加了一倍,因此取樣脈衝的寬度隻有原來的一半,從而也起到了減少孔闌效應的作用。
二 量化誤差所帶來的信號損傷
取樣過程是把模擬信號變成了時間上離散的脈衝信號,量化的過程則是進行幅度上的離散化處理。因此在時間軸的任意一點上量化後的信號電平與原模擬信號電平之間在大多數情況下總是存在有一定的誤差,量化所引入的誤差是不可避免的同時也是不可逆的,由於信號的隨機性這種誤差大小也是隨機的,這種表現類似於隨機噪聲效果,具有相當寬度的頻譜,因此我們又把量化誤差稱為量化噪聲。但量化誤差與噪聲是有本質的區別的,因為任一時刻量化誤差是可以從輸入信號求出的,而噪聲與信號之間則沒有這種關係。
降低量化誤差的方法最直接的就是增加量化級數減小最小量化間隔,但由此帶來碼率的增加從而要求更大的處理帶寬,一般現在的視頻信號均采用8比特、10比特,在信號質量要求較高的情況下采用12比特量化。此外,我們在設計一套係統的時候,可以考慮在係統的不同環節采用不同的比特量化,使得在係統的各個環節的量化級相互錯開,從而避免量化噪聲累積效果所產生的台階效應,這種均衡的效果可以改善整個係統的量化失真。一般量化比特高的環節應該放在係統的前端,這樣可以使係統的前端對信號造成的不可恢複損傷減小到最低限度。
為了減小量化誤差我們還要正確的選擇量化方式。量化有兩種量化方式,一種是取整時隻舍不入,此時產生的量化誤差總是負的,最大量化誤差等於兩個相鄰量化級的間隔d;另一種是取整時有舍有入,此時量化誤差有正有負,量化誤差的絕對值最大為1/2d。因此為了減少量化誤差,應該采用有舍有入量化方式。
1.輪廓效應
如果信號兩個相鄰量化電平相差較大,若在圖象麵積較大的範圍內,視頻信號緩變區(如漸變的藍天)能夠看出不連續的跳變,即會在圖象緩變區出現從一個量化電平到另一個量化電平之間的輪廓線,實際上就是圖象的等量化電平線。這種輪廓線是原圖象所沒有的,所以又稱為偽輪廓,即輪廓效應。
一種簡單而有效的消除輪廓效應的方法是利用隨機的高斯噪聲信號發生器產生顫動信號,疊加到被量化的信號當中,當顫動信號的均方根值大於1/3d時人們便覺察不到輪廓效應的存在。在數字電視中使用最多的顫動信號是重複頻率為取樣脈衝的一半,峰-峰幅度為1/2d的方波,具體步驟如圖五所示。
圖五 高頻顫動的效果
由圖五比較可以看出,疊加顫動信號的效果等效於將量化間隔由d減小到1/2d,或者說將量化級數提高了一倍(比特數由n提高到n+1),從而改善了輪廓效應。順便指出,由於模/數轉換中的取樣、量化都屬於非線形過程,難以避免會出現差拍幹擾,采用疊加顫動信號的方法對於消除圖象中的差拍幹擾也同樣有效。同時由於顫動信號的幅度小,頻率高,並未對圖象細節造成顯而易見的損傷。
2.顆粒雜波
如果最小量化電平不夠小,則圖象較弱信號的緩變區可能會出現在鄰近的兩個量化電平之間產生由於四舍五入法則而造成的跳變,使得圖象在這個區域內出現顆粒狀的雜波,而人的視覺對圖象弱信號緩變區的噪聲則是非常敏感的。
為了克服均勻量化時這種大信號時信噪比有餘,而小信號時信噪比不足的特點,我們可以采用小信號時量化級間寬度小而大信號時量化級間寬度大些的非均勻量化,又叫非線形量化。值得說明一點,數字攝象機信號處理大多數采用非均勻量化方式,這是由於攝象機中的光-電轉換至電視機顯象管中的電-光轉換在內的整個電視信道必須保持線形,但是實際的電視係統在沒有校正之前是非線形的,因此為了使最終顯示出來的光像保持良好的線形關係,在攝象機單元必須對它進行校正,即γ校正。而γ校正類似於非線形量化特性,因此我們可以在量化過程中采用非均勻量化方式,在提高小信號信噪比的同時也滿足了γ校正的要求。
另外,由於在實際的信號中,弱信號出現的概率是很大的,為了改善弱信號時的的量化信噪比,可以采用壓縮擴張的編解碼方法。在量化之前,先利用非線形器件將信號電平高的部分進行壓縮,然後對壓縮過的信號進行量化,解碼後複原出的模擬信號再通過非線形器件對大幅度信號進行擴張恢複沒壓縮之前的比例關係,這種方法相對擴大了小信號的動態範圍,等效於對小信號采用量化間隔小的細量化而大信號采用粗量化,從而改善了弱信號的量化信噪比。
三 壓縮編碼所帶來的信號損傷
數字電視信號數碼率太高,數據量非常大。如果直接存儲和傳輸不但開銷很大,而且有時設備也承受不了如此大的負荷。壓縮編碼以壓縮信源數碼率為目的,盡量減少信源各符號的相關性,使信源的傳輸效率提高。當然,它是以犧牲圖像質量為前提。必定會對信號造成一定的損傷。
下麵針對幾種常用的圖像壓縮方式,來看一下他具體會對信號帶來什麼樣的損傷呢?
(一) 差值脈衝編碼(DPCM)
電視圖像基本上是由麵積較大的像塊(如藍天,大地,服裝)組成。雖然每個像塊的幅值各不相同,但像塊內各樣值的幅度是相近或相同的。換句話說,相鄰象素之間有很強的相關性。我們就可以利用這些相關性對當前的像素進行預測。再利用預測值得到差值。這樣在很大的程度上降低了信源的冗餘度。這種壓縮方法對視頻信號會產生以下問題:
1 由於在當前差值中包括當前的量化誤差,而輸出的前一樣值又包括前一樣值的量化誤差,這就造成了量化誤差的積累。而誤差會傳播,這就使信號抗通道誤碼能力減弱。
2 邊緣清晰度臨界。 根據DPCM編碼思想,當被預測值處於圖象突變邊緣時,往往會導致錯誤預測或產生較大的預測誤差。致使邊緣清晰度臨界。如:邊緣為黑白突變,被預測值為x ,x1 x2 x3 x4 x5為已知值,由DPCM編碼可得
進行水平一維預測 x=x1=0 產生錯誤預測
進行二維預測 x=x1+(x4-x5)/2=1/2 產生較大的預測誤差
(二) 變換編碼
變換編碼首先對圖象數據進行某種形式的正交變換,並對變換後的數據進行編碼,從而達到數據壓縮的目的。正交變換的種類很多,比如人們熟知的傅立葉變換,沃爾什哈達碼變換,哈爾變換,斜變換,餘弦變換,正弦變換,K--L變換。
變換編碼中較常用的是離散餘弦變換DCT,它首先將輸入圖象分成若幹NXN的圖象塊,對每一小圖象塊進行正交變換,從空間域變換到頻域。為了達到壓縮的目的,對DCT係數需作量化處理。低頻分量采用較小的量化間隔,量化誤差小,精度高。頻率越高,量化間隔愈大,精度越低。這是因為高頻分量隻影響圖象的細節,對整塊圖象來講,沒有低頻分量重要。讀取時采用之字型。這樣的處理給信號帶來的損傷主要表現在:
由於高頻信息的丟失,恢複圖象中相鄰塊在邊界上產生較為規則的誤差分布,由於人眼對水平和垂直方向的規則誤差分布具有特殊的敏感性,使得在主觀感覺上認為具有規則誤差分布的圖象的質量明顯降低,從而產生"塊效應"。在拍攝一幅綠草如茵的草地中,充斥畫麵的草坪隨風搖擺時,一種細塊狀的閃爍效應是這一失真的直觀表現。
(三) 運動補償預測
運動補償預測是一個有力的工具,以便減少幀間的時間冗餘度,並作為用於DPCM編碼的預測技術。運動補償概念是以對視頻幀間運動的估計為基礎的。也就是說,若視頻鏡頭中所有物體均在空間上有一位移,那麼用有限的運動參數來對幀間的運動加以描述。為了做到這一點,畫麵一般劃分成一些不連續的象素塊,對每個這樣的象素塊,隻對一個運動矢量進行估算、編碼和傳送。
在MPEG壓縮算法中,運動補償預測技術用來減少幀間的時間冗餘度,隻對預測誤差畫麵(原始畫麵與運動補償預測畫麵之間的差別)加以編碼。 運動補償去除時間方向的冗餘度,最多隻能利用前後兩幀圖象間的相關性,效率不高。而實際上,尤其是在運動緩慢的圖象序列中,在連續多幀圖象間都存在著很強的時間相關性。正是由於它固有的缺陷,使得在圖象活動劇烈或低碼率通訊時,編碼器隻能通過迭用粗量化,降低幀頻或舍去更多的DCT變換係數來降低碼率,因而對信號損傷較大,丟失了許多有用的信息。在恢複圖象中將出現明顯的塊效應和運動物體邊緣的蚊音效應。
(四) 混合編碼
以兩種或兩種以上的方法對圖象進行編碼稱為混合編碼。我們熟悉的JPEG和MPEG都屬於該種類型。
1 JPEG
JPEG是處理彩色或單色靜止圖象的壓縮標準。利用它可以獲得較高的壓縮比,並保持較好的信噪比,從而大大節省圖象存儲空間,降低通訊帶寬。但是編碼過程會使物體在背景中的位置略有移動(即發生幾何畸變)。另外,高壓縮比場合,JPEG的重建圖象在水平和垂直方向可能有暈圈、幻影,產生"方塊"效應。
這不難理解.在JPEG係統中,首先把原始圖像劃分成大小相等的像素塊,然後對圖像塊進行離散餘弦變換DCT(圖像塊的能量集中到少量的係數),再利用基於人眼特性的矩陣對變換後得到的係數矩陣進行量化,從而大幅度地壓縮了矩陣係數,同時也造成了損失。最後對量化得到的矩陣係數進行無損熵編碼。圖像的重建過程是編碼過程的逆過程。在高壓縮比場合,JPEG的重建圖像在水平和垂直方向出現暈圈、幻影,產生"方塊"效應,就是因為對原始圖像進行了分塊的DCT變換和量化。如果不分塊或分塊很大而進行DCT變換與量化,那麼圖像塊中像素能量集中到少量的係數效果將變的不明顯,即不利於對數據進行量化壓縮,同時還得使計算複雜度增加。這樣一種現象實際上是離散餘弦變換DCT本身的特性所造成的(采用離散正弦變換DST或離散傅立葉變換DFT結果類似)。
2 MPEG
MPEG壓縮算法中包含兩種基本技術:一種是基於16X16子塊的運動補償技術,用來減少幀序列的時域冗餘;另一種是基於DCT的壓縮,用來減少幀序列的空間冗餘。
較為成熟的MPEG技術是MPEG1和MPEG2。MPEG1是為適應在數字存儲媒體(如CD-ROM)上有效地存取電視圖像而製定的標準(最高速率達1.5Mb/s)。它的壓縮技術基礎為:宏模塊結構、運動補償及宏模塊的有條件再補給。MPEG2是MPEG1算法的擴展。是為MPEG1最初沒有包括在內或未想到的應用提供的一種視頻編碼方法。特別是對MPEG2提出的一個要求,即它所提供的視頻質量,不能低於NTSC/PAL,最高應可達到CCIR601質量。MPEG2編碼算法的基礎為通用的混合DCT/DPCM編碼方案。
隨著MPEG1和MPEG2的廣泛應用,其缺陷也日漸顯露,主要表現在:
(1)現已製定的標準所采用的技術,當碼率很低時(低於64Kb/s)會產生嚴重的"方塊"效應、"蚊音噪聲"以及"動作失真"。而低碼率要求是移動通訊信道所必須的。
(2)編碼采用了預測編碼技術。例如采用基於塊的運動補償來去除時間相關性。但信號的糾錯能力主要依賴其相關性,特別在條件較差的信道中傳播時,幹擾造成的錯誤會迅速沿視頻序列擴散。
(3)仍停留在"幀"水平上處理視頻,而無法對視頻比特流內的各個對象(object)單獨進行編碼,解碼及操作。而這種能力正是許多交互式應用(如多媒體數據庫)所需要的。
雖然電視信號經過數字化處理後會有不同程度的損傷,有些損傷可以修複,並不影響圖象的最終質量,而有些損傷是永久性的,隻能通過一些補償措施削弱它的影響,但這並不能影響電視領域向數字化的轉變。因為與電視信號數字化後所帶來的好處相比,這些經過修複的損傷的影響往往會被人為的忽略
Adobe Premiere Pro視頻捕捉—From DV Device