1)老枯得益於網上的豐富資源,摸索DV1394和MPEG編碼算是入門了。為了回報網友,寫了這篇tmpgenc12a參數設定詳解,希望能對大家有用。
2)本來呢,tmpgenc雖然沒有help文件,但在各個選項的note幫助中已經提供了不少的解釋,威龍已經在這方麵做了很多了努力,所以老枯這裏的很多東西都隻是隨機注釋的擴展而已。
3)要想深入理解mpeg encoder的參數設置,一定要對mpeg標準有了解。老枯以前曾搞過圖像處理和壓縮專業,所以主要從各個參數的原理上做一些自以為是的解釋,使用tmpgenc的實戰經驗方麵我本人也有限,大慶的文章圖文並茂可以說是實戰指南,請大家參考。
4)本文沒有涉及tmpgenc的菜單部分,因為影響mpeg編碼效率/質量的主要是參數設置。菜單提供了一些很好的功能,比如壓縮完成自動關機等,請大家自己摸索。
5)水平有限,現眼之處請指正,,赫赫。。另外,枯癡版權,歡迎轉載。。
A. video(視頻)部分:
本部分設定輸出的視頻碼流的類型和參數,大部分參數在模版中已經固定。
1)基本類型:有mpeg1/mpeg2,mpeg1用於vcd, mpeg2用於svcd/dvd.
2)大小:PAL vcd標準為352x288, pal svcd標準為480x576, pal dvd標準為720x576
3)畫麵寬高比:一般應該用4:3 625 line PAL, 這是電視機的屏幕比例
4)楨率:pal 的標準為25fps
5) 碼率控製:碼率控製算法是造成各種編碼器編碼效率和質量不同的關鍵因素。mpeg標準中並沒有對次算法的具體實現做規定,這通常也是商業版本的知識產權內容。
CBR, 固定碼率:保持碼率基本維持在平均碼率。實現簡單,對複雜場景會因碼率不足造成馬賽克現象,對於簡單場景則不能充分利用編碼空間。(老枯這裏講的複雜場景是指細節/邊緣豐富以及快速變化場景)。
VBR, (2-pass VBR), “二次處理VBR”。,老枯認為其意思是通過對整個視頻源進行2次處理使編碼效率最高:第一遍判斷何處為複雜場景和簡單場景,第二遍根據碼率的上下限,把碼率重新分配更多給複雜場景。可以在實驗中看出,tmpgenc在進行這種編碼時進度指示在50%以前是沒有預覽圖象的,而且楨進度指示為0。所以老枯建議威龍改譯為“二次處理”。這種碼流控製方式應該在給定碼率下得到最好的質量,但是和具體2次分配算法關係很大。同時耗時最長。一些其他編碼器甚至有3次處理的碼率優化。
MVBR (手動可變碼率),設定最大碼率和對不同的幀類型設定不同的信息損失量,實現局部碼率優化。可以通過手工指定複雜場景為I幀對之進行較精細的編碼。參見對於GOP參數設定部分。
CQ-VBR (自動可變碼率),設定主觀質量值和碼率上下限,以主觀質量標準對編碼器量化環節進行控製,在可選參數中設定主觀質量值以後,編碼器就在能達到此質量標準的前提下盡量節省碼率。關鍵在於編碼器對主觀質量的評價方法。這是CQ和VBR的綜合,也可以看作自動的MVBR. 威龍漢化5版在可選參數中有一行是“不破壞最小碼率的狀態而填充數據”,老枯的理解是,如果碼率過低就填充無意義碼(好浪費啊,不過可能是為了兼容性的原因),英文版這一句沒有翻譯,還是日文。 :-(
CQ (固定品質),就是比MVBR多了一個主觀質量值的設定。老枯不明白到底是怎麼控製的。
RT-CBR (實時固定碼率):連GOP層次的碼率優化也不做了的CBR,快一點,質量不高
RT-CQ (實時固定品質):連GOP層次的碼率優化也不做了的CQ,快一點,質量不高
6)碼率:這個碼率是指CBR方式下的平均碼率
7)VBV緩衝區大小:緩衝區大的話,編碼優化會好一些,但是解碼的時候也要求大一些的緩衝區。因此,vcd/svcd標準中參數是固定的,否則可能機器無法播放。
8)Pofile & level(類別與級別): 這個參數是mpeg1沒有的。在svcd/dvd應用中應該是MP&ML,模版自動選定。 MP&HL是為HDTV定義的,分辨率可以高達 19??x11?? .
9)製式:好象這個也是mpeg2相關的參數。我們應該用PAL.
10) 隔行掃描:mpeg1隻支持逐行掃描(25 frame/sec),mpeg2可以選擇隔行(50 field/sec)。如果成品在電視上播放,老枯建議選擇隔行,使運動平滑。但是隔行的視頻在pc上看會有毛刺現象,在水平運動景象中尤其明顯。
11)播放時實現3:2下拉: 這是在film/NTSC製式轉換中需要的,即在編碼時維持幀率不變,不做3:2下拉,而在播放中實現。參見 B.advanced部分。感謝威龍指正。
12)YUV格式:給亮度/紅色差/藍色差分配的碼位。對於人眼來說,亮度信號是最敏感的,所以就分配比較多的編碼空間以求精細,對於色差則粗糙些。一般就是4:2:0了。(其實4:2:0方案給藍色差的碼位不是0,老枯不知道為什麼這樣寫)
13)DC分量精度:在mpeg編碼中需要對8x8的圖象塊進行DCT(離散餘弦變換),DC分量的意義基本是代表8x8塊中的平均值,一般需要為之分配比較大的編碼空間,否則馬賽克的邊緣效應就比較明顯。(8bit就不小啦,圖象壓縮中是每個bit的油水都要榨幹的)
14)運動檢測精度:mpeg是對I幀進行幀內編碼,對P幀進行預測誤差編碼。就是對於P幀的圖塊,在I幀中尋找對應的部分,然後對兩個圖塊的差異部分進行編碼,可以大大節省碼率。運動檢測精度越高,圖塊搜索匹配的範圍越大,編碼效率越高,同時編碼速度越慢。這部分算法同樣沒有在mpeg標準中定義,各個廠商實現水平相差會很大。一般來說,在tmpgenc中設置為普通即可。
B. Advanced (影象源)部分:
本部分設置視頻源相關的參數,以及在編碼之前對視頻源進行的預處理。
1)視頻源類型:隔行掃描/逐行掃描。這個參數在打開視頻源文件的時候會對之自動判斷設置。Tmpgenc12版不能自動識別type 1 DV,在12a版本中已經解決。參看老枯的編碼測試頁。
2)場順序:這是整個tmpgenc甚至整個桌麵視頻領域中最混亂的一部分。tmpgenc12a好象也不能根據視頻源自動設置這個參數。老枯在這個問題上搞了很久,才算明白了一點。這個參數是至關重要的,設置反了會造成生成圖象的明顯閃動,打個比方,一個物體的運動位置次序本來是1-2-3-4-5-6-7。。。,設置反了以後就成了2-1-4-3-6-5-8。。。對於模擬視頻源,其場序是由捕捉卡類型決定的,對於dv,則定義為 field order A。講到這裏還沒有什麼麻煩,但麻煩的是雖然場序隻有2種,對於他們的叫法卻有3種: field order A/B (在ulead軟件中的叫法), even/odd line first (tmpgenc的叫法), field top/bottom first(bitrate viewer叫法),這3種叫法之間的對應關係是最讓人頭疼的。在英文版的tmpgenc12a中,缺省的設置為“even line first (field A)”,,但在威龍漢化中缺省設置為“奇數場->偶數場”,老枯曾就此請教威龍,威龍講這是日文版的原意,注意不要在字麵上混淆了。總之,3種叫法的關係是這樣的:field A = even l