終於有了一台屬於自己的MP4播放器,趕緊拷上電影、歌曲、圖片來細細把玩一番。這台播放器最難能可貴的就是支持外掛字幕,如果在旅途中用它來看電影消磨時間可真是一件美事!咦,為什麼播放電影時沒有字幕顯示?檢查了一下,字幕文件與電影文件同名且在同一個文件夾下,可為什麼不行呢?翻出說明書一查,發現它原來隻支持Srt格式的字幕文件,但筆者拷的卻是Sub格式的字幕,難怪不能顯示。看來要享受這高科技還頗費周折啊!乖乖地轉換字幕吧,把Sub格式轉換成Srt格式。
小知識:Sub格式的字幕其實是一組排好序的圖片,按照事先設定的時間依次出現在屏幕上。它一般由Sub文件和Idx文件兩個文件組成,其中Sub文件為字幕的鏡像文件,作為字幕元素的圖片就是存放在這個文件裏的;Idx文件為索引文件,也就是時間標簽,它來決定每個字幕元素出現的時間,這兩個文件互相協作,最終形成完整的字幕呈現給用戶。而Srt格式的字幕則是一個純文本,文件中包含了時間標簽和對應的字幕。
將Sub格式的字幕轉換為Srt字幕,需要SubOCR這個軟件的支持。從“OCR”的字樣看,SubOCR似乎與文本識別技術有關係。的確如此,它的用途就是把組成字幕的圖片識別成文字,最後結合Idx文件中的時間標簽把字幕保存為Srt格式的純文本字幕。
啟動SubOCR,在軟件界麵中點擊“打開”按鈕選擇《大衛魔術》的Sub字幕文件,這時軟件的界麵沒有任何變化,但字幕已經加載了。接著點擊“Command/OCR subtitel(命令/識別字幕)”,彈出一個設置對話框(如圖1),這個對話框的作用是在正式識別字幕前測試當前字幕的識別率。字幕圖片由背景色、字幕色、字幕邊框色組成(邊框色是為了讓字幕看起來更美觀,並不是必需的元素)。識別字幕就要利用這些顏色。要讓軟件準確地識別出字幕,必須告訴軟件正確的字幕顏色。圖1所示的背景色為黑色,字幕色為白色,所以用鼠標點擊一下字幕上的白色。這裏一定要點準,否則就告訴了軟件錯誤的顏色而不能識別字幕。點擊白色後在下方的“Subtitle Color(字幕顏色)”中就會顯示被點擊的顏色,在這裏可以查看是否選準了字幕的顏色。由於這裏用的是繁體中文字幕,所以還要在“Choose OCR Engine(選擇識別引擎)”中選擇“Traditional Chinese(繁體中文)”選項。下麵點擊“Try OCR(識別測試)”吧,字幕很順利地就被顯示在“Try OCR”按鈕的旁邊了,一字不差。為了保險起見,還需要多選擇幾句字幕來測試。點擊“Current(當前字幕)”旁邊的箭頭選擇不同的字幕,再點擊“Try OCR”,如果都能準確識別,說明設置已經合適了,按下“OK(確定)”後,軟件就開始對整個Sub字幕文件進行逐行掃描,並將識別後的文字顯示在軟件界麵中(如圖2)。文本識別功能不可能做到每次都是100%的準確率,如果某一句字幕識別得不夠準確,可以選中該句,再在下麵的文本框中對文字進行修改,被修改過的字幕所在行會以一個笑臉表情標明(如圖3),最後點擊工具欄上的“保存”按鈕把Srt字幕保存起來吧。
提示:這裏有個技巧,針對繁體中文字幕,一定要選擇“Traditional Chinese”選項,如果錯選了“Simplified Chinese(簡體中文)”的話會識別出很多亂碼。而對簡體中文字幕而言就可以選擇“Simplified Chinese”了。
既然SubOCR這麼強,索性多轉幾部片子的字幕吧。再打開《將計就計》的字幕,按部就班地進行下去,可這次似乎沒那麼順利了,在“Try OCR”這一步總是不能識別出任何文字,如果強行按下“OK”的話,隻能得到一堆不知所雲的亂碼。筆者靜下心來思考,為什麼兩次識別的結果會差那麼遠呢?仔細觀察字幕圖片,發現《大衛魔術》字幕的白色文字很纖細,而背景又是黑色,形成強烈的反差(如圖1),這就有利於提高識別率;再看《將計就計》,它的背景色和字幕色竟然都是白色,難怪軟件識別不出了(如圖4)。找到原因就好辦了,於是請出了字幕插件VobSub,用它來給字幕一點“顏色”瞧瞧!
從本期配刊光盤上安裝好VobSub後,點擊“開始/所有程序/VobSub/VobSub Configure”,在彈出窗口中點擊“Open(打開)”按鈕打開《將計就計》的字幕文件(*.Sub或*.Idx均可),然後選中“Custom colors(自定義顏色)”,激活下麵的顏色設置選項。這裏有4個色塊,從左到右依次表示字幕的背景色、字幕色、字幕邊框色1、字幕邊框色2,其中前兩種顏色是必須的(如圖5)。剛才提到了強烈的顏色反差有利於提高識別率,所以這裏點擊前兩個色塊,並分別選擇深藍色和白色作為字幕的背景色和字幕色(如圖6)。字幕邊框色本身為黑色,暫時不管它,點擊“OK”保存設置。現在再用SubOCR打開字幕測試識別率,看看效果是不是好多了,已經能夠正確地識別出字幕了。剩下的就不用多說了吧!
筆者在以後的轉換過程中遇到了各種不同類型的字幕,使用SubOCR都很簡單,主要技巧集中在VobSub上,針對不同類型的字幕要設置不同的顏色,下麵筆者就把總結的一些經驗拿出來與各位分享。
如果字幕的字體比較纖細,可以把字幕邊框色和字幕色設為一樣,並設置一個反差較大的背景色,這樣有利於減少顏色數量,把問題簡單化,軟件也容易識別;但如果這樣設置後由於邊框的作用使整個字體看起來很粗,甚至粗到就是一片色,反而會降低識別率,這種情況下就要為字幕設置合適的邊框色了,主要目的是為了讓文字和背景看起來層次更分明,提高識別率。有時候還會遇到這種情況,明明看起來反差很大的顏色,但就是不能正確識別,其實可以換一種顏色試一下,問題就迎刃而解了,不必在一棵樹上吊死。筆者在多次轉換字幕時發現,繁體中文引擎的“兼容性”要比簡體中文好得多,它可以準確地識別簡體、繁體中文和英文字幕,建議大家在轉換字幕時選擇繁體中文引擎。
其實把Sub格式的字幕轉換為Srt字幕的用途還不止用在MP4播放器上,有時候刻錄光盤就差那麼幾MB的空間來放SUB字幕,轉成SRT後隻會占用幾十KB的空間,問題一下就解決了。仔細觀察,還能發現它們更多的用途。
將AVI外掛字幕SRT轉成DVD影碟機可以識別的IDX+SUB文件教程