/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
1、音頻轉文字:目前市麵上的音頻轉文字大多收費。音頻轉文字的需求是:上傳一段音頻,直接識別成文字,對於會議記錄的比較好使,注意不是實時的語音識別。
2、文字轉語音:轉的語音不要太生硬。
3、截圖文字識別(OCR):截屏完成即可彈出截圖所含圖片中的文字。
4、批量圖片文字識別:選擇多張圖片,直接識別出每張圖片的文字。
5、複製翻譯:看英文文獻,有時候懶,如果能有置頂懸浮窗,實時監測剪切板,遇到想要翻譯的段落,直接複製,即可給出多國語言翻譯結果也是剛需;當然有些論文文本不能複製,所以還複用了截圖OCR的功能,對OCR結果進行翻譯。
6、圖種製作:這個不入流,純屬個人愛好,沒啥技術含量。
需求產生開發動力,基於百度AI和pyqt5製作了自己的小工具,解決了上述所有需求,需求也就就是功能了。
1、批量音頻轉文字
(1)比如批量識別小學生課文
(2)比如識別長達五分鍾的《荷塘月色》
(3)識別嶽雲鵬的相聲
2、文字轉語音
這個沒什麼好說的,輸入文字,選擇發音人、語速、音調之類的,可試聽,可生產mp3格式的音頻文件。
3、截圖OCR
點擊截圖按鈕即可截圖,自動彈出識別文字。如下動圖演示,也是個初版,界麵簡陋。
4、圖片批量識別
在截圖OCR下拉按鈕有個圖片批量文字識別功能,這都屬於OCR功能,簡單粗暴,批量選擇圖片,即可識別所有圖片中的文字。:
5、複製翻譯
看英文文獻,有時候懶,如果能有置頂懸浮窗,實時監測剪切板,遇到想要翻譯的段落,直接複製,即可給出多國語言翻譯結果也是剛需;當然有些論文文本不能複製,所以還複用了截圖OCR的功能,對OCR結果進行翻譯。6、圖種製作
沒啥意思,就是將一張圖和一個壓縮文件合並成一個圖片文件,這個生成的圖片文件打開是一張圖,如果後綴修改為zip,解壓後就能看到原先的壓縮文件。