硬字幕提取工具提供字幕識別功能,可以直接對視頻字幕區域截圖,隨后在軟件上對全部圖像識別,輕松獲取視頻字幕,如果你需要提取一個電視、電影的字幕作為新的文案使用就可以下載這款軟件識別字幕,可以導入任意視頻到軟件上截圖,全部圖像都可以預覽,使用百度OCR引擎就可以對全部圖像字幕識別,從而將全部文字顯示在軟件界面,方便預覽識別后的文字是否正確,文字都可以保存到SRT格式,方便以后在其他視頻軟件上加載字幕文件,需要就可以下載使用!
1、硬字幕提取工具提供字幕提取功能,直接從視頻上復制字幕
2、可以通過OCR的方式提取字幕,從而生成SRT字幕文件
3、軟件界面很簡單,配置百度OCR識別引擎就可以開始工作
4、可以在軟件截圖識別文字,對當前視頻畫面的字幕內容截取
5、任意視頻都可以添加到軟件截圖識別,可以在軟件顯示文字內容
6、支持文字校對功能,可以修改識別后的字幕內容
7、支持增強圖片功能,截圖識別的字幕圖像可以增強顯示效果
8、支持縮放圖像,可以在軟件調整縮放的比例,也支持字號顯示設置
1、硬字幕提取工具界面功能豐富,可以輕松,截圖識別字幕內容
2、可以借助VideoSubFinder打開本地的視頻,從而提取字幕
3、可以在軟件界面顯示全部截圖,可以快速識別字幕內容
4、附加幫助內容,可以顯示官方的教程文檔,讓用戶快速上手
5、支持通用高清識別,支持多張字幕圖像合并為一張識別
6、識別的文字直接在軟件界面顯示,方便后期對錯誤的內容修改,也可以中英混合識別
1、下載軟件以后打開文件夾,可以看到Word幫助文件和主程序,可以打開幫助文件查看教程
2、軟件界面如圖所示,您需要使用百度OCR識別工具,可以到https://ai.baidu.com/tech/ocr/general申請
3、其他的OCR識別引擎也可以自己設置,申請完畢輸入PID,輸入KEY調用識別引擎
4、隨后打開視頻,截圖識別字幕,將字幕顯示在軟件上
具體步驟如下所述:
步驟1、準備百度OCR服務APP_ID / API_KEY / SECRET_KEY
到https://ai.baidu.com/tech/ocr/general 注冊獲取百度通用文字識別服務的APP_ID / API_KEY / SECRET_KEY,
一個手機號碼注冊一個賬號(須實名認證)。
每賬號每天免費識別次數有規定(依精度不同從每天500次到每月1000次不等,每次識別1張圖片,具體政策由廠家規定),如不夠用可多注冊幾個賬號,同時廠家經常有優惠活動(例如百度1元購1W次,訊飛0元購10W次,搜狗有道新注冊送50、100元等)。對于長期需求用戶,建議充點錢購買次數吧,價格不貴,還能支持國家高科技發展。
注冊步驟很簡單,可自行百度,獲得的APP_ID / API_KEY / SECRET_KEY信息先保存起來下面會用到。
類似的:
搜狗OCR到https://deepi.sogou.com/ 注冊。
有道OCR到https://ai.youdao.com/product-ocr-print.s 注冊。
訊飛OCR到https://www.xfyun.cn/service/textRecg 注冊。(如需要用W模式支持最佳空格識別效果,請選文字識別 -- 印刷文字識別(多語種),服務接口認證信息為三項:APPID、APISecret、APIKey)
步驟2、準備工作流程中將會用到的APP1、APP2第三方軟件
到https://sourceforge.net/projects/videosubfinder/?stars=5 下載安裝VideoSubFinder_5.50_x64 作為APP1
到https://github.com/SubtitleEdit/subtitleedit/releases 下載安裝Subtitle Edit 3.5.18作為 APP2
注:APP2 不指定,可以選用戶熟悉的其他軟件,例如SubtitleEdit可換成Aegisub或 ArcTime
步驟3、設置硬字幕提取工具
打開工具,
點擊‘系統設置’
填入步驟1獲得的百度OCR服務APP_ID / API_KEY / SECRET_KEY
點Browse找到步驟2安裝好的APP的入口exe文件,APP1、APP2順序不要錯,然后Save保存設置。
這時,主界面的APP1、APP2 按鍵將顯示剛才設置好的exe文件名
步驟4、用VideoSubFinder_5.50_x64生成RGBImages
點擊主界面VideoSubF按鍵,將啟動運行VideoSubFinder_5.50_x64
點擊左上角File -> Open Video(FFMPEG),打開要提取字幕的視頻文件(本例為:倚天屠龍記之魔教教主-中字.mp4)
快速瀏覽全片,查看字幕區間矩形最大范圍(注意有些視頻是兩層字幕),用兩根豎線兩根橫線設置字幕截圖區間(四根線在視頻邊緣不容易發現,試著點擊選中可以移動它)。注意:矩形邊框要比實際字幕稍大,不要為了節省圖片尺寸而把區間設置成緊貼字幕,如果字幕周邊余量太小,會影響后續百度OCR識別(當然也沒必要設置得太大)。
點擊Search右邊的Settings,出現設置界面,我們只關心左邊這塊能影響Search字幕圖片的參數。
第一個參數‘Text Alignment’默認設置是‘Center’,須要點擊設置成‘Any’。
其他眾多參數中,有一個參數至關重要,就是Use Filter Colors這項,default值是空的,其他參數可以不設,這個一定要設置上,特別是非純白字幕,例如黃色!如果不設置,有大幾率會漏字幕。
我們需要取色字幕文字的骨干顏色(骨干外則是字幕輪廓顏色,不要取偏了),然后將顏色值填入,將有助于VideoSubFinder判斷字幕出現和結束的時間,生成正確的時間軸信息,并防止丟時間軸。常見字幕顏色可能有白色的、黃色的,或者其他顏色,本例電影的字幕是白色。如果是多色字幕,可以按VSF要求取色多色填入。
具體的參數設置,可以參考Docs目錄下的readme_eng.txt,專業用戶精調參數可以提高Search字幕幀的準確率,從而減少丟時間軸(少字幕圖片,致命)和假時間軸(空字幕圖片,影響不大)的情況,不過據筆者使用經驗,如果沒弄明白參數含義和作用,隨意調整反而適得其反,普通用戶還不如不調的好。
在右邊界面先點一下Pixel Color
然后點擊字幕白色文字中心骨干取色,點不準可以多點幾下。
取到了顏色,會顯示出來
本例將Lab: l:245 a:127 b:129 拷貝后雙擊填入Use Filter Coloers,一般做了這步就可以基本保證不會有時間軸丟失的情況,算是完成了Search的設置。
點擊Search -> Clear Foders 清空RGBImages目錄,
然后點 OCR Search,程序開始掃描視頻文件,生成RGBImages。
幾分鐘后掃描完成,可以關掉VideoSubFinder_5.50_x64,初次使用我們可以打開RGBImages目錄看一下
這些是剛才VideoSubFinder_5.50_x64 Search生成的1000多個字幕切片圖片文件,說明這個電影有1000多條字幕呢。文件名前段為時間軸信息。
打開文件看看,是RGB原色字幕截圖切片,很適合喂給百度AI過的OCR引擎做識別。
網友評論