影音處理框架FFmpeg 8.0新增Whisper過濾器,讓影片轉檔可同步語音轉錄

影音處理框架FFmpeg在即將發布的8.0版本中,加入一項名為Whisper的音訊過濾器,讓開發者在影片轉檔或串流處理的流程中,可直接進行語音轉錄。這項功能整合了OpenAI的Whisper語音辨識模型,透過內建的過濾器機制,能在不中斷處理流程的情況下,將音訊內容轉換成文字,並輸出為字幕或結構化資料。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *