[AI人工智慧] 運用 Whisper 輕鬆打造即時字幕轉錄神器!😎

  • 大數學堂
  • April 7, 2024, 5:15 p.m.

在開會或客服通話時,有個即時顯示對話字幕的系統該有多棒!🤩 

之前我們介紹過如何用 Whisper 做語音轉文字,今天就讓我們升級挑戰,用 Whisper 和 PyAudio 打造超狂即時字幕轉錄功能!😎

首先,我們安裝好 PyAudio 和 Whisper,接著設計一個錄音函數,把麥克風輸入的聲音切成一個個 5 秒音訊小片段,
然後讓 Whisper 模型上場辨識,我們選用較小的 tiny 模型,提升轉換速度。✍️

接著我們示範如何用 Whisper 辨識音訊內容,把語音變成文字輸出 最後用一個無窮迴圈,持續辨識錄音內容,即時語音轉文字就這樣誕生啦!🎉 

最後,我們再拿 OpenAI CEO Sam Altman 的專訪,實測給你看效果有多酷!😎

如果你想要更精準的辨識結果,可以選用尺寸更大的 Whisper 模型,但記得要有 GPU 硬體資源當後盾,才能速度、準確度兩者兼顧,打造媲美真人的即時字幕系統😲

跟著這個教學,你也可以輕鬆駕馭 Whisper 語音辨識引擎,快速做出自己的即時語音轉文字應用!😘

千萬別忘了訂閱支持我們,然後在留言區跟大家分享你的想法喔!👍

我們下個影片見面!👩‍💻👨‍💻🚀

另外,你是否經常需要製作字幕或進行逐字稿的工作呢?如果您覺得每次重複聆聽並逐字打字過於繁瑣,不妨試試我們最新研發的人工智慧工具 - AIMochi,只要透過Line,就可以免費將語音檔轉換成文字了喔!

就像本教學影片的字幕檔也是透過AIMochi 輕鬆完成的歐!

請立即開啟Line並加AIMochi好友,就能立刻體驗這項便利的服務喔。
https://line.me/R/ti/p/@aimochi

影片:  
https://www.largitdata.com/course/241/

程式碼: 
https://github.com/ywchiu/largitdata/blob/master/code/Course_241.ipynb

[ChatGPT] Whisper還是剪映?選擇最佳字幕創建工具讓你的影片更專業!
https://www.largitdata.com/course/221/

[ChatGPT] 如何使用Whisper API 與 ChatGPT API 快速摘要YouTube 影片?
https://largitdata.com/course/220/ 

給資料科學家的Python基礎課:  
https://www.youtube.com/watch?v=uzInb5gbl4M&t=0s

大數學堂 - 學習資料科學的第一站: 
https://www.youtube.com/channel/UCSmvtvsTjqkvKLqpmsFWRQw

AIMochi
https://www.aimochi.ai/