[AI人工智慧] 你也能成為編曲大師!探索如何運用 AudioCraft 以文字創造音樂

  • 大數學堂
  • 2023年8月6日 16:30

[本影片有CC字幕] 現今人工智慧的進步為我們的生活帶來了前所未有的變革。你或許已熟悉使用ChatGPT創作文章、寫信、翻譯或是使用MidJourneyDALL-E以文字產生千變萬化的圖片,但今天,我們要談論的不僅僅是生文、生圖,我們要談論的是如何利用文字生成音樂!

沒錯,這是Meta(Facebook)公司繼Llama2 後的開源巨作 - AudioCraftAudioCraft 包括三個模型 MusicGen、AudioGen和EnCodec:
MusicGen: MusicGen 能從文字提示中產生音樂,可以為專業音樂家提供新的作曲靈感
AudioGen: AudioGen 能從文字提示中產生音效,可以產生各種環境音效,如狗叫、汽車鳴笛等
EnCodec: EnCodec是音樂生成解碼器,可以幫助模型產生更高品質的音樂

有了AudioCraft,現在你不需要專業的音樂背景,只要提供文字,AudioCraft就能為您生成旋律,音樂家可以獲取新的靈感,而中小企業主也可以輕鬆地為他們的廣告增加配樂

而啟用AudioCraft的方式也相當容易,只需追隨我們以下提供的步驟:
1. 我們需要在Colab 創建一個備有 GPU 的環境 (使用T4 的GPU 即可)
2. 我們只要下載Github 上 camenduru 提供的AudioCraft專案
3. 安裝 requirements.txt 所有相依的Python套件
4. 執行專案所附的 app.py 

這時就可以打開一個 Gradio 介面進行音樂生成啦!

有了AudioCraft,再搭配自己的音樂品味,相信在不久的將來,大家都可以成為音樂創作大師!

請不要忘記點讚和訂閱本頻道,以便獲得更多有關人工智慧相關的教學和資訊,我們下個教學見!

影片:  https://www.largitdata.com/course/230/

程式碼: https://github.com/ywchiu/largitdata/blob/master/code/Course_230.ipynb

給資料科學家的Python基礎課:  https://www.youtube.com/watch?v=uzInb5gbl4M&t=0s

大數學堂 - 學習資料科學的第一站: https://www.youtube.com/channel/UCSmvtvsTjqkvKLqpmsFWRQw