用機器學習創造獨特聲音,谷歌開源 NSynth Super
也許沒有人會想到 Google 竟然會發布一款合成器,而且這款叫做 NSynth Super 的合成器可不一般 —— 就像它的名字一樣,這款合成器是基于深度神經網絡學習系統,并且完全開源。
素材來源論智
什么是NSynth Super?
NSynth Super 是谷歌研究項目 Magenta 正在進行的實驗中的一部分,該項目的目的是探索機器學習如何幫助藝術家一新方式創作藝術和音樂。
科技在創造新聲音方面一直發揮著重要作用——從聲音的扭曲到合成電音。今天,機器學習和神經網絡的進步為聲音的創作提供了新可能。
在過去研究的基礎上,Magenta 創造了 NSynth(神經合成器)。這是一種機器學習算法,利用深度神經網絡學習聲音的特征,然后根據這些特征創造出完全新的聲音。
相比于簡單的將聲音組合起來,NSynth 利用原聲音的音色重新合成了全新的聲音,所以你可以聽到一半是笛子一半是西塔琴的聲音。
自從 NSynth 發布后,Magenta 就不斷嘗試開發不同的音樂交互工具,想讓 NSynth 算法更容易上手。作為探索的一部分,Magenta 與谷歌創意實驗室(Google Creative Lab)合作,創造出了 NSynth Super。這是一款開源的實驗性工具,音樂家能通過里面默認的4種原始聲音生成全新的聲音。現在這款產品的原型正在音樂人圈子里進行小范圍的實驗,評估他們使用的感受。
NSynth Super 是如何工作的?
在這個實驗中,音樂家們在錄音室里錄制了跨 15 個音的 16 種原始聲音源,然后將其輸入到 NSynth 算法中,用算法生成新的聲音。然后將生成的超過 10 萬種新的聲音加載到產品原型中。
每個旋鈕代表四種不同的源聲音,音樂家能通過控制旋鈕選擇不同音色,然后手指在觸摸屏上滑動,將這四種聲音結合起來。
NSynth Super 可以通過任何 MIDI 源播放,例如 DAW ,音序器或者鍵盤。
NSynth 算法是如何工作的?
根據個人水平、風格不同,NSynth 利用深度神經網絡生成不同的聲音。NSynth 直接從數據中學習,可以讓藝術家直接控制音色和節湊,并能夠手動探索創造新的聲音。
NSynth 是一種算法,可以結合現有聲音的特征來生成新的聲音。為此,該算法將不同的聲音作為輸入。
使用自動編碼器,它可以從每個輸入中提取 16 個時間特征。然后將這些特征線性插入創建新的嵌入(每個聲音的數學表示)。然后將這些新的嵌入解碼成新的聲音,這些聲音具有兩個輸入的聲音質量。
和 Magenta 其他項目一樣,NSynth Super 建立在開源庫之上,例如 TensorFlow 和 openFrameworks ,目的是讓更多的藝術家、編程者和研究者體驗這一創造性的過程。NSynth Super 的開源版本包含所有開源代碼、簡圖和設計模板,都可以在GitHub上下載。
項目信息
專業評分
專業評分已截止
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)