最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

首頁(yè) >> 今日更新 >

開(kāi)源音頻模型Stable Audio Open,文本生成47秒高清音效

2024-06-06 09:00:32 來(lái)源: 用戶: 

相信很多大家對(duì)開(kāi)源音頻模型Stable Audio Open,文本生成47秒高清音效還不知道吧,今天菲菲就帶你們一起去了解一下~.~!

6月6日,著名開(kāi)源大模型平臺(tái)Stability.ai在官網(wǎng)宣布,開(kāi)源最新文生音頻模型Stable Audio Open。

用戶通過(guò)文本就能生成最多47秒,鋼琴、笛子、鼓點(diǎn)、模擬人聲等不同類型的44.1kHz音效。

值得一提的是,Stable Audio Open支持?jǐn)?shù)據(jù)微調(diào),歌手、音樂(lè)人可以讓其生成基于自己的音樂(lè)數(shù)據(jù),例如,架子鼓手可以根據(jù)自己的鼓點(diǎn)來(lái)進(jìn)行微調(diào)。

開(kāi)源地址:https://huggingface.co/stabilityai/stable-audio-open-1.0

在線demo:https://huggingface.co/spaces/artificialguybr/Stable-Audio-Open-Zero

根據(jù)Stability.ai介紹,Stable Audio Open使用了486,492個(gè)錄音訓(xùn)練數(shù)據(jù),其中472,618個(gè)來(lái)自Freesound,13874個(gè)來(lái)自免費(fèi)音樂(lè)檔案館,并且所有音頻文件均根據(jù) CC0、CC BY或CC Sampling+獲得了商業(yè)許可。

就是說(shuō)通過(guò)Stable Audio Open生成的音效無(wú)需擔(dān)心商業(yè)化問(wèn)題,不會(huì)受到法律方面的追究。

「AIGC開(kāi)放社區(qū)」根據(jù)其提供的在線demo體驗(yàn)了一下,在文本語(yǔ)義理解、生成音效等方面還是相當(dāng)優(yōu)秀。

需要注意的是,目前只支持英文提示詞,其他任何語(yǔ)言都不行,即便你使用了識(shí)別效果也是相當(dāng)?shù)牟睢?/p>

在生成的過(guò)程中,用戶可以對(duì)時(shí)間、擴(kuò)散步數(shù)和CFG進(jìn)行詳細(xì)控制,以達(dá)到更好的效果。例如,一首非常舒適抒情的鋼琴曲。

此外,Stable Audio Open目前只能用于學(xué)術(shù)研究,還無(wú)法商業(yè)化。

以上就是關(guān)于【開(kāi)源音頻模型Stable Audio Open,文本生成47秒高清音效】的相關(guān)內(nèi)容,希望對(duì)大家有幫助!

  免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!

 
分享:
最新文章