英伟达发布全新 AI 音频模型 Fugatto

英伟达即日推出了一款名为 Fugatto（全称为 Foundational Generative Audio Transformer Opus 1）的 AI 音频模子。这款模子不但能通过文字提示天生音乐和音效，还能对现有音频举行修正和转换，创造出空前未有的声响组合。

据英伟达先容，Fugatto 具备众项特别性能，比方能够将钢琴吹奏的音乐转换为人声演唱，也许调度语音的口音和心境，以至能够创造出尖叫的萨克斯或犬吠般的小号声等超实际音效。该模子采用了改进的 ComposableART 工夫，也许将磨练历程平分别产生的音频特性举行组合，从而发作全新的声响功效。

正在工夫层面，推敲团队利用了来自环球众个开源数据集的约 2000 万个音频样本举行磨练，酿成了一个具有 25 亿参数的大范围模子。该项目由来自印度、巴西、中邦、约旦和韩邦等众个邦度的推敲职员配合开辟，这种众元化的团队组成也使得模子正在管束众讲话和众重口音方面展现出众。

英伟达行使深度练习推敲副总裁 Bryan Catanzaro 吐露，天生式 AI 工夫将为音乐、逛戏和一般创作家带来全新的创作恐怕性。但是，思虑到天生式工夫恐怕带来的潜正在危害，英伟达目前尚未计算对外宣告这项工夫。