全球首个!英伟达发布了一把用于“声音的瑞士军刀”
11月26日讯,全球英伟达近日展示了其最新研发的首个声音士军人工智能模型——Fugatto。
Fugatto是英伟用于一款基于生成式Transformer架构的人工智能模型,其完整版配备了25亿个参数,达发的瑞刀并在由32个NVIDIA H100 Tensor Core GPU组成的布把NVIDIA DGX系统上进行了训练。
这款模型的全球主要功能在于能够修改和生成声音效果,专为音乐、首个声音士军电影和视频游戏制作人设计,英伟用于英伟达将其形象地称为“声音的达发的瑞刀瑞士军刀”。
据NVIDIA应用音频研究经理Rafael Valle透露,布把Fugatto的全球研发初衷是创建一个能够像人类一样理解和生成声音的模型。
它支持多种音频生成和转换任务,首个声音士军是英伟用于首个展示紧急属性的基础生成式AI模型,这得益于其各种训练能力的达发的瑞刀交互以及组合自由格式指令的能力。
Fugatto的布把功能十分强大,能够根据文本描述生成音效和音乐,例如将钢琴演奏转换成人声歌唱,或改变录音的口音和情绪。
对于音乐制作人而言,Fugatto可以帮助他们快速制作原型或编辑歌曲创意,尝试不同的风格、声音和乐器,同时添加效果并提高现有轨道的整体音频质量。
广告代理商则可以利用Fugatto快速定位多个地区或情况的现有广告活动,将不同的口音和情感应用于画外音。
视频游戏开发人员则可以使用该模型修改游戏中预先录制的素材,或根据文本说明和可选的音频输入动态创建新素材。
另外,Fugatto 的新颖性主要体现在以下方面:
首先,在推理过程中,该模型采用了称为ComposableART的技术,能够组合在训练期间只能单独看到的指令。
例如,通过组合提示,可以要求模型以法国口音说出带有悲伤情绪的文本。
此外,该模型在指令之间进行插值的能力使用户能够对文本指令进行精细控制,如重音的沉重程度或悲伤的程度。
其次,Fugatto还能够生成随时间变化的声音,NVIDIA将这一功能称为时间插值。
例如,它可以模拟暴雨穿过区域的声音,雷声逐渐增强,然后慢慢消失在远处。这一功能使用户能够精细地控制音景的演变方式。
最后,与大多数只能重现所接触的训练数据的模型不同,Fugatto允许用户创建以前从未见过的音景。
例如,它可以模拟雷雨随着鸟儿的歌声缓和为黎明的场景。
总而言之,Fugatto凭借其功能多样性和创新性,在音频领域具有广阔的发展空间。
- ·[流言板]马雷斯卡已2次警告马杜埃克训练态度问题,周中似乎是第三次
- ·【直播】这谁播的过你啊?Uzi和Ming把周榜前6的ID贴在了队服上
- ·《明末:渊虚之羽》官推新宣传图 释放真正的力量
- ·创造历史!打封闭助中国夺世锦赛首金,商春松说弥补了体操上的遗憾!
- ·可惜!巴斯克斯突入禁区,打近角被门将扑出
- ·[情报站]Gumayusi更新自拍:我剪头发啦,Gumayusi长发团解散
- ·中国人开中国最强燃油车征战纽北:领克03+TCR CYAN成绩出炉
- ·终结日本17年垄断:三星OLED核心材料实现供应链国产化
- ·4次扑救完成零封,英超官方:桑切斯当选切尔西0
- ·[流言板]躺赢!勇士今日无比赛但升至西部联盟第一,因雷霆输球
- ·《使命召唤》成功带动XGP:会员激活码销量暴涨
- ·准就是准啊!杜兰特14中8得到26分5板4助1断2帽
- ·7成用户不接受涨价没用!国产手机涨价潮背后:一颗芯片涨超200元
- ·轻薄、续航、性能全都有!联想ThinkPad X1 Carbon Aura AI 2025开启预约
- ·《明末:渊虚之羽》官推新宣传图 释放真正的力量
- ·猎鹰这队怎么能和faze打到加时的
- ·姆巴佩本赛季联赛已有2次单场关键传球5+,此前巴黎4年仅1次
- ·《异度神剑X终极版》基于欧美版开发审查严格 女主胸部大小调整被阉割
- ·作者打不过也得练 《星露谷物语》作者终于达成游戏全成就
- ·轻薄、续航、性能全都有!联想ThinkPad X1 Carbon Aura AI 2025开启预约
- ·马兹拉维送点!小克鲁伊维特边路爆破造点,亲自主罚点球稳稳命中
- ·中国月壤砖接受太空检验 为月球上盖房子探路
- ·11位国际精英选手挑战南马 董国建领衔国内选手参赛
- ·[流言板]连丢十球!克莱后仰跳投不中,连续投丢十球
- ·[流言板]今天很准!比尔底角撤步三分命中,太阳开局三分4中4
- ·努尔基奇罚球绝杀!KD分球奥尼尔抛投不中 太阳一顿补篮造成犯规