AudioGenie-腾讯AI Lab推出的多模态音频生成工具

AudioGenie-腾讯AI Lab推出的多模态音频生成工具

文章来源：智汇AI 发布时间：2025-08-21

AudioGenie是腾讯AI Lab团队推出的多模态音频生成工具，能从视频、文本、图像等多种模态输入生成音效、语音、音乐等多种音频输出。工具采用无训练的多智能

暂无访问

AudioGenie是什么

AudioGenie是腾讯AI Lab团队推出的多模态音频生成工具，能从视频、文本、图像等多种模态输入生成音效、语音、音乐等多种音频输出。工具采用无训练的多智能体框架，通过生成团队和监督团队的双层架构实现高效协同。生成团队负责将复杂的输入分解为具体的音频子事件，通过自适应混合专家（MoE）协作机制动态选择最适合的模型进行生成。监督团队则负责时空一致性验证，通过反馈循环进行自我纠错，确保生成的音频高度可靠。

AudioGenie建立了全球首个针对多模态到多音频生成（MM2MA）任务的基准测试集MA-Bench，包含198个带有多类型音频注释的视频。在测试中，AudioGenie在9项指标、8项任务中均达到或接近最先进水平，尤其在音质、准确性、内容对齐和美学体验方面表现出色。

AudioGenie

AudioGenie的主要功能

多模态输入与多音频输出：支持从视频、文本、图像等多种模态输入，生成音效、语音、音乐等多种音频类型。

相关推荐

最新收录

灰色AI|GreyAiai人工智能免费版

灰色AI|G

FreeMindai人工智能永久免费版

FreeMi

PhotoStudioai智能软件免费版

PhotoS

DeepLiveCamAI人工智能助手

DeepLi

问鸭AI人工ai智能软件

问鸭AI人工

EZapiAI人工智能助手

EZapiA

Xmindaiapp官方免费下载安装

Xminda

Jay创作AI下载

Jay创作A

Mukuai工具合集免费下载

Mukuai

金舟AI助手ai智能下载安装

金舟AI助手

硅语ai人工智能软件下载官方正版

硅语ai人工

HolaraAI人工智能ai软件免费版app

Holara

幕布智能工具app官方下载

幕布智能工具

晨羽AI效果图AIapp安卓版官方下载

晨羽AI效果

创一ai下载官方版安装

创一ai下载

萌军师AI写作AIapp安卓版官方下载

萌军师AI写

智能答人AI下载

智能答人AI

触手AI智能工具app官方下载

触手AI智能

最新文章

AudioGenie-腾讯AI Lab推出的多模态音频生成工具

AudioG

0.95米，星动纪元星动L7获首届世界人形机器人运动会跳高冠军

0.95米，

挑战GPT-4o！阿里开源Qwen-Image-Edit模型，在中文图像渲染与编辑上取得突破

挑战GPT-

企业微信5.0官宣：三大AI能力重磅上线连接真实企业超1400万

企业微信5.

Qwen-Image-Edit-阿里通义推出的全能图像编辑模型

Qwen-I

暗区突围s5新武器有哪些暗区突围s5新武器道具介绍

暗区突围s5

网友称“Deepseek演都不演了”：输入手机内存不够“二选一删谁” 秒回答豆包

网友称“De

无码精品亚洲AV日韩同人：藏在深夜流量里的内容江湖

无码精品亚洲

Open-Lovable-Firecrawl开源的AI网站克隆工具

Open-L

淘宝神秘新功能“AI万能搜”来了！灰度测试开启，购物方式要变天了？

淘宝神秘新功

《胜利女神：新的希望》贝伊介绍

《胜利女神：

全球首个执行型AI助手！国产智能体AutoGLM发布

全球首个执行

数据“中毒”AI还能靠谱吗？央视起底AI数据污染乱象

数据“中毒”

Klear-Reasoner-快手开源的推理模型

Klear-

三角洲行动武器强度介绍三角洲行动武器强度一览

三角洲行动武

首发6999元微星推出MPG 271QR QD-OLED X50流光：2K 500Hz、集成多种AI功能

首发6999

Nano Banana-AI图像编辑模型，具有极高的人物一致性

Nano B

Hailuo MiniMax重磅回归：Higgsfield平台无限免费生成1080p视频！

Hailuo