SAM Audio-Meta开源的音频分割模型

SAM Audio-Meta开源的音频分割模型

文章来源：智汇AI 发布时间：2025-12-19

SAM Audio是Meta开源的音频分割模型，能通过文本、视觉和时间片段等多模态提示，从复杂的音频混合中分离出特定的声音。核心技术是Perception En

暂无访问

SAM Audio是什么

SAM Audio是Meta开源的音频分割模型，能通过文本、视觉和时间片段等多模态提示，从复杂的音频混合中分离出特定的声音。核心技术是Perception Encoder Audiovisual（PE-AV），基于Meta开源的Perception Encoder模型，能融合视听信息并进行精确的时间标注，实现高精度的音频分离。用户可以通过简单的文本描述（如“吉他声”）、在视频中点击发声物体，或者标记声音出现的时间范围来使用SAM Audio。

SAM Audio

SAM Audio的主要功能

多模态提示音频分离：通过文本描述、视觉选择（视频中的对象）或时间片段标记，从复杂音频混合中分离出特定声音。

相关推荐

最新收录

标志情报局人工智能平台官网

标志情报局人

ARC实验室ai手机版下载

ARC实验室

T-RexLabelAI下载2025版本

T-RexL

Simba下载安装AI工具

Simba下

InfinityAI下载Ai

Infini

TheDoodleLibrary人工智能ai软件免费版app下载安装

TheDoo

Super智能AI知识库AI智能下载版

Super智

Stickerboxai网站

Sticke

iConStoreAI工具app官方下载

iConSt

Let'sEnhance智能AI助手app推荐

Let'sE

IconPark图标库ai人工智能下载

IconPa

ImageColorizerAi工具软件下载

ImageC

HuiPPTai人工智能软件破解版下载

HuiPPT

Light-A-Video人工智能ai软件

Light-

HiggsfieldAI智能工具安卓版下载

Higgsf

HealthiConsai人工智能网页版

Health

快标书ai人工智能下载

快标书ai人

iConFont人工智能下载安装

iConFo

最新文章

SAM Audio-Meta开源的音频分割模型

SAM Au

马斯克：AI将创造“全民高收入” 不必要再存钱

马斯克：AI

Gemini 3 Flash-谷歌推出的最新AI模型，主打高速低成本

Gemini

韩国科技部长：中国将成比美国更大的AI竞争对手！

韩国科技部长

Seed1.8-字节跳动推出的通用Agent模型

Seed1.

免费网站推广工具助您轻松提升网站流量和知名度的最佳选择

免费网站推广

马斯克“新战书”：xAI最早明年实现AGI 两三年内超越竞争对手！

马斯克“新战

SHARP-苹果开源的3D场景生成AI模型

SHARP-

医生版ChatGPT 估值120亿美元

医生版Cha

TRELLIS.2-微软开源的40亿参数3D生成模型

TRELLI

你能不能在生活中找到属于自己的快乐与满足感

你能不能在生

仙踪林19岁RAPPER的音乐之旅：从梦想起航到舞台闪耀的传奇故事

仙踪林19岁

波多野结衣作品全集推荐热门影片解析与观影指南

波多野结衣作

法版高压监狱1时43分背后的真相与故事解析

法版高压监狱

母亲第五集完整版免费观看资源分享与剧情解析，快来观看精彩内容

母亲第五集完

久久久久久久久久久妇女，跟我聊聊女性的独特魅力与生活智慧吧！

久久久久久久

三男一女的伦交，讲述那些特殊关系背后的故事与感情纠葛

三男一女的伦

歪歪漫画首页登录页面入口环球畅享精彩漫画世界尽在掌握

歪歪漫画首页