AI开发平台

DDColor图像上色

DDColor图像上色,一个为黑白图像上色的魔搭模型,通过双解码器实现逼真的图像着色,输入一张黑白图像,实现端到端的全图上色,返回上色处理后的彩色图像。

PhotoMaker

PhotoMaker,PhotoMaker:利用多张照片作为身份ID,获取人物特征,然后根据描述生成一个新的、个性化的人物图像。

GPT-SoVITS

GPT-SoVITS,一个声音克隆和文本到语音转换的开源 Python RAG框架,只需1分钟语音即可训练一个自己的TTS模型。

DiffusionGPT

DiffusionGPT,字节跳动开发的由LLM驱动文本生成图像多合一系统,专门设计用于为不同的输入提示生成高质量的图像。

SupIR

SupIR,基于大规模扩散的高保真通用图像恢复模型,SupIR能够根据文本提示进行智能修复,提高图像修复的质量和智能程度。

Diffuse to Choose

Diffuse to Choose,一种基于扩散的图像修复模型,主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节,适用于在线购物等虚拟试穿场景中的图像修复任务。

StreamRAG

StreamRAG,一个视频搜索和流媒体代理工具,能让您在 ChatGPT 中与您的视频库聊天并观看视频流。

WhisperFusion

WhisperFusion,一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。

Audio2Face

Audio2Face,一款由AI驱动的应用程序,通过语音生成富有表现力的3D面部动画。

YouDub-Webui

YouDub-Webui,一款开源的多语言AI配音和视频翻译工具,优质视频中文化工具,YouDub-webui提供了一套完整的视频中文化工具包,涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。