AI开发平台

TokenFlow

TokenFlow,一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调,即可实现一致的视频编辑效果。

EZ-Work

EZ-Work,一款开源AI文档翻译助手,帮助用户使用 OpenAI 等大型语言模型API快速且经济高效地翻译文档。支持txt、word、csv、excel、pdf、ppt等多种文档格式的翻译,适用于各种需要文档翻译的场景。

Linly-Dubbing

Linly-Dubbing,一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。

ChatTTS-Forge

ChatTTS-Forge,一个围绕 TTS生成模型开发的项目,ChatTTS-Forge为用户提供灵活的TTS生成能力,支持多种音色、风格控制、长文本推理等功能。

libcom

libcom,上海交通大学牛力教授团队推出的一款图像合成工具箱,经过六年的研发,集成了多种强大的图像处理功能。

FacePoke

FacePoke,一个实时编辑脸部表情和头部位置的AI工具。用户可以通过简单的拖放界面,轻松调整面部特征和表情,使静态的肖像变得生动。

ChatNio

ChatNio,一个集合了各种流行的模型和服务的一站式平台,提供包括 OpenAI、Midjourney、Claude、讯飞星火、Stable Diffusion、DALL·E 等一站式的解决方案

腾讯混元3D

腾讯混元3D,全称为Hunyuan3D-1.0,是腾讯推出的一款同时支持文生和图生的3D开源模型,解决现有3D生成模型在生成速度和泛化能力的不足。

PDFMathTranslate

PDFMathTranslate,一款开源的PDF文档翻译工具,专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版,包括公式和图表,并支持双语对照,保持原有目录结构。

RMBG-2.0

RMBG-2.0,BRIA AI开发的开源图像背景移除模型,RMBG-2.0基于创新的BiRefNet架构,能够在复杂环境和高细节图像中提供高精度的背景去除。