
AI开发平台
TokenFlow
TokenFlow,一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调,即可实现一致的视频编辑效果。
EZ-Work
EZ-Work,一款开源AI文档翻译助手,帮助用户使用 OpenAI 等大型语言模型API快速且经济高效地翻译文档。支持txt、word、csv、excel、pdf、ppt等多种文档格式的翻译,适用于各种需要文档翻译的场景。
Linly-Dubbing
Linly-Dubbing,一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。
ChatTTS-Forge
ChatTTS-Forge,一个围绕 TTS生成模型开发的项目,ChatTTS-Forge为用户提供灵活的TTS生成能力,支持多种音色、风格控制、长文本推理等功能。
libcom
libcom,上海交通大学牛力教授团队推出的一款图像合成工具箱,经过六年的研发,集成了多种强大的图像处理功能。
FacePoke
FacePoke,一个实时编辑脸部表情和头部位置的AI工具。用户可以通过简单的拖放界面,轻松调整面部特征和表情,使静态的肖像变得生动。
ChatNio
ChatNio,一个集合了各种流行的模型和服务的一站式平台,提供包括 OpenAI、Midjourney、Claude、讯飞星火、Stable Diffusion、DALL·E 等一站式的解决方案
腾讯混元3D
腾讯混元3D,全称为Hunyuan3D-1.0,是腾讯推出的一款同时支持文生和图生的3D开源模型,解决现有3D生成模型在生成速度和泛化能力的不足。
PDFMathTranslate
PDFMathTranslate,一款开源的PDF文档翻译工具,专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版,包括公式和图表,并支持双语对照,保持原有目录结构。
RMBG-2.0
RMBG-2.0,BRIA AI开发的开源图像背景移除模型,RMBG-2.0基于创新的BiRefNet架构,能够在复杂环境和高细节图像中提供高精度的背景去除。