
AI开发平台
卡卡字幕助手 | VideoCaptioner
卡卡字幕助手 | VideoCaptioner,一款基于 LLM 的智能字幕助手,无需GPU一键高质量字幕视频合成!支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效!优化、翻译,字幕视频全流程一键处理!
JanusFlow
JanusFlow,DeepSeek团队推出的一款先进的多模态人工智能模型,目的在于统一视觉理解与生成任务。它通过结合自回归语言模型和校正流技术,实现了在单一模型中同时处理图像理解和文本到图像生成的能力。
YOLO-World
YOLO-World,腾讯AI实验室开发的一个实时目标检测工具,它能够自动识别和定位图像中的各种对象
notesGPT
notesGPT,一个能够录下你的语音内容,然后自动帮助你把这些语音转成文字,对内容进行总结,并且生成相关的任务列表的AI笔记工具。
OOTDiffusion
OOTDiffusion,一个高度可控的虚拟模特服装试穿开源工具,OOTDiffusion可以根据不同性别和体型自动调整服装,可控试穿参数,自然融合与逼真效果。
Sora.FM
Sora.FM,一个使用nextjs创建的用于生成 Sora AI视频的开源Web模板。
Open WebUI
Open WebUI,一个可扩展、功能丰富且用户友好的自托管 WebUI,适用于各种 LLM 运行器,支持的 LLM 运行器包括 Ollama 和 OpenAI 兼容的 API。
Beeble AI
Beeble AI,毫不费力地改变图像和视频中的照明,实现超逼真的效果。使用Beeble AI 的创新技术,通过逼真的灯光效果增强您的创作。
LangChain
LangChain,一个用于构建基于大型语言模型(LLMs)的应用程序的开源框架。 LLMs 是根据大量数据预先训练的大型深度学习模型,LangChain可以生成对用户查询的响应,例如回答问题或根据基于文本的提示创建图像。
StreamMultiDiffusion
StreamMultiDiffusion,一种基于区域语义控制的实时交互生成图像方法,主要用于图像生成和编辑应用。它基于扩散模型在文本到图像合成中的成功,旨在通过减少推理时间和提高生成图像的质量来提高扩散模型的可用性。