
AI快讯
XianyuAutoAgent:免费开源的智能闲鱼客服机器人系统
XianyuAutoAgent 是一个专为闲鱼平台设计的免费开源的智能客服机器人系统,它通过AI实现闲鱼平台的724小时自动化值守,能够自动回复用户消息、处理议价请求,支持多专家协同决策和上下文感知对话。
Second Me:让用户可以创建并训练自己的AI数字身份
Second Me是一个由Mindverse团队开发的开源项目,可以让用户创建和训练自己的AI数字身份,模仿你的思维、学习你的风格、记住你的习惯。
谷歌 Gemini 2.0 Flash保姆式使用教程指南
谷歌这几天的Gemini 2.0 Flash模型很火,Gemini 2.0 Flash 是谷歌推出的一款多模态人工智能模型,具备强大的图像生成和编辑能力。在本教程中,我将一步步教你如何在AI Studio来 使用Gemini 2.0 Flash 生成或编辑图片。
MoneyPrinterTurbo:只需提供一个关键词,利用AI大模型,一键生成高清短视频。
MoneyPrinterTurbo 是一个基于 AI 大模型的短视频生成工具,能够一键生成高清短视频,用户只需提供视频主题或关键词,就可以自动生成视频文案、素材、字幕和背景音乐,并合成一个完整的短视频。
OpenAI 发布了三款全新语音模型,包括两款语音转文本模型以及一款文本转语音模型
OpenAI 发布了三款全新的语音模型,包括两款语音转文本模型(GPT-4o-transcribe 和 GPT-4o-mini-transcribe)以及一款文本转语音模型(GPT-4o-mini-tts)。
OpenAI语音模型GPT-4o-transcribe、GPT-4o-mini-transcribe和GPT-4o-mini-tts的特点、定价和使用场景
OpenAI推出了新一代语音模型,为开发者提供更强大的语音交互能力,并支持语音智能体的开发。这些模型包括两款语音转文本模型(gpt-4o-transcribe和gpt-4o-mini-transcribe)以及一款文本转语音模型(gpt-4o-mini-tts)。它们分别有什么特点呢?
推荐10款优秀的免费、开源AI Agent框架
开源 AI Agent 框架是用于构建、开发和部署人工智能智能体的工具集,通常提供一系列的模块、接口和工具,帮助开发者快速实现智能体的设计、训练和交互功能。以下为你推荐10个常见的开源 AI Agent 框架。
MusicInfuser:一个可以根据音乐和文本生成舞蹈视频的模型
MusicInfuser 是一个将文本到视频扩散模型与音乐对齐的项目,能够根据音乐和文本生成舞蹈视频。它通过引入音乐-视频交叉注意力机制,使生成的视频能够与音乐节奏同步。
StarVector:用于生成可缩放矢量图形的开源多模态视觉模型
StarVector 是一种新型开源多模态视觉-语言模型,专门用于生成可缩放矢量图形(SVG)。
Fin-R1:一款基于Qwen2.5的金融推理型大语言模型
Fin-R1 是一款由上海财经大学统计与数据科学学院张立文教授团队(SUFE-AIFLM-Lab)联合财跃星辰开发的金融领域推理型大语言模型。