AI快讯

CogView4:全球首个支持生成汉字的开源文生图生成模型

CogView4是由智谱AI发布的首个支持中英双语提示词的开源文生图模型,也是全球首个支持生成汉字的开源文生图生成模型,非常适合做广告、短视频创作等。

微信推出的“瘦身”新功能在哪里?

微信在这几天的热更新中推出了新的“瘦身”功能,可以帮助用户清理微信聊天记录中的原图、原视频,更好释放存储空间,那新增“瘦身”功能在哪里,如何操作?

DiffRhythm:全球首个基于扩散模型的端到端音乐生成工具

DiffRhythm是全球首个基于扩散模型的端到端AI音乐生成工具,只要输入歌词、风格、情感等文字描述,不需要人工干预就可以帮你轻松创作属于自己的音乐作品。

Umi-OCR:免费,开源,可批量的离线OCR工具

Umi-OCR 是一款基于百度的 PaddleOCR 框架开发的开源、免费的离线OCR 工具,支持截屏 批量导入图片,PDF文档识别,排除水印 页眉页脚,扫描 生成二维码,内置多国语言库等功能。

iPhone快捷指令设置教程大全手册

iPhone 的“快捷指令”(Shortcuts)是苹果公司推出的一个内置的应用程序,可以让你使用 App 完成一个或多个任务的快捷方式。以下为你列出iPhone快捷指令设置使用教程。

MTranServer:一个超低资源消耗超快的离线翻译服务器开源项目

MTranServer是什么?MTranServer 是一个超低资源消耗超快的离线翻译服务器开源项目,基于 Mozilla Firefox 翻译模型。仅需 CP

Mahilo:一款AI多智能体人机协作框架,适合紧急响应、客户服务和团队协作

Mahilo 是一个灵活的多Agent系统框架,它支持实时API和语音交互,可以自定义智能体,也支持集成其他框架的智能体,适合需要多个智能体协作的复杂场景,例如紧急响应、客户服务和团队协作。

即梦AI生成数字人教程指南,让图片“活过来”

你刷短视频时,是否也常被那些活灵活现的数字人吸引?他们不用露脸却能侃侃而谈,带货、讲知识、分享生活样样在行。其实,这样的‘数字分身’用即梦AI和剪映就能轻松搞定!

Markdownify-MCP:能将多种文件类型和网页内容转换为Markdown格式

Markdownify-MCP 是一个基于 Model Context Protocol (MCP) 的服务器工具,能够将多种文件类型和网页内容转换为 Markdown 格式。

ComfyUI-RMBG: 完美人物抠图,背景移除,精准识别分割

ComfyUI-RMBG 是一个基于 AI 技术的图片处理工具,主要用于背景移除和物体分割。它集成了RMBG-2.0、InSPYRENET 和 BEN 等多种先进的模型,可以高效、精准地完成抠图任务。