AI文章

ConsistentDreamer – 华为推出的单张图像生成 3D 资产技术

ConsistentDreamer 是华为慕尼黑研究中心提出的新型图像到 3D 资产生成技术,通过单张图像生成视图一致的 3D 网格。方法通过多视图先验图像引导的高斯优化,解决了传统方法在多视图一致性上的不足。

谷歌《智能体Agent》白皮书(中文版)

人类擅长处理杂乱无章的模式识别任务。然而,他们往往依赖工具 - 在得出结论之前,人工智能模型可以使用书籍、谷歌搜索或计算器等工具来补充其已有知识。就像人类一样,生成式人工智能模型也可以训练使用工具来获取实时信息或建议现实世界中的行动。

Cline – AI编程助手,集成于 VSCode 实时检查语法错误

Cline 是集成于 VSCode 的 AI 编程助手,通过智能化手段提升开发效率。具备强大的代码生成与编辑能力,能根据用户需求快速创建或修改代码文件,实时检查语法错误。Cline 支持在终端执行命令,帮助开发者完成诸如安装依赖、运行脚本等操作。

如何用AI制作爆款武打视频,3分钟学会

我发现短视频平台,越来越多的人在用AI搞抽象了。比如这种武 打对决,简直是流量密码。这几天我测试了好几种AI工具,发现用海螺AI做这种武打视频是最简单的,关键是免费,无需魔法,打斗效果特别带劲。

腾讯混元T1 – 腾讯混元推出的最新深度思考模型

T1(Thinker)是腾讯混元推出的最新深度思考模型,已正式上线接入腾讯元宝。模型专注于逻辑推理和深度思考,支持联网搜索功能,能从互联网信源、微信公众号、视频号等腾讯生态内容中获取信息,确保回答的时新性和权威性。

清影2.0重磅更新,AI图生视频效果实测惊艳!

清影2.0今天更新了。作为国内最早全线上线C端的产品,智谱清言的硬实力有目共睹。 整体看了一下清影2.0的效果,模型质量上太惊艳了,AI视频似乎又迎来了新的巅峰。

ImageRAG – 基于检索增强生成的图像生成技术

ImageRAG 是基于检索增强生成(Retrieval-Augmented Generation, RAG)的图像生成技术,通过动态检索相关图像来提升文本到图像(T2I)模型生成罕见或未见概念的能力。基于现有的图像条件模型,无需特定的 RAG 训练,可改善生成图像的真实度和相关性。

X-R1 – 基于强化学习的低成本训练框架

X-R1是基于强化学习的低成本训练框架,能加速大规模语言模型的后训练(Scaling Post-Training)开发。X-R1用极低的成本训练0.5B(5亿参数)规模的R1-Zero模型,仅需4块3090或4090 GPU,训练时间约1小时,成本低于10美元。

DeepSeek 提示词技巧,10种具体技巧

文章介绍了DeepSeek提示词技巧,通过优化指令输入的方式,提升模型生成内容的质量和适用性。文章提出了10种具体的技巧,每种技巧基于特定的认知原理和技术原理,通过实际案例展示了如何应用这些技巧,以及它们带来的效果提升。

如何使用 DeepSeek V3 搭建个人AI知识库,小白快速上手

文章提供了快速搭建个人AI知识库的方案,通过结合 AnythingLLM 和 DeepSeekV3,用户可以高效地管理自己的知识库,通过AI进行智能检索和问答。文章详细介绍了安装、配置、上传文档和知识检索的具体步骤,适合新手快速上手。