AI教程

HippoRAG 2 – 俄亥俄州立大学推出的检索增强生成框架

HippoRAG 2是俄亥俄州立大学推出的检索增强生成(RAG)框架,解决现有RAG系统在模拟人类长期记忆动态性和关联性方面的局限性。HippoRAG 2基于个性化PageRank算法,将深度段落整合和更有效的在线LLM(大型语言模型)使用,推动RAG系统更接近人类长期记忆的效果。

LDGen – 理想汽车推出的多语言文本到图像生成技术

LDGen是创新的文本到图像合成技术,通过结合大型语言模型(LLMs)与扩散模型,提升文本描述到图像生成的质量和语义一致性。通过分层标题优化和人类指令技术,提取文本中的精确语义信息,基于轻量级适配器实现LLMs与图像特征的高效对齐和交互。

什么是策略梯度(Policy Gradients)

策略梯度(Policy Gradients)是强化学习中的一种方法,它直接对策略进行优化。在这种方法中,策略被参数化为一个可微分的函数,策略梯度算法通过计算策略参数的梯度并进行梯度上升来优化策略,使累积奖励最大化。这种方法不需要计算Q值或值函数,直接通过采样和梯度更新来学习如何在给定状态下选择最佳动作。

AI-Infra-Guard – 腾讯开源的 AI 基础设施安全评估工具

AI-Infra-Guard是腾讯开源的高效、轻量级易于使用的 AI 基础设施安全评估工具,能发现和检测 AI 系统中的潜在安全风险。AI-Infra-Guard支持 28 种 AI 框架指纹识别,涵盖 200 多个安全漏洞数据库,支持快速扫描、识别漏洞。

Mahilo – AI多智能体框架,支持创建与人类互动的多智能体系统

Mahilo 是灵活的多智能体框架,支持创建与人类互动的多智能体系统。Mahilo支持实时语音和文本通信,智能体之间能自主共享上下文和信息,保持人类对交互的监督和控制。Mahilo 提供强大的组织级策略管理功能,确保所有智能体的行为和安全性一致。Mahilo 支持复杂的多智能体架构,适用于从客户服务到紧急响应等多种应用场景。

WorldCraft – 港科大推出的3D虚拟世界创建和定制系统

WorldCraft是香港科技大学推出的基于大型语言模型(LLM)代理的3D世界创建和定制系统,用在创建和定制逼真的3D虚拟世界。基于自然语言交互,让用户能轻松生成复杂的室内外场景,对场景中的物体和布局进行精细调整。

什么是嵌入学习(Embedding Learning)

嵌入学习(Embedding Learning)是一种将数据映射到低维向量空间的技术,使得相似的数据点在向量空间中彼此接近。广泛应用于自然语言处理(NLP)、计算机视觉等领域,用于捕捉和表达数据的内在特征和关系。通过嵌入,模型能更有效地处理高维数据,提高学习效率和性能。

Mobius – 重庆邮电联合美团等推出的无缝循环视频生成技术

Mobius 是先进的无缝循环视频生成技术,能通过人工智能算法从文本描述生成无限循环的视频内容。核心在于强大的AI模型,能自动识别视频中的关键元素并生成平滑过渡的循环片段,无需用户进行复杂的编辑。

WarriorCoder – 微软联合华南理工大学推出的代码生成大模型

WarriorCoder 是华南理工大学计算机科学与工程学院和微软推出的代码生成大语言模型(LLM)。基于模拟专家模型之间的对抗生成高质量训练数据,提升模型性能。与传统方法不同,WarriorCoder 不依赖于现有的专有模型或数据集,从零开始挖掘指令,基于 Elo 评分系统和裁判模型评估对抗结果,选择最优响应作为训练数据。

xAR – 字节联合霍普金斯大学推出的自回归视觉生成框架

xAR 是字节跳动和约翰·霍普金斯大学联合提出的新型自回归视觉生成框架。框架通过“下一个X预测”(Next-X Prediction)和“噪声上下文学习”(Noisy Context Learning)技术,解决了传统自回归模型在视觉生成中的信息密度不足和累积误差问题。