AI教程

什么是3D高斯溅射(3D Gaussian Splatting)

3D高斯溅射(3D Gaussian Splatting)是一种新兴的三维场景重建和渲染技术,它通过使用3D高斯函数来表示场景中的点,并将这些高斯函数投影到2D图像平面上进行渲染。

什么是上下文嵌入(Contextual Embedding)

上下文嵌入(Contextual Embedding)是一种将词汇映射到向量空间的技术,它为每个词生成一个基于其上下文的表示。这些表示能够捕捉词汇在不同上下文中的多样用法,并编码可以跨语言转移的知识。与传统的全局词表示不同,上下文嵌入超越了词级语义,因为每个标记都与整个输入序列的函数相关联。

Evolving Agents – 开源的AI Agent管理与进化框架

Evolving Agents 是用在创建、管理和进化 AI 代理的生产级框架。Evolving Agents支持智能代理之间的通信和协作,根据语义理解需求、基于过往经验进化,有效解决复杂任务。框架具备智能代理进化、代理间通信等核心功能。

MT-MegatronLM – 摩尔线程开源的混合并行训练框架

MT-MegatronLM 是摩尔线程推出的面向全功能 GPU 的开源混合并行训练框架,主要用于高效训练大规模语言模型。支持 dense 模型、多模态模型及 MoE(混合专家)模型的训练。框架基于全功能 GPU 支持 FP8 混合精度策略、高性能算子库和集合通信库,显著提升了 GPU 集群的算力利用率。

什么是正则化(Regularization)

正则化是一种在机器学习中用于防止模型过拟合的技术。通过在模型的损失函数中添加一个惩罚项来实现,这个惩罚项与模型参数的复杂度相关。正则化有助于限制模型的复杂度,使模型在训练数据上不会过于复杂,提高模型在新数据上的泛化能力。常见的正则化方法包括L1正则化(Lasso)和L2正则化(Ridge)。

APB – 清华联合腾讯等机构推出的分布式长上下文推理框架

APB(Accelerating Distributed Long-Context Inference by Passing Compressed Context Blocks across GPUs)是清华大学等机构联合提出的分布式长上下文推理框架。通过稀疏注意力机制和序列并行推理方式,有效解决了大模型处理长文本时的效率瓶颈。

什么是数据增强(Data Augmentation)

数据增强(Data Augmentation)是机器学习和深度学习领域中一种常用的技术,在计算机视觉和自然语言处理中应用广泛。核心目的是通过对现有数据进行变换或生成新数据来增加数据集的大小和多样性,提高模型的泛化能力,减少过拟合的风险。

Botgroup.chat – 开源的AI机器人群聊项目,支持多个AI模型群聊对话

Botgroup.chat 是基于 React 和 Cloudflare Pages 的多人 AI 聊天应用。支持多个 AI 角色同时参与对话,提供类似群聊的交互体验。用户可以自定义 AI 角色的性格和模型,可以对特定 AI 进行禁言操作。

什么是基础模型(Foundation Models)

基础模型(Foundation Models)是近年来在人工智能领域迅速发展的一种模型,在大规模、广泛来源的数据集上进行预训练,能执行一系列的通用任务。这些模型基于深度学习架构,尤其是Transformer模型,通过自监督学习技术训练,不需要大量的标注数据。

什么是合成数据(Synthetic Data)

合成数据(Synthetic Data)是一种非人工创建的数据,通过计算算法和模拟生成,用以模仿真实世界数据。它具有与实际数据相同的数学特性,但不包含相同的具体信息。