AI教程 - 智汇AI

Image-01 – MiniMax 推出的文本到图像生成模型

Image-01 是 MiniMax 推出的先进文本到图像生成模型，具备卓越的图像生成能力。能将用户输入的文本描述精准转化为高质量图像，支持多种纵横比和高分辨率输出，适合从社交媒体到专业商业项目的广泛应用。

AI教程

2025-04-14

SuperGPQA – 豆包大模型联合 M-A-P 开源的知识推理基准测试集

SuperGPQA 是字节跳动豆包大模型团队联合 M-A-P 推出的全面覆盖 285 个研究生级学科、包含 26529 道专业题目的知识推理基准测试集。解决传统评测基准学科覆盖不全、题目质量存疑和评测维度单一的问题，基于专家与大语言模型协同构建，确保题目的高质量和高难度。

AI教程

2025-04-14

SpeciesNet – Google 开源的动物物种识别 AI 模型

SpeciesNet 是 Google 开源的人工智能模型，通过分析相机陷阱拍摄的照片来识别动物物种。基于超过 6500 万张图像训练而成，能识别超过 2000 种标签，包括动物物种、分类单元以及非动物对象。

AI教程

2025-04-14

GaussianCity – 南洋理工大学 S-Lab 团队推出的 3D 城市生成框架

GaussianCity 是南洋理工大学 S-Lab 团队推出的高效无边界3D城市生成框架，基于3D高斯绘制（3D-GS）技术。引入紧凑的 BEV-Point 表示方法，将场景的显存（VRAM）使用量保持在恒定水平，解决大规模场景生成中显存和存储需求过高的问题。

AI教程

2025-04-14

Asyncflow v1.0 – Podcastle 推出的 AI 文本转语音模型

Asyncflow v1.0 是播客平台 Podcastle 推出的 AI 文本转语音模型。支持超过 450 种语音选项，能为文本内容生成高质量的语音朗读，适用于多种语言和风格。

AI教程

2025-04-14

ART – 微软联合清华和北大等推出的多层透明图像生成技术

ART（Anonymous Region Transformer）是新型的多层透明图像生成技术，能根据全局文本提示和匿名区域布局直接生成多个独立的透明图层（支持 RGBA 格式），图层可以单独编辑、组合或叠加。

AI教程

2025-04-14

NextGenAI – OpenAI 推出的教育联盟，联合15家顶尖大学和机构

NextGenAI是OpenAI推出的全球性联盟，基于AI技术推动教育和研究的进步。NextGenAI联合包括哈佛大学、麻省理工学院、牛津大学等在内的15所顶尖大学和机构，OpenAI为其提供5000万美元的资金支持、计算资源和API接口。各成员机构基于AI技术在医疗、教育、图书馆等领域展开创新应用，例如缩短罕见病诊断时间、开发先进学习模型、数字化罕见文献等。

AI教程

2025-04-13

什么是循环神经网络（RNN）

循环神经网络（英文名Recurrent Neural Network，简称RNN），是一种具有内部记忆的神经网络。这种记忆使得网络能够通过考虑前一步的信息来处理和分析序列数据。

AI教程

2025-04-13

NotaGen – 中央音乐学院联合北航、清华等推出的音乐生成模型

NotaGen 是中央音乐学院、北京航空航天大学、清华大学等机构推出的音乐生成模型，基于模仿大型语言模型（LLM）的训练范式生成高质量的古典乐谱。NotaGen 基于预训练、微调和强化学习相结合的方法，预训练阶段用超过160万首乐曲，微调阶段基于约9000首高质量古典作品，基于“时期-作曲家-乐器”提示进行条件生成。

AI教程

2025-04-13

什么是智能体（Agents）

智能体是人工智能中的一个核心概念，英文名Agents或AI Agents，它不仅仅是一个被动的观察者，而是一个能够主动与环境交互并产生影响的实体。智能体可以被定义为一个能够感知环境、做出决策并采取行动以实现特定目标的自主实体。

AI教程

2025-04-13