AI教程

什么是语义理解(Semantic Understanding)

语义理解(Semantic Understanding)是自然语言处理(NLP)中的一个重要领域,关注于理解和解释文本中词汇、短语和句子的含义。涉及字面意义,还包括上下文、隐含意义以及说话者意图等多层次信息的解析。

什么是知识表示(Knowledge Representation)

知识表示(Knowledge Representation)是指将知识以一种机器可理解的形式表示出来,它涉及数据结构及其处理机制的综合:表示= 数据结构+处理机制。在知识表示中,知识的涵义与日常生活中的知识有所不同,它是指以某种结构化的方式表示的概念、事件和过程。

MM-Eureka – 上海AI Lab联合上交大等推出的多模态推理模型

MM-Eureka 是上海人工智能实验室、上海创智学院、上海交通大学和香港大学的研究人员共同开发的多模态推理模型。模型通过基于规则的大规模强化学习(RL),将单模态推理中的关键特性(如稳定的回答长度增长、准确率奖励以及视觉顿悟时刻)扩展到多模态场景。

Command A – Cohere 推出的生成式 AI 模型

Command A 是 Cohere 推出的最新生成式 AI 模型,专为企业级应用设计。Command A用高性能和低硬件成本为核心优势,能在两块 GPU 上高效部署,相比其他类似模型(如 GPT-4o 和 DeepSeek-V3)显著降低硬件需求和成本。

什么是元学习(Meta-Learning)

元学习(Meta-Learning),也称为“学会学习”,是机器学习领域中一个令人兴奋且极具潜力的研究方向。它的核心目标是让机器学习系统学会高效地学习新任务,解决传统模型对大量标注数据的需求和训练时间过长的问题。

AudioX – 港科大联合月之暗面推出的扩散变换器模型,任意内容生成音频

AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压器模型,专门用于从任意内容生成音频和音乐。模型能处理多种输入模态,包括文本、视频、图像、音乐和音频,生成高质量的音频输出。

MedRAG – 南洋理工团队推出的医学诊断模型

MedRAG是南洋理工大学研究团队提出的医学诊断模型,通过结合知识图谱推理增强大语言模型(LLM)的诊断能力。模型构建了四层细粒度诊断知识图谱,可精准分类不同病症表现,通过主动补问机制填补患者信息空白。

I2V3D – 香港城市大学联合微软推出的图像到视频生成框架

I2V3D是香港城市大学和微软 GenAI创新的图像到视频生成框架,支持将静态图像转换为动态视频,基于3D几何引导实现精确的动画控制。I2V3D结合传统计算机图形学(CG)管线的精确控制能力和生成式AI模型的视觉保真度,用两阶段生成流程:3D引导的关键帧生成和视频插值,实现高质量、可控的视频生成。

什么是视频扩散模型(Video Diffusion Models, VDM)

视频扩散模型(Video Diffusion Models, VDM)是一种结合了变分自编码器(VAE)和扩散模型优势的生成模型。VDM的核心思想是在潜在空间中进行扩散过程,而不是直接在高维数据空间中操作。通过这种方式,VDM能够在保持数据生成质量的同时,大幅降低计算成本。

OpenBioMed – 清华AIR联合水木分子推出的开源Agent平台

OpenBioMed 是清华大学智能产业研究院(AIR)和水木分子共同推出的开源平台,专注于 AI 驱动的生物医学研究。是多模态表征学习工具包,能处理分子、蛋白质、单细胞等多种生物医学数据。