AI教程

什么是神经网络架构搜索(Neural Architecture Search, NAS)

神经网络架构搜索(Neural Architecture Search, NAS)是一种自动化技术,用于设计和优化深度学习模型的结构。通过智能搜索策略在巨大的网络结构空间中寻找最佳架构,以提高模型性能。神经网络架构搜索结合了机器学习和优化算法,减少了人工设计网络的需要,加速了高效模型的发现过程。

AI co-scientist – 谷歌推出多智能体协作的 AI 科研助手

AI co-scientist 是谷歌推出的多智能体AI系统,作为虚拟科研机器人,协助科研人员搞定各种繁琐的科研任务,包括科研选题、文献检索和实验设计。AI co-scientist 基于Gemini 2.0 赋能,用生成、反思、排序、进化等多个智能体协同工作,模拟科学研究全流程。

协和·太初 – 北京协和与中科院共同推出的罕见病领域AI大模型

协和·太初是北京协和医院与中国科学院自动化研究所共同研发的国内首个罕见病领域AI大模型,正式进入临床应用。模型基于我国罕见病知识库的多年积累和中国人群基因检测数据,是国际首个符合中国人群特点的罕见病大模型。

什么是语义角色标注(Semantic Role Labeling, SRL)

语义角色标注(Semantic Role Labeling, SRL)是自然语言处理领域的一项技术,旨在识别句子中谓词的论元并分配适当的语义角色标签。有助于揭示句子成分之间的语义关系,例如区分施事者、受事者、时间、地点等。SRL在信息抽取、问答系统和机器翻译等多个应用中发挥着重要作用,是理解句子深层含义的关键步骤。

HiveChat – 开源 AI 聊天机器人,支持Deepseek等主流 AI 模型

HiveChat 是为中小团队设计的 AI 聊天应用,支持多种主流 AI 模型,如 OpenAI、Claude、Gemini 和 Deepseek 等。HiveChat具备 LaTeX 和 Markdown 渲染、图像理解、AI 智能体等功能,提供云端数据存储。

Ovis2 – 阿里国际推出的多模态大语言系列模型

Ovis2 是阿里巴巴国际团队推出的新型多模态大语言模型,基于结构化嵌入对齐解决视觉与文本模态间的差异。Ovis2继承、优化了 Ovis 系列架构,强化小规模模型的能力密度,基于指令微调和偏好学习显著提升了思维链(CoT)推理能力。

AgentSociety – 清华大学推出的社会模拟器

AgentSociety 是清华大学推出的基于大语言模型(LLM)的社会模拟器,通过构建具有“类人心智”的智能体来模拟复杂的社会行为和现象。结合社会学理论,赋予智能体情感、需求和认知能力,能在模拟的城市环境中进行移动、就业、消费和社交互动。

Sitcom-Crafter – 北航联合港中文等高校推出的 3D 人类动作生成系统

Sitcom-Crafter 是北京航空航天大学、香港中文大学(深圳)、悉尼科技大学、中山大学等高校联合推出的 3D 场景中人类动作生成系统。基于用户提供的长剧情指导,生成多样化且物理真实的动作,包括人类行走、人类与场景交互及人类之间交互。

Migician – 北交大联合清华、华中科大推出的多模态视觉定位模型

Migician是北京交通大学、华中科技大学和清华大学的研究团队联合推出的多模态大语言模型(MLLM),专门用在自由形式的多图像定位(Multi-Image Grounding, MIG)任务,设计了大规模训练数据集MGrounding-630k。根据自由形式的查询(如文本描述、图像或两者的组合)在多幅图像中识别并精确定位相关的视觉区域。

ComfyUI-Copilot – 阿里推出基于 ComfyUI 的 AI 智能助手

ComfyUI-Copilot 是阿里巴巴国际数字商业集团(AIDC-AI)推出基于 ComfyUI 框架深度开发的 AI 智能助手。ComfyUI-Copilot给予自然语言交互,为用户提供节点推荐、工作流构建辅助、模型查询等功能,降低 ComfyUI 的使用门槛,提升开发效率。