DeepEyesV2-小红书开源的多模态智能体模型

DeepEyesV2-小红书开源的多模态智能体模型

文章来源:智汇AI    发布时间:2025-11-12

DeepEyesV2 是小红书团队推出的多模态智能体模型,通过两阶段训练法实现强大的工具调用和多模态推理能力。模型能理解图文信息,支持主动调用代码执行、网络搜索

暂无访问

DeepEyesV2是什么

DeepEyesV2 是小红书团队推出的多模态智能体模型,通过两阶段训练法实现强大的工具调用和多模态推理能力。模型能理解图文信息,支持主动调用代码执行、网络搜索等外部工具,将工具返回的结果融入推理过程,解决复杂的真实世界问题。模型第一阶段通过监督微调让模型建立工具使用的基本认知,第二阶段通过强化学习提升模型的工具调用效率和泛化能力。DeepEyesV2 在新提出的 RealX-Bench 基准测试中表现出色,展现出强大的多技能协调能力。

DeepEyesV2

DeepEyesV2的主要功能

多模态理解:模型能同时处理文本和图像信息,理解复杂的图文内容。

相关推荐