Mini-o3-字节联合港大推出的视觉推理模型

Mini-o3-字节联合港大推出的视觉推理模型

文章来源:智汇AI    发布时间:2025-09-17

Mini-o3 是字节跳动和香港大学联合推出的开源模型,专为解决复杂的视觉搜索问题而设计。模型通过强化学习和基于图像的工具,能执行深度多轮推理,推理轮次可扩展至

暂无访问

Mini-o3是什么

Mini-o3 是字节跳动和香港大学联合推出的开源模型,专为解决复杂的视觉搜索问题而设计。模型通过强化学习和基于图像的工具,能执行深度多轮推理,推理轮次可扩展至数十轮。Mini-o3 通过构建挑战性数据集、采用迭代数据收集流程以及提出过轮遮蔽策略等方法,显著提升模型的推理能力和交互轮次。模型在多个视觉搜索基准测试中取得最佳性能,所有代码、模型和数据集均开源,便于复现和进一步研究。

Mini-o3

Mini-o3的主要功能

多轮交互推理:能进行深度多轮推理,交互轮次可扩展至数十轮,通过逐步探索和试错解决复杂的视觉搜索问题。

相关推荐