DeepSeek R1-0528有哪些功能更新?

DeepSeek R1-0528有哪些功能更新?

文章来源:智汇AI    发布时间:2025-06-06

5月28日,DeepSeek R1模型完成小版本升级至DeepSeek - R1 - 0528, 在Live CodeBench中显示,性能可以媲美O

暂无访问

5月28日,DeepSeek R1模型完成小版本升级至DeepSeek - R1 - 0528,在Live CodeBench中显示,性能可以媲美Openai最新的o3高版本,大家可以通过官网、APP或小程序进入对话界面,开启“深度思考”功能即可体验,API也已同步更新,调用方式不变。此次功能更新主要有如下几个方面:

思考能力提升

思考深度增强:基于DeepSeek V3 Base模型,投入更多算力优化,新版本在数学、编程和通用逻辑等测试中成绩出色,接近国际顶尖水平。例如在AIME 2025测试中,准确率从70%提升至87.5%,平均每题使用的tokens也大幅增加。

思维链蒸馏:将DeepSeek-R1-0528的思维链蒸馏后训练Qwen3-8B Base,得到的8B模型在数学测试AIME 2024中表现仅次于DeepSeek-R1-0528,超越Qwen3-8B,与Qwen3-235B相当。

幻觉问题优化

幻觉率降低:在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45%~50%,结果更准确可靠。

创意写作优化

文体优化:对议论文、小说、散文等文体进行了优化,能输出篇幅更长、结构更完整的长篇作品,风格更贴近人类偏好。

工具调用支持

支持工具调用:支持工具调用功能,在Tau-Bench测评中表现良好,与OpenAI o1-high相当,但不支持在thinking中进行工具调用。

API更新

接口与调用方式不变:API已更新,接口与调用方式保持不变,但增加了Function Calling和JsonOutput的支持。

参数调整:调整了max_tokens参数的含义,用于限制模型单次输出的总长度,包括思考过程。

其他能力提升

前端代码生成:在前端代码生成、角色扮演等领域的能力有所提升。

交互动画生成:新增支持交互动画生成与演示功能,如激活参数动态可视化。

动态内容更新:在动态更新类前端任务(如实时天气信息卡片)中响应更快、细节更完善。

下载地址

https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528

相关推荐