豆包刚上线的深度思考与DeepSeek相比较,哪个更好?
当别家都已经推出了深度思考推理模型,字节却一直没有任何消息。实际上,字节一直在内部进行测试,已经进行了相当长时间的灰度测试,并且一直保持着低调的态度。
然而,今天总算有了新的进展,豆包的“深度思考”模式终于正式上线了,我们将它和DeepSeek比较一下,有什么不同,哪个更好。
搜索与思考的结合方式
DeepSeek:将深度思考和搜索分开处理,用户需要自己选择是否打开思考和联网。例如,当用户提出问题时,DeepSeek会先联网查询所有相关内容,然后再根据这些内容和问题给出回答。
豆包深度思考:将思考和搜索融合在一起,先思考再搜索,且在搜索过程中会不断思考和调整搜索方向。例如,对于“《鹊刀门传奇2》演员在《乡村爱情》中的角色”这一问题,豆包会先将问题拆分为多个步骤,逐步思考和搜索,而不是一次性搜索所有内容。
问题处理逻辑
DeepSeek:在处理复杂问题时,可能会直接搜索大量信息后给出答案,但这种做法可能导致答案不够准确,尤其是在涉及多个关联信息时。
豆包深度思考:采用类似Agent的逻辑,先对问题进行规划和思考,明确需要解决的子问题,然后分步骤进行搜索和验证。例如,在回答关于《哈利·波特》系列电影的关键细节问题时,豆包会分多轮搜索,逐步完善答案。
搜索过程与质量
DeepSeek:搜索过程较为单一,可能在复杂问题上出现信息不完整或不准确的情况。例如,在回答《鹊刀门传奇2》演员问题时,DeepSeek给出的答案中主角信息缺失较多。
豆包深度思考:通过多轮搜索和思考,逐步完善答案,最终结果的质量和准确性相对较高。在测试中,豆包的回答正确率能达到80%左右,且在一些复杂问题上表现更好。
性能与成本
DeepSeek:未明确提及性能和成本,但从其搜索方式来看,可能在处理复杂问题时效率较低。
豆包深度思考:具有较高的性价比,速度快,且免费无限使用。大多数问题在20多秒内就能给出回答,最长不超过50秒。相比之下,Openai的DeepResearch虽然输出质量高,但消耗时间长且成本高。
用户体验
DeepSeek:用户需要手动选择是否联网和思考,操作相对复杂。
豆包深度思考:用户只需提出问题,豆包会自动进行思考和搜索,操作更简单,且结果更符合用户预期。
总的来讲,豆包的深度思考功能通过结合推理和搜索,提供了更为深入和准确的答案,而DeepSeek则更侧重于搜索和用户自主选择,还有就是感觉豆包的速度更快。