Anthropic发布Claude 3.5系列，还可以模拟人类控制电脑操作

AI快讯 2024-10-29 15:25更新

近日，国际知名的大语言模型开发商Anthropic发布了Claude 3.5 Sonnet升级版，以及新一代模型Claude 3.5 Haiku。

Claude 3.5 Haiku在V3.0基础上进行了大幅度更新，在相同成本的情况下推理效率、性能得到显著增强。即便与上一代的最大模型Claude 3 Opus相比，Claude 3.5 Haiku在许多智能基准测试中都表现出了超越的态势。

在编码任务方面，Claude 3.5 Haiku特别强，在 SWE-bench Verified 上得分达到了 40.6%，超越了许多使用公开可用的最先进模型的模型，包括原始的 Claude 3.5 Sonnet 和 GPT-4o。

在本次新版本的发布同时，Anthropic还宣布推出了一项革命性的功能——「Computer use」。通过 API 开发者可以让 Claude 像人类一样使用计算机控制鼠标、键盘，包括查看屏幕、移动光标、点击按钮和输入文本等操作，在开发者的圈子内一时惊起千层浪。

例如，用户可以让 Claude 代理执行搜索网页上的信息、在电子表格中填写数据；打开软件进行特定的操作；协助开发人员执行重复性任务、测试代码等，整个流程 Claude 都会根据指令自动执行相应的操作。

目前，「Computer use」主要依靠API来驱动自动化指令，当开发者通过API向Claude 发送指令时，Claude会运用其自然文本分析能力解析指令。其内部语言模型会对指令文本进行词法、句法和语义分析，将指令意图映射到对应的经典计算机操作概念上，预训练的知识包括常见的计算机操作术语、软件功能描述等，以便让大模型可以准确执行特定的操作，计算产业将迎来一个全新的自动化时代。

CADCrafter-单张图片到参数化CAD模型生成框架