Anthropic发布Claude 3.5系列,还可以模拟人类控制电脑操作

AI快讯 2024-10-29 15:25更新网络

 

近日,国际知名的大语言模型开发商Anthropic发布了Claude 3.5 Sonnet升级版,以及新一代模型Claude 3.5 Haiku。

Claude 3.5 Haiku在V3.0基础上进行了大幅度更新,在相同成本的情况下推理效率、性能得到显著增强。即便与上一代的最大模型Claude 3 Opus相比,Claude 3.5 Haiku在许多智能基准测试中都表现出了超越的态势。

在编码任务方面,Claude 3.5 Haiku特别强,在 SWE-bench Verified 上得分达到了 40.6%,超越了许多使用公开可用的最先进模型的模型,包括原始的 Claude 3.5 Sonnet 和 GPT-4o。

在本次新版本的发布同时,Anthropic还宣布推出了一项革命性的功能——「Computer use」。通过 API 开发者可以让 Claude 像人类一样使用计算机控制鼠标、键盘,包括查看屏幕、移动光标、点击按钮和输入文本等操作,在开发者的圈子内一时惊起千层浪。

例如,用户可以让 Claude 代理执行搜索网页上的信息、在电子表格中填写数据;打开软件进行特定的操作;协助开发人员执行重复性任务、测试代码等,整个流程 Claude 都会根据指令自动执行相应的操作。

目前,「Computer use」主要依靠API来驱动自动化指令,当开发者通过API向Claude 发送指令时,Claude会运用其自然文本分析能力解析指令。其内部语言模型会对指令文本进行词法、句法和语义分析,将指令意图映射到对应的经典计算机操作概念上,预训练的知识包括常见的计算机操作术语、软件功能描述等,以便让大模型可以准确执行特定的操作,计算产业将迎来一个全新的自动化时代。

相关文章