瑞士加入全球AI竞赛,推出国家级开源大语言模型Apertus

瑞士加入全球AI竞赛,推出国家级开源大语言模型Apertus

文章来源:智汇AI    发布时间:2025-09-06

瑞士正式发布国家级开源大语言模型Apertus,由公立机构研发,完全开源并遵循数据保护法。该模型支持1000多种语言,非英语数据占比40%,旨在成为公共基础设施。

暂无访问

智汇AI9月2日消息,全球AI竞赛再添新参与者,这次是一整个国家。瑞士正式发布了国家级开源大语言模型(LLM)Apertus,希望其能成为OpenAI等企业所提供模型的替代选择。“Apertus”源自拉丁语,意为“开放”,该模型由瑞士洛桑联邦理工学院(EPFL)、苏黎世联邦理工学院(ETHZurich)以及瑞士国家超级计算中心(CSCS)联合研发,这三家机构均为公共机构。

“当前,Apertus是领先的公共AI模型:由公立机构打造,服务于公共利益。这是我们迄今为止最有力的证明——AI完全可以成为像公路、供水、供电一样的公共基础设施。”推动AI成为公共基础设施的核心倡导者约书亚・谭(JoshuaTan)表示。

瑞士研发团队将Apertus设计为完全开源模式,用户可查看其训练过程的各个环节。除模型本身外,团队还同步公开了训练过程的完整文档、源代码,以及所使用的数据集。Apertus的研发严格遵循瑞士数据保护法与版权法,对于希望遵守欧洲相关法规的企业而言,它或许是更优选择之一。瑞士银行家协会此前曾指出,本土研发的大语言模型具有“巨大的长期潜力”,因为这类模型能更好地契合瑞士严格的本地数据保护法规与银行保密制度。目前,瑞士各银行已在使用其他AI模型满足业务需求,未来是否会转向Apertus,仍有待观察。

据智汇AI了解,Apertus向所有用户开放使用:科研人员、AI爱好者,乃至企业均可基于该模型进行二次开发,根据自身需求定制功能。例如,用户可借助它开发聊天机器人、翻译工具,甚至是教育或培训类应用。Apertus的训练数据涵盖1000多种语言,总token量达15万亿,其中非英语数据占比40%,包括瑞士德语、罗曼什语等瑞士本土语言。瑞士官方的声明称,该模型的训练仅使用公开可获取的数据,且其数据爬虫在网站上遇到机器可读的“拒绝爬取”请求时,会予以尊重。需注意的是,此前已有Perplexity等AI企业被指控爬取网站数据,并绕过用于阻止爬虫的协议;部分AI企业还因未经许可使用新闻机构及创作者的内容训练模型,面临法律诉讼。

目前,Apertus提供两种参数规模的版本,分别为80亿参数与700亿参数。用户可通过瑞士电信(Swisscom,瑞士信息通信技术企业)或AI平台HuggingFace获取该模型。

相关推荐