Siri Ultra:开源项目,支持联网、多轮对话,支持DeepSeek系列模型
Siri Ultra是什么
Siri Ultra 是一款基于苹果快捷指令(Apple Shortcuts)的开源项目,目的是通过集成大型语言模型(LLMs)来增强 Siri 的功能。
Siri Ultra功能特点
实时对话与语音交互:用户可以通过 Siri 实现实时语音对话。
联网搜索与网页总结:支持联网搜索功能,能够对网页内容进行总结。
多模态交互:支持与图片和视频的交互,提供更丰富的交互体验。
兼容多种语言模型:可接入 DeepSeek、Openai、Gemini 等多种语言模型。
个性化配置:用户可以根据自己的需求调整系统提示语、模型参数等。
Siri Ultra使用方法
安装快捷指令:通过提供的链接安装 Siri Ultra 快捷指令。
配置 API Key:根据所选的语言模型,填写对应的 API Key 和其他必要参数。
启动与使用:通过语音指令“Hey Siri”激活 Siri Ultra,并说出指令或问题。
技术架构
Siri Ultra 基于 Cloudflare Workers 运行,支持与任何大型语言模型(LLMs)配合使用。它通过云原生设计实现了低延迟的对话响应。
Siri Ultra优势
无需额外硬件:无需安装任何额外应用,直接通过 iPhone 的快捷指令使用。
高度定制化:用户可以根据自己的需求选择语言模型并进行个性化配置。
强大的扩展性:支持多种语言模型和功能扩展。
Siri Ultra常见问题
1. 问题:快捷指令无法下载。
解答:请确保已升级到最新的 iOS 版本,旧版本 iOS 暂不支持,后续可能会适配。
2. 问题:API Key 怎么获取?
解答:API Key 需要在各大模型服务商网站申请。如果是想用 DeepSeek,推荐使用 Search1API,因为它支持联网、速度快、无需科学上网,并且注册后可免费领取 100 积分。
3. 问题:为什么不能联网?
解答:
如果选择 Search1API 的 DeepSeek 模型,API 直接支持联网。
或者可以选择其他支持 tool call 的模型(目前 DeepSeek R1 仅有 Groq 支持)。
配置搜索 key(在选项 5 中设置),例如使用 Search1API(注册免费领取 100 积分)。
4. 问题:为什么没有声音?
解答:
默认对话方式:
通过 Siri 唤起后,直接语音对话。如果 Siri 本身没有声音,请检查 Siri 语音回答设置,是否是自动或者首选语音回答。
点击直接运行快捷指令,文字对话。
如果希望直接运行时启用语音:
将选项 6 设置为 "no"。
在听写文本、朗读这两个节点选择对应语言。
5. 问题:为什么看不到推理过程?
解答:推理过程文字较长,不适合在快捷指令中展示,因此已经隐藏。但模型仍然会进行推理,不会影响结果。
GitHub仓库:https://github.com/fatwang2/siri-ultra/blob/main/Usage_zh.md