文章来源:智汇AI 发布时间:2025-08-22
2025年8月20日,AI行业最新新闻资讯,包括:智谱AutoGLM2.0突破硬件限制全民可用;ComfyUI-Copilot V2上线,一句话搞定工作流;OpenAI牵头推出AGENTS.md标准…
暂无访问2025年8月20日,智谱带来了AutoGLM2.0的重大升级,这一版本突破硬件限制,让AI代理操作真正走向全民普及。
此前AutoGLM1.0虽开创了AI代操作手机先河,但应用场景受限。而AutoGLM2.0摇身一变,成了真正的执行型AI助手,能在云端自主完成多样任务。
在生活里,它支持操作美团、京东等数十个高频应用。用户一句话指令,就能自动点外卖、订机票,甚至贴心送上“秋天的第一杯奶茶”。工作中,它跨网站执行能力超强,熟练操作飞书、知乎等网页平台,从信息检索到内容发布,形成完整工作闭环。
更厉害的是,它为AI配备专属智能体手机和电脑,让AI在云端独立工作,不占用户本地设备资源。用户任务执行期间,能正常刷抖音、打游戏,实现后台智能服务。
智谱通过云端部署模式,解决了设备兼容性和资源占用两大难题,为AI助手大规模普及铺平道路。AutoGLM2.0的发布,标志着AI代理操作技术从概念验证迈向成熟商用,让AI操作不再是少数人的专利,而是人人都能享受的便捷服务,未来AI操作将融入生活的方方面面,带来更多惊喜。
体验地址:全球首个手机通用Agent-AutoGLM2.0
2025年8月19日晚,AI绘图工具ComfyUI在“X”平台官宣,由Pixelle_AI打造的AI助手CopilotV2正式发布,“用嘴调工作流”成为现实,告别熬夜调参数的痛苦。
CopilotV2功能强大。能一句话生成或修改工作流,说“帮我生成赛博朋克风格人物绘图流程”,它自动推荐节点组合,修改时一句“把输出分辨率提到4K”,AI立刻调整。遇到节点连接错误或参数冲突,它能自动查错修复,还会推荐兼容模型。新手不知用啥节点,它会智能推荐并附上教程。而且能扫描本地环境,过滤无法运行的节点。
其技术亮点也不少,多模态理解能精准解析需求,环境感知实现个性化推荐,错误数据库可识别超90%常见报错场景。
这一更新对设计师意义重大,复杂工作流搭建时间缩短70%,新手也能快速生成专业流程,让设计师有更多时间专注创意。
ComfyUI-CopilotV2的发布,是AI在创意工具领域渗透的新阶段。未来AI绘图或许会像手机拍照一样简单,只需专注“拍什么”,剩下的交给AI,让我们期待它带来更多创作惊喜。
详情查看:ComfyUI重磅更新:AI助手CopilotV2上线
在AI编程助手各自为政时,一场标准化革命悄然展开。OpenAICodex、Amp等六大巨头组成联盟,推出AGENTS.md标准,为AI编程领域带来新变革。
传统README文件对AI来说模糊难懂,AGENTS.md则像专属“操作手册”,为AI代理提供构建步骤、测试指令等关键信息,让AI能像资深工程师一样工作。过去AI编程助手常出错,有了它,AI可准确执行复杂操作,从依赖安装到PR提交都游刃有余。
开发者只需在项目根目录创建简单AGENTS.md文件,就能为AI提供全面指南,庞大单体仓库也可在子项目放置专门文件,让AI工作更精准高效。
该标准推出时机完美,当前AI编程工具爆发式增长,却缺乏统一标准,开发者需为不同工具写不同配置文件。AGENTS.md的出现,提供了统一沟通语言,一次配置适配多种工具。
它获得行业广泛支持,Cursor等主流工具纷纷表态。这反映了AI编程领域走向成熟,从技术演示转向关注实用性。
对开发者而言,能显著提升效率,专注创新。随着标准推广,AI编程助手将迎来新阶段,AI成为独当一面的编程伙伴,重新定义软件开发生产模式,推动行业变革。
详情查看:AGENTS.md标准发布
在大语言模型竞争中,数学和代码推理能力是重要评估标准。快手发布的Klear-Reasoner模型基于Qwen3-8B-Base打造,数学推理准确率超90%,成为同规模模型佼佼者。
其成功源于采用的GPPO算法。传统裁剪策略虽能控制模型更新幅度,但会丢弃重要信息,使模型保守。GPPO算法“温和”处理,让所有梯度参与反向传播,保留探索可能,加快错误修正速度。
在各类基准测试中,Klear-Reasoner表现出色。AIME2024测试中取得90.5%高分,AIME2025测试达83.2%。Klear团队分享了训练流程,重视数据质量,SFT阶段过滤错误数据,专注高质量样本;强化学习阶段,软奖励策略比硬奖励更有效,增强学习稳定性。
团队实验发现,优质数据源质量比数量更重要。这一成果不仅展示快手在AI领域的技术进步,还为推理模型训练提供可复现道路。
未来,Klear-Reasoner模型有望在更多领域发挥作用,为解决复杂数学问题提供有力支持。其训练方法和经验,也将为其他模型研发提供借鉴,推动整个大语言模型领域在数学推理能力上不断进步。
详情查看:快手Klear-Reasoner模型登顶
Meta公司周二宣布,在全球为Facebook和Instagram用户推出AI驱动的语音翻译功能,为创作者带来多语言内容创作新机遇。
该功能允许创作者将视频内容翻译成多种语言,扩大受众覆盖范围。早在去年Connect开发者大会,Meta就展示了相关概念,经过近一年优化测试,如今具备全球发布条件。
技术上,Meta的AI翻译系统声音还原能力强,能保持创作者原声音调和语音特征,让翻译配音自然真实。创作者还可选择启用唇形同步功能,使翻译视频更自然流畅,提升观看体验。
首发版本支持英语与西班牙语双向翻译,未来将逐步增加语言选项。使用权限设置上,Facebook创作者需有1000名以上关注者,Instagram对公开账户开放且限MetaAI服务覆盖地区。
操作流程简便,创作者发布短视频前点击选项,选择是否启用功能后即可分享。系统提供预览和管理功能,创作者可控制内容。观众端能看到“由MetaAI翻译”标识,也可关闭特定语言翻译。
数据分析功能让创作者了解翻译内容在不同语言市场表现,为制定策略提供参考。这一功能将帮助创作者跨越语言文化障碍,扩大关注者群体,从平台获得更大价值,也展现了Meta在AI产品化方面的实力。
详情查看:Meta全球上线AI语音翻译
AI辅助编程领域迎来重要突破,专为ClaudeCode打造的桌面图形化客户端Claudia正式发布,让AI编程告别命令行,走向可视化交互新时代。
Claudia基于Tauri2框架,结合React和TypeScript构建,轻量级且用户体验流畅,跨平台兼容性强。它弥合了传统命令行工具与现代开发者工作习惯的差距,降低AI编程工具使用门槛。
在项目管理方面,Claudia能自动扫描识别已安装的ClaudeCode,可视化浏览.claude文件夹中的项目,方便开发者快速定位打开历史项目。
会话管理功能强大,展示所有历史编码会话列表,提供搜索过滤功能,开发者可快速找到特定会话。每个会话包含完整元数据,助于回忆内容和评估工作量。
实时会话监控功能让开发者掌控所有活跃的AI编程会话状态,无需在多个终端窗口切换。
Claudia的推出解决了AI辅助编程工具普及的关键痛点,让更多开发者轻松上手。当前AI辅助编程快速普及,Claudia填补了细分市场空白,完善了AI开发生态。
从技术趋势看,它预示AI开发工具将更注重用户体验和易用性。随着AI技术成熟,工具的可访问性和友好性将成为市场接受度关键,Claudia树立了新标杆。
体验地址:下载Claudia桌面客户端即可
微软通过“Copilot”新功能,将大型语言模型能力引入Excel单元格,改变用户数据处理方式,提升工作效率。
新Copilot功能使用简单,通过公式=COPILOT(prompt_part1,[context1],...)即可。用户用简单英语输入请求,指定单元格区域为上下文,就能在单元格完成复杂任务。如用=COPILOT(“Classifythisfeedback”,D4:D18)分类客户评论,或查找机场代码。
该功能内置于Excel计算引擎,数据变化时AI结果自动更新,还能与其他公式结合,扩展应用场景。微软列出多个核心应用案例,内容生成可将产品描述转SEO关键词;数据摘要能总结大型数据集;文本分类可处理客户反馈;列表创建可生成测试数据等。
数据隐私方面,微软强调通过Copilot发送的数据不用于训练模型,保持私密。目前无法访问实时网络数据和公司内部文件,未来计划解除限制。使用上,每十分钟最多调用100次,每小时最多300次,建议用数组提高效率。
目前该功能仅限Beta版本,对拥有Microsoft365Copilot许可证的Beta频道用户开放,网页版即将上线。微软持续改进,未来将支持更大数组和改进日期处理,有望升级至GPT-5系列,让Excel工作更高效。
详情查看:微软Copilot融入Excel