
AI教程
Kimi Latest – Kimi推出的实时更新AI模型,与Kimi智能助手同步
Kimi Latest是月之暗面Kimi推出的实时更新AI模型,为用户提供同步对标Kimi智能助手的模型体验。支持128k上下文长度,可根据输入自动选择8k、32k或128k模型进行计费,同时具备图片理解能力,能处理视觉任务。Kimi Latest支持自动上下文缓存,缓存命中的Tokens费用极低,仅为1 M Tokens。
Omnitool – 开源 AI 桌面,支持多种主流AI平台和服务
Omnitool是开源的AI桌面环境,为用户提供统一的交互界面,能快速接入和使用多种AI模型。Omnitool支持本地运行,能在Mac、Windows或Linux设备上安装,数据存储在本地,保障隐私安全。基于集成OpenAI、Stable Diffusion、Hugging Face等主流AI平台,用户无需复杂配置或学习API文档,即可快速生成图像、翻译文本、创建音频等。
Qihoo-T2X – 360 AI 研究院和中山大学开源的高效多模态生成模型
Qihoo-T2X 是360 AI 研究院和中山大学推出的基于代理标记化扩散 Transformer(PT-DiT)的高效多模态生成模型,Qihoo-T2X引入稀疏代理标记注意力机制,显著降低传统扩散 Transformer 在全局自注意力计算中的冗余性,结合窗口注意力和移位窗口注意力增强细节建模能力。
MakeAnything – 新加坡国立大学开源的一致性图片序列生成框架
MakeAnything 是新加坡国立大学 Show Lab团队推出的基于扩散变换器(Diffusion Transformer)的多领域程序性序列生成框架,基于文本描述或图像输入生成高质量的分步教程。MakeAnything 基于非对称低秩适配(LoRA)技术平衡泛化能力和任务特定性能,引入ReCraft模型实现从图像到过程的逆向生成。
AutoAgents – AI Agent 生成框架,自然语言创建和部署LLM智能体
AutoAgents 是基于大型语言模型(LLM)的自动智能体生成框架,能根据用户设定的目标自动生成多个专家角色的智能体,通过协作完成复杂任务。项目通过智能自动化技术,帮助开发者、数据科学家和企业用户更高效地完成复杂任务。
RSIDiff – 基于合成数据提升图像生成质量的递归自训练框架
RSIDiff 是用于提升文本到图像扩散模型性能的递归自训练(RSI)框架。通过迭代优化模型,基于模型自身生成的数据进行训练,解决传统自训练中常见的训练崩溃问题。
LLaDA – 人大高瓴AI联合蚂蚁推出的扩散大语言模型
LLaDA(Large Language Diffusion with mAsking)是中国人民大学高瓴AI学院李崇轩、文继荣教授团队和蚂蚁集团共同推出的新型大型语言模型,基于扩散模型框架而非传统的自回归模型(ARM)。LLaDA基于正向掩蔽过程和反向恢复过程建模文本分布,用Transformer作为掩蔽预测器,优化似然下界实现生成任务。
Agentic Reasoning – 牛津大学推出增强LLM推理能力的框架
Agentic Reasoning是牛津大学推出的增强大型语言模型(LLM)推理能力的框架。基于整合外部工具(如网络搜索、代码执行和结构化记忆)解决复杂的多步骤推理问题。Agentic Reasoning核心思想是让LLM在推理过程中动态调用外部代理(如Mind Map代理、网络搜索代理和代码代理),实时检索信息、执行计算分析和组织复杂逻辑关系。
瑞智病理大模型 – 瑞金联合华为推出的多模态互动式病理大模型
瑞智病理大模型(RuiPath)是上海交通大学医学院附属瑞金医院与华为共同推出的临床级国产多模态互动式病理大模型。模型覆盖了中国每年全癌种发病人数90%的常见癌种,包含垂体神经内分泌肿瘤等罕见病。
Step-Audio-TTS-3B – 高性能 TTS 模型,能生成特定情感和说唱风格的语音
Step-Audio-TTS-3B 是 Stepfun-AI 团队推出的高性能文本到语音(TTS)模型,具有强大的语音合成能力。基于海量合成数据训练,参数量达到30亿,能生成自然流畅、富有表现力的语音。