每日AI快讯

DeepSeek Artifacts – Hugging Face推出的AI编程工具,基于DeepSeek V3

DeepSeek Artifacts是Hugging Face推出的免费AI编程工具,能生成React和Tailwind CSS的前端代码。工具基于DeepSeek V3,主要目标是构建公共的前端代码数据集,用户生成的代码将被收录进这个数据集,用开源模式供所有人使用。

Jina Reader – AI 网页解析工具,一键将网页内容转为适配LLM的文本格式

Jina Reader 是 Jina AI 推出的开源工具,能将互联网上的 HTML 网页内容转换为适合大型语言模型(LLMs)处理的纯文本格式。用户只需在网址前添加特定前缀,即可快速提取网页的主要内容,并用结构化文本形式输出,去除不必要的 HTML 标签和脚本。

Memory Layers – Meta 开源不增加算力时增加大模型的参数方法

Memory Layers是Meta推出的用可训练的键值查找机制为模型增加额外参数的方法,它不会增加浮点运算次数(FLOPs)。基于稀疏激活补充计算密集型的前馈层,提供专门的容量廉价地存储和检索信息。Memory Layers在大规模语言模型中显示出显著的实用性,尤其是在处理事实性任务时,能显著提高模型的性能。

Cognita – 面向生产环境的开源、模块化 RAG 框架

Cognita是开源的模块化RAG(Retrieval Augmented Generation)框架,能帮助开发者构建模块化、易于扩展和部署的生产级应用程序。Cognita用Langchain LlamaIndex作为底层技术,提供代码组织结构,让每个组件都能通过API驱动,易于管理和扩展。

LAM – 微软推出的大型行动模型,能自主操作Windows程序

LAM是微软推出的名为“Large Action Model”(简称 LAM)的新人工智能模型。与传统语言模型不同,LAM能够自主操作Windows程序,实现真实任务执行。 能理解文本,将用户请求转化为具体行动,如启动程序或控制设备。

smolagents – Hugging Face 开源的轻量级 Agent 构建库

smolagents 是 Hugging Face 推出的一个轻量级开源库,旨在简化智能代理的构建过程。极简的代码量(约千行)和直观的API设计,使开发者能快速搭建和部署智能代理。smolagents 支持一流代码代理,支持通过沙盒环境安全执行代理操作,并且可以集成Hugging Face Hub上的模型和工具,支持多种大型语言模型(LLM)。

REEF – 上海AI Lab联合中科院等高校推出用于大模型的指纹识别技术

REEF(Representation Encoding Fingerprints)是用于大型语言模型(LLM)的指纹识别技术。通过在模型训练过程中嵌入特定的编码信息,为每个模型生成一个唯一的“指纹”,这个“指纹”包含了模型的基本特征和在不同阶段的演变过程。

Inf-DiT – 清华联合智谱 AI 推出的超高分辨率图像生成模型

Inf-DiT 是清华大学、智谱AI 推出基于扩散模型的图像上采样方法,能生成超高分辨率图像。Inf-DiT引入单向块注意力机制(UniBA),将生成过程中的空间复杂度从 O(N^2) 降低到 O(N),有效解决传统扩散模型在生成大尺寸图像时内存消耗过高的问题。Inf-DiT 用扩散变换器(DiT)结构,能处理各种形状和分辨率的图像上采样任务。

ImBD – 复旦联合华南理工等机构推出的通用 AI 内容检测器

ImBD(Imitate Before Detect)是复旦大学、华南理工大学、武汉大学、Fenzi AI等推出的用在检测机器修订文本的方法。首先模仿大型语言模型(LLMs)生成文本的风格,基于风格偏好优化(SPO)调整评分模型,让其更符合机器修订文本的特征。然后,利用风格条件概率曲率(Style-CPC)量化原始文本与条件概率采样生成文本之间的对数概率差异,有效区分人类写作和机器修订内容。

SocraticLM – 中科大和科大讯飞共同推出的苏格拉底教学大模型

SocraticLM 是通过苏格拉底式的教学法来教授数学的创新人工智能模型,模型由中科大和科大讯飞共同开发,采用了“Thought-Provoking”教学范式,通过提问引导学生主动思考和解决问题。SocraticLM 在名为 SocraTeach 的数据集上进行了微调,该数据集包含 35,000 个精心设计的多轮教学对话,模拟了真实的教学场景。