AI文章

ProtGPS – 麻省理工学院等机构推出的蛋白质语言模型

ProtGPS(Protein Localization Prediction Model)是麻省理工学院(MIT)和怀特黑德生物医学研究所推出的,基于深度学习的蛋白质语言模型,用在预测蛋白质在细胞内的亚细胞定位。ProtGPS基于分析蛋白质的氨基酸序列,用进化尺度的蛋白质变换器(Transformer)架构学习序列中的复杂模式和相互关系。

potpie.ai – AI代码库Agent构建平台,自动化代码分析、测试和开发任务

potpie.ai 是开源平台,基于AI技术为代码库创建定制化的工程代理(Agents)。potpie.ai基于构建代码库的知识图谱,深度理解代码组件之间的关系,实现自动化代码分析、测试和开发任务。potpie.ai提供多种预构建的代理,例如调试代理、代码库问答代理、代码变更代理、集成测试代理、单元测试代理、低层次设计代理和代码生成代理等。

MoMask – 文本驱动生成高质量3D人体动作的模型

MoMask是创新的3D人体动作生成工具,通过生成式掩码建模技术,能根据文本描述生成高质量的3D人体动作。MoMask采用分层量化方案,将人体运动表示为多层离散的运动标记,结合掩码Transformer和残差Transformer来生成动作序列。

UltraMem – 字节豆包大模型团队推出的全新超稀疏模型架构

UltraMem 是字节跳动豆包大模型团队提出的全新超稀疏模型架构,解决传统 MoE 架构在推理时的高额访存问题。架构通过优化内存访问和计算效率,显著降低推理成本,推理速度较 MoE 提升了2-6倍,成本最高可降低83%。

AxBench – 斯坦福大学推出评估语言模控制方法的基准测试框架

AxBench 是斯坦福大学推出的评估语言模型(LM)控制方法的基准测试框架。基于合成数据生成训练和评估数据,比较不同模型控制技术在概念检测和模型转向两个方面的表现。概念检测任务基于标记的合成数据评估模型对特定概念的识别能力。

Lumina-Video – 上海 AI Lab 和港中文推出的视频生成框架

Lumina-Video是上海 AI Lab 和香港中文大学推出的视频生成框架,基于Next-DiT架构,针对视频生成中的时空复杂性进行优化。基于多尺度Next-DiT架构,用不同大小的patchify层提升效率和灵活性,基于运动分数作为条件输入,直接控制生成视频的动态程度。

Pippo – Meta 推出的单图生成多视角高清人像视频模型

Pippo是Meta Reality Labs推出的图像到视频生成模型,能从单张照片生成1K分辨率的多视角高清人像视频。模型基于多视角扩散变换器,预训练了30亿张人像图像,在2500张工作室捕捉的图像上进行了后训练。

如何用AI制作一禅小和尚视频,三步学会!

前几天,有群友说特想知道如何用AI制作一禅小和尚语录的视频。 萌萌哒的光头小和尚,短短几句话里,就说出了我内心深处对生活的感悟和期许,看完感觉自己充满了力量!难怪全网短视频创作争奇斗艳的当下,小和尚语录条条视频都是爆款,最高点赞将近两千万。

Animate Anyone 2 – 阿里通义推出的高保真角色图像动画生成技术

Animate Anyone 2 是阿里巴巴集团通义实验室推出的高保真角色图像动画生成技术,通过结合环境信息生成更具真实感的角色动画。与传统方法不同,能从视频中提取运动信号,捕捉环境表示作为条件输入,使角色动画能与周围环境自然融合。

DeepClaude – 开源AI应用开发平台,深度集成 DeepSeek R1 和 Claude 模型

DeepClaude 是高性能的开源 AI 工具,基于深度集成 DeepSeek R1 和 Claude 两大模型,结合推理、创造力和代码生成能力。DeepClaude提供零延迟的即时响应,支持端到端加密和本地 API 密钥管理,确保用户数据安全。DeepClaude 高度可配置,用户能自定义 API 和界面,满足多样化需求。