AI文章 - 智汇AI

WiseDiag – 杭州智诊科技推出全球领先的医疗大模型

WiseDiag 是杭州智诊科技推出的全球领先的医疗大模型，专注于基于人工智能技术提升医疗服务的效率和质量。模型具有 730 亿参数和 32k 的上下文长度，基于超过 3 万亿 Token 的专业医学数据训练，涵盖 1 万本医学专业书籍、5 万篇临床诊疗指南和 50 万篇全球医学论著。

AI教程

2025-04-21

什么是问答系统（Question Answering Systems）

问答系统（Question Answering Systems）是人工智能领域中的一种信息检索系统，能够理解用户以自然语言提出的问题，提供准确、直接的答案。能处理文本，语音、图片等多种输入形式，其答案可能来源于结构化的知识库或非结构化的数据源。问答系统广泛应用于在线客服、智能助手和搜索引擎等领域，旨在提高信息获取的效率和准确性。

AI教程

2025-04-21

Claude 官方发布《Agent 构建指南》（中文版）

本文主要讲述Anthropic公司在构建大型语言模型（LLM）和智能体（agents）方面的年度总结和设计原则。文章由Anthropic公司撰写，内容包括成功方案的特点、智能体的定义、何时使用智能体、框架的使用、构建模块与工作流、工作流模式、智能体的应用场景以及实践案例等板块。

AI快讯

2025-04-21

CustomVideoX – 中科大联合浙大等推出的个性化视频生成框架

CustomVideoX 是中科大和浙大等联合提出的创新的个性化视频生成框架，通过参考图像和文本描述生成高质量的定制化视频。框架基于视频扩散变换器（Video Diffusion Transformer），通过零样本学习的方式，仅训练 LoRA 参数来提取参考图像特征，实现高效的个性化视频生成。

AI教程

2025-04-21

KTransformers – 清华开源的大语言模型推理优化框架

KTransformers是清华大学KVCache.AI团队联合趋境科技推出的开源项目，能优化大语言模型的推理性能，降低硬件门槛。KTransformers基于GPU CPU异构计算策略，用MoE架构的稀疏性，支持在仅24GB显存的单张显卡上运行DeepSeek-R1、V3的671B满血版，预处理速度最高达到286 tokens s，推理生成速度最高能达到14 tokens s。

AI教程

2025-04-21

DragAnything – 快手联合浙大等机构开源的可控视频生成方法

DragAnything 是快手联合浙江大学和新加坡国立大学 Show Lab推出的，基于实体表示的可控视频生成方法，基于简单的轨迹输入实现对视频中任意物体的精确运动控制。DragAnything用扩散模型的潜在特征表示视频中的每个实体，克服传统方法中单纯拖动像素点无法精确控制物体运动的局限性。

AI教程

2025-04-21

Stable Diffusion 3.5 实用提示构建指南

提示是有效使用生成式 AI 图像模型的技巧。提示的结构直接影响生成的图像的质量、创造力和准确性。Stable Diffusion 3.5 在可定制性、高效性能、多样化输出和多功能风格方面表现出色，成为初学者和专家的理想选择。本指南提供了 SD3.5 的实用提示技巧，让您能快速准确地完善图像概念。

AI快讯

2025-04-21

GENERator – 阿里 AI for Science 团队等推出的生成式 DNA 大模型

GENERator是阿里云飞天实验室 AI for Science 团队推出的生成式基因组基础模型，专注于 DNA 序列的设计和生成。模型基于 Transformer 解码器架构，具有 98k 碱基对的上下文长度和 12 亿参数，训练数据涵盖 3860 亿 bp 的真核生物 DNA。

AI教程

2025-04-21

FoloUp – 开源AI语音面试平台，自动生成定制化面试问题

FoloUp 是开源的AI语音面试平台，能帮助企业高效地进行招聘面试。FoloUp能根据职位描述自动生成定制化的面试问题，基于AI技术与候选人进行自然、对话式的语音面试。平台能实时分析候选人的回答，生成详细的评分和洞察报告。

AI教程

2025-04-21

如何用AI免费翻唱任意歌曲，小白必看

用一分钟的语音，就能让AI模仿我的声音，一键翻唱任意歌曲，你敢信？今天给大家分享两个超级简单的工具，上传一分钟的原声素材，点点点就行了，0基础小白，也能快速生成翻唱作品。

AI快讯

2025-04-21