文章来源:智汇AI 发布时间:2025-09-12
REFRAG是Meta超级智能实验室推出的针对检索增强生成(RAG)任务的高效解码框架,通过“压缩(Compress)、感知(Sense)、扩展(Expand)
暂无访问REFRAG是Meta超级智能实验室推出的针对检索增强生成(RAG)任务的高效解码框架,通过“压缩(Compress)、感知(Sense)、扩展(Expand)”的流程优化大型语言模型(LLM)处理外部知识的方式。REFRAG将检索到的长文本切分为多个“块”,为每个“块”生成紧凑的向量表示,缩短输入序列长度,降低计算量。模型用强化学习策略网络智能判断关键信息,保留重要文本块的原始文本。框架在显著提高首字生成延迟(最高加速30倍)的同时,保持与完整上下文模型相当的性能,有效解决大模型处理长上下文时的效率问题。