LightOnOCR-2-1B-LightOnAI推出的OCR模型

LightOnOCR-2-1B-LightOnAI推出的OCR模型

文章来源:智汇AI    发布时间:2026-01-23

LightOnOCR-2-1B 是 LightOnAI 推出的高效 OCR 模型,参数量仅 1B,在复杂文档处理中表现卓越,擅长学术论文、数学公式和复杂表格的识

暂无访问

LightOnOCR-2-1B是什么

LightOnOCR-2-1B 是 LightOnAI 推出的高效 OCR 模型,参数量仅 1B,在复杂文档处理中表现卓越,擅长学术论文、数学公式和复杂表格的识别。模型采用 RLVR 强化学习技术,输出 Markdown 格式的结构化文本,支持表格还原、公式识别和多栏布局处理。模型以低成本和高速处理能力备受瞩目,每千页文档处理成本不到 0.01 美元,处理速度可达 5.71 页 / 秒,是文档数字化和知识库构建的理想选择。

LightOnOCR-2-1B

LightOnOCR-2-1B的主要功能

Markdown 结构化输出:将识别的文本以 Markdown 格式输出,包含标题、列表、代码块等结构化内容,便于后续编辑和排版。表格还原:能准确还原表格结构,支持复杂统计表格的识别。数学公式识别:完美支持 LaTeX/KaTeX 格式的数学公式识别,适用于学术文献和工程文档。多栏布局处理:自动识别多栏排版的阅读顺序,适用于报纸、学术论文等复杂排版文档。边界框预测(bbox 变体):模型能识别文字和预测图片中文字的边界框,便于图文对应和切片处理。高效低成本:在单张 H100 显卡上,每秒可处理 5.71 页文档,每千页处理成本不到 0.01 美元,适合大规模文档处理。

LightOnOCR-2-1B的技术原理

基于验证反馈的强化学习(RLVR):KaTeX 奖励机制针对数学公式渲染进行优化,确保输出的 LaTeX 代码规范且可渲染。压缩奖励机制惩罚模型的重复行为,降低重复率超过 50%,避免小模型常见的死循环问题。

相关推荐