LightOnOCR-2-1B-LightOnAI推出的OCR模型

文章来源：智汇AI 发布时间：2026-01-23

LightOnOCR-2-1B 是 LightOnAI 推出的高效 OCR 模型，参数量仅 1B，在复杂文档处理中表现卓越，擅长学术论文、数学公式和复杂表格的识

暂无访问

LightOnOCR-2-1B是什么

LightOnOCR-2-1B 是 LightOnAI 推出的高效 OCR 模型，参数量仅 1B，在复杂文档处理中表现卓越，擅长学术论文、数学公式和复杂表格的识别。模型采用 RLVR 强化学习技术，输出 Markdown 格式的结构化文本，支持表格还原、公式识别和多栏布局处理。模型以低成本和高速处理能力备受瞩目，每千页文档处理成本不到 0.01 美元，处理速度可达 5.71 页 / 秒，是文档数字化和知识库构建的理想选择。

LightOnOCR-2-1B的主要功能

Markdown 结构化输出：将识别的文本以 Markdown 格式输出，包含标题、列表、代码块等结构化内容，便于后续编辑和排版。表格还原：能准确还原表格结构，支持复杂统计表格的识别。数学公式识别：完美支持 LaTeX/KaTeX 格式的数学公式识别，适用于学术文献和工程文档。多栏布局处理：自动识别多栏排版的阅读顺序，适用于报纸、学术论文等复杂排版文档。边界框预测（bbox 变体）：模型能识别文字和预测图片中文字的边界框，便于图文对应和切片处理。高效低成本：在单张 H100 显卡上，每秒可处理 5.71 页文档，每千页处理成本不到 0.01 美元，适合大规模文档处理。