Document AI
Mistral OCR 4 真正改变的不是识别率,而是文档结构可追溯
Mistral OCR 4 最吸引眼球的 demo 是手写微积分试卷几秒转 LaTeX。但真正的变化不只是“识别更准”,而是 OCR 开始向文档智能系统移动:它要告诉下游,内容写在哪里、属于什么块、模型有多确信。
从文字墙到结构化文档
传统 OCR 常把页面压成一串文本。表格、公式、签名、图表和阅读顺序都可能丢失。OCR 4 强调边界框、块分类和置信度,意味着系统可以高亮来源、裁剪原图、路由低置信区域,也能在 RAG 和审计场景里给出出处。
为什么结构比准确率更重要
- RAG 可以按公式、表格、段落分块,而不是机械按字符数切。
- 合规系统可以追踪字段来自哪一页、哪个坐标。
- 低置信区域可进入人工复核,不必全自动赌结果。
- 图表即使不能重绘,也不应被静默丢弃。
未来 OCR 的竞争,不只是字符正确率,而是可追溯、可审计、可路由。