专用模型

Mistral OCR

Mistral OCR 是由法国 Mistral 发布的“顶级基准” OCR 模型，官方测试结果来看领先于其他所有 OCR 专用模型。

Mistral OCR 是由法国 Mistral 发布的“顶级基准” OCR 模型，官方测试结果来看领先于其他所有 OCR 专用模型。

mistral ocr benckmark

Mistral OCR 是一种光学字符识别 API，为文档理解设定了新标准。与其他模型不同，Mistral OCR 以前所未有的准确性和认知能力理解文档的每个元素——媒体、文本、表格、公式。它以图像和 PDF 作为输入，并以有序交错的文本和图像提取内容。因此，Mistral OCR 是一个理想的模型，可与以多模态文档（如幻灯片或复杂 PDF）为输入的 RAG 系统结合使用。

Mistral 已将 Mistral OCR 设为 Le Chat 上数百万用户文档理解的默认模型，并发布了 API mistral-ocr-latest，价格为 1000 页/$（批量推理时每美元处理的页数大约翻倍）。该 API 现已在我们开发者套件 la Plateforme 上提供，即将登陆我们的云和推理合作伙伴平台，以及本地部署环境。

Mistral OCR亮点

1.对复杂文档的最先进理解

Mistral OCR 擅长理解复杂的文档元素，包括交错的图像、数学表达式、表格以及 LaTeX 格式等高级布局。该模型能够更深入地理解包含图表、图形、方程和图示等丰富内容的科学论文。

2.原生多语言和多模态

自 Mistral 成立以来，就一直致力于用我们的模型服务全球，并因此努力在我们的产品中实现多语言能力。Mistral OCR 将这一目标提升到了新的高度，能够解析、理解和转录全球各大洲的数千种文字、字体和语言。这种多功能性对于处理来自不同语言背景文档的全球组织，以及服务于利基市场的超本地企业都至关重要。

3.顶级基准测试

Mistral OCR 在严格的基准测试中始终优于其他领先的 OCR 模型。其在文档分析多个方面的卓越准确性如下所示。我们从文档中提取嵌入的图像以及文本。

4.同类中最快

与同类大多数模型相比，Mistral OCR 重量更轻，性能显著优于同类产品，在单个节点上每分钟可处理多达 2000 页。快速处理文档的能力确保了即使在高吞吐量环境中也能持续学习和改进

5.结构化输出

Mistral OCR 引入了将文档作为提示的使用，从而实现更强大和精确的指令。此功能允许用户从文档中提取特定信息，并将其格式化为结构化输出，例如 JSON。用户可以将提取的输出链接到下游函数调用中，并构建代理。请参阅此示例笔记本。

6.选择性自托管，适用于处理高度敏感或机密信息的组织

对于有严格数据隐私要求的组织，Mistral OCR 提供了自托管选项。这确保了敏感或机密信息在您自己的基础设施内保持安全，符合监管和安全标准。如果您想与我们探讨自部署方案，请告知我们。

使用场景

数字化科学研究

领先的研究机构一直在试验 Mistral OCR，将科学论文和期刊转换为 AI 可读的格式，使其能够被下游智能引擎访问。这显著加快了合作速度，并加速了科学工作流程。

保护历史与文化遗产

作为遗产守护者的组织和非营利机构一直在使用 Mistral OCR 来数字化历史文献和文物，确保其保存并让更广泛的受众能够访问。

简化客户服务

客户服务部门正在探索 Mistral OCR，将文档和手册转化为索引知识，从而缩短响应时间并提高客户满意度。

让设计、教育、法律等领域的文献为 AI 做好准备

Mistral OCR 还帮助公司将技术文献、工程图纸、讲义、演示文稿、监管文件等转换为可索引、可回答的格式，释放数百万文档中的智能和生产力。

如何使用

Mistral OCR 功能可以在 le Chat 上免费试用。要试用 API，请前往 la Plateforme。

mistral le chat

本文采用 CC BY-NC 4.0 许可协议。商业转载、引用请联系本站获得授权，非商业转载、引用须注明出处。

链接：https://appmark.cn/sites/mistral-ocr.html -APPMARK