PaddleOCR官网正式上线——文档解析的事，交给PaddleOCR

PaddleOCR 官网正式上线！

现已支持 PaddleOCR-VL 在线使用与 API 调用，让您轻松体验大模型驱动的智能文档解析能力。

三大文档智能方案覆盖多场景解析需求

PaddleOCR 官网现已全面支持三大文档智能方案，覆盖不同场景下的 OCR 需求：

▎PaddleOCR-VL：通过0.9B 超紧凑视觉语言模型增强多语种文档解析

面向文档解析的 SOTA 且资源高效的模型，支持109种语言，在复杂元素（如文本、表格、公式和图表）识别方面表现出色。直接输出 Markdown/JSON 格式结构化结果，无需部署，即可感受大模型驱动的智能文档解析体验。

▎PP-OCRv5：全场景文字识别

单模型支持五种文字类型（简中、繁中、英文、日文及拼音），精度提升13个百分点。解决多语言混合文档的识别难题。兼顾速度与精度，是最受开发者欢迎的 OCR 模型之一。

▎PP-StructureV3：复杂文档解析

将复杂 PDF 和文档图像智能转换为保留原始结构的 Markdown 文件和 JSON 文件，在公开评测中领先众多商业方案。完美保持文档版式和层次结构。

MCP&API 免费用

为助力开发者快速验证与集成，我们同步开放以下服务：

即日起，这两项核心服务限时免费开放，只需使用星河社区 Access Token 即可实现一键接入。

■ 调用文档快捷入口：

MCP 调用文档：

https://ai.baidu.com/ai-doc/AISTUDIO/bmfl1tnm4

API 调用文档：

https://ai.baidu.com/ai-doc/AISTUDIO/Kmfl2ycs0

在线识别与编辑的丝滑体验

PaddleOCR 官网在“前端体验”上同样下足功夫，真正实现了从“上传统一识别”到“结构化智能体验”的闭环。具体服务如下：

▎一站式体验，零门槛上手

支持 PDF/PNG/JPG/TIFF/BMP 等多种格式拖拽上传，登录后可无限次免费使用（未登录可试用3次），所有模型均在浏览器端运行，无需任何本地配置。

▎源文档与识别结果同步滚动与高亮对应

点击右侧识别结果，左侧原文将自动定位并高亮对应区域，极大提升长文档、复杂表格的校对效率。

▎在线纠错与多格式导出

识别结果支持在线实时修正并保存，并一键下载为 TXT/Markdown/JSON 三种格式，便于归档或下游任务处理。

在复杂场景下的真实案例

传统 OCR 常在不规则排版、手写体、公式和表格上“翻车”，而 PaddleOCR 可以充分解决这些“老大难”问题，尤其在处理以下典型复杂场景时，效果提升非常明显：

▎结语：开源开放，让 OCR 技术走向大众

PaddleOCR 团队始终怀揣着一个信念——让每个人都能用上真正好用的 AI 文档解析工具。

PaddleOCR 官网正式上线，标志着 OCR 技术与大模型理解能力的融合迈入全新阶段。这不仅是一场技术升级，更是一场关于开放与创新的旅程。

■ 我们希望：

PaddleOCR 团队将继续以开放的姿态，与全球开发者一同探索，让 AI 理解文档的每一页、读懂世界的每一个细节。

■ 【PaddleOCR-VL 产业实战营】火热招募中！

想更深入地掌握 PaddleOCR-VL 模型的应用与部署？欢迎加入我们的 PaddleOCR-VL 模型部署实战营！

■ 活动亮点：

无论你是 OCR 初学者还是进阶开发者，这里都有适合你的内容！名额有限，快来扫码报名，一起动手，玩转 PaddleOCR-VL！

■ 立即体验

官网入口：

paddleocr.com

（目前该域名会自动跳转至官方页面 aistudio.baidu.com/paddleocr，可放心访问）

GitHub 地址：

https://github.com/PaddlePaddle/PaddleOCR