
PaddleOCR 官网正式上线!
现已支持 PaddleOCR-VL 在线使用与 API 调用,让您轻松体验大模型驱动的智能文档解析能力。
01
三大文档智能方案覆盖多场景解析需求

PaddleOCR 官网现已全面支持三大文档智能方案,覆盖不同场景下的 OCR 需求:
▎PaddleOCR-VL:通过0.9B 超紧凑视觉语言模型增强多语种文档解析
面向文档解析的 SOTA 且资源高效的模型,支持109种语言,在复杂元素(如文本、表格、公式和图表)识别方面表现出色。直接输出 Markdown/JSON 格式结构化结果,无需部署,即可感受大模型驱动的智能文档解析体验。
▎PP-OCRv5:全场景文字识别
单模型支持五种文字类型(简中、繁中、英文、日文及拼音),精度提升13个百分点。解决多语言混合文档的识别难题。兼顾速度与精度,是最受开发者欢迎的 OCR 模型之一。
▎PP-StructureV3:复杂文档解析
将复杂 PDF 和文档图像智能转换为保留原始结构的 Markdown 文件和 JSON 文件,在公开评测中领先众多商业方案。完美保持文档版式和层次结构。
02
MCP&API 免费用
为助力开发者快速验证与集成,我们同步开放以下服务:
MCP 在线调用接口
API 在线服务
即日起,这两项核心服务限时免费开放,只需使用星河社区 Access Token 即可实现一键接入。


■ 调用文档快捷入口:
MCP 调用文档:
https://ai.baidu.com/ai-doc/AISTUDIO/bmfl1tnm4
API 调用文档:
https://ai.baidu.com/ai-doc/AISTUDIO/Kmfl2ycs0
03
在线识别与编辑的丝滑体验
PaddleOCR 官网在“前端体验”上同样下足功夫,真正实现了从“上传统一识别”到“结构化智能体验”的闭环。具体服务如下:
▎一站式体验,零门槛上手
支持 PDF/PNG/JPG/TIFF/BMP 等多种格式拖拽上传,登录后可无限次免费使用(未登录可试用3次),所有模型均在浏览器端运行,无需任何本地配置。
▎源文档与识别结果同步滚动与高亮对应
点击右侧识别结果,左侧原文将自动定位并高亮对应区域,极大提升长文档、复杂表格的校对效率。
▎在线纠错与多格式导出
识别结果支持在线实时修正并保存,并一键下载为 TXT/Markdown/JSON 三种格式,便于归档或下游任务处理。

04
在复杂场景下的真实案例
传统 OCR 常在不规则排版、手写体、公式和表格上“翻车”,而 PaddleOCR 可以充分解决这些“老大难”问题,尤其在处理以下典型复杂场景时,效果提升非常明显:
复杂排版与表格文档
化学方程式与数学公式
手写体、杂志与日无论文
新闻报纸、多栏排版与 PPT

▎结语:开源开放,让 OCR 技术走向大众
PaddleOCR 团队始终怀揣着一个信念——让每个人都能用上真正好用的 AI 文档解析工具。
PaddleOCR 官网正式上线,标志着 OCR 技术与大模型理解能力的融合迈入全新阶段。这不仅是一场技术升级,更是一场关于开放与创新的旅程。
■ 我们希望:
开发者可以在线验证、即刻集成、快速部署,让创意不再受限;
每一位用户都能切身感受到 AI 带来的高效与智能;
开源 OCR 技术能走出实验室,走进千行百业、走向每个人的日常生活。
PaddleOCR 团队将继续以开放的姿态,与全球开发者一同探索,让 AI 理解文档的每一页、读懂世界的每一个细节。
■ 【PaddleOCR-VL 产业实战营】火热招募中!
想更深入地掌握 PaddleOCR-VL 模型的应用与部署?欢迎加入我们的 PaddleOCR-VL 模型部署实战营!
■ 活动亮点:
真实场景在线体验:结合实际案例,在 PaddleOCR 官网直接体验模型对手写体、图表、公式、多语言等元素识别及复杂版面解析的推理能力;
全流程部署指南:从模型调用到实际部署,手把手带你走通全流程,提升复杂文档解析与多格式输出的实战能力。
无论你是 OCR 初学者还是进阶开发者,这里都有适合你的内容!名额有限,快来扫码报名,一起动手,玩转 PaddleOCR-VL!

■ 立即体验
官网入口:
paddleocr.com
(目前该域名会自动跳转至官方页面 aistudio.baidu.com/paddleocr,可放心访问)
GitHub 地址:
https://github.com/PaddlePaddle/PaddleOCR
