用 PaddleOCR-VL + DeepSeek-OCR 搭了个真·免费 OCR 服务

> ✅ 完全免费｜无需注册｜支持 PDF & 图片｜结构化 Markdown 输出｜100+ 语言支持

最近两个月，两个国产开源 OCR 模型横空出世，几乎霸榜全球 OCR 评测榜单——

DeepSeek-OCR：从 LLM 视角重构视觉编码，实现“上下文感知光学压缩”，在复杂文档理解上惊艳四座；
PaddleOCR-VL：仅 **0.9B 参数**的超轻量 VLM，却在 OmniDocBench v1.5总分第一，公式识别精度甚至超越 Mathpix（见 [PaddleOCR-VL 技术报告]

作为科研党和程序员，经常使用markdown记录LaTeX公式笔记。对于论文或者博客里面的一大串公式，使用mathpix截图识别出latex可以节省很大的时间。mathpix是一款很优秀的公式识别助手，就是免费版经常限流。

于是，我做了 deepseekocr.io这个网站：一个完全免费、无需注册，不限次数的在线 OCR 工具，底层由**DeepSeek OCR** 和 **PaddleOCR-VL**双引擎驱动。该工具网站专为**科研党，学生，办公族，程序员**打造。

✨ 核心能力：

- ✅ **高精度识别**：PaddleOCR-VL 在 [OmniDocBench v1.0/v1.5](https://github.com/opendatalab/OmniDocBench) 总分第一；其公式识别甚至**超过 Mathpix**（见 [技术报告](https://arxiv.org/abs/2510.14528)）

- ✅ **结构化 Markdown 输出**：自动还原标题、表格、公式（LaTeX）、图片位置

- ✅ **排版感知**：文字与图像分块保留原布局（PaddleOCR-VL 的 NaViT 视觉编码器加持）

- ✅ 支持 **图片 & PDF**，覆盖 **100+ 语言**

- ✅ 免费无门槛（仅轻量 Turnstile 防刷）

识别效果

手写公式笔记：混有中文、公式、草图的手写笔记

手写汉字 + 公式 + 草图分区识别——这对传统 OCR 是“地狱级”挑战，但 PaddleOCR-VL 的 **NaViT 动态分辨率编码器**轻松应对，这种效果还是比mathpix要好一些

小票

密集排版、倾斜拍摄、低光照

无论是**拍一张黑板公式转成 LaTeX**、**扫描手写笔记整理成 Markdown**、**提取 PDF 论文中的多栏表格**，还是**识别餐馆菜单、购物小票、发票、护照、身份证、驾照等证件**，它都能高精度还原内容与排版，让杂乱图像秒变结构化文本。

对我而言，日常任务用 PaddleOCR-VL（仅 0.9B）已足够精准又高效；DeepSeek OCR 是在runpod gpu服务器上个人部署的，速度有点慢，只是略作尝鲜。

下一步计划

1. **多语言界面**（中/英/日/韩等）

3. **Pro 会员系统**：PDF 多页解析、10MB 文件支持、无验证、高优队列

2. **API 服务上线**（RapidAPI / Apify，供开发者集成）

识别效果

下一步计划

相关链接