用 PaddleOCR-VL + DeepSeek-OCR 搭了个真·免费 OCR 服务

更新 發佈閱讀 5 分鐘

> ✅ 完全免费|无需注册|支持 PDF & 图片|结构化 Markdown 输出|100+ 语言支持

> 🌐 立即体验 → https://deepseekocr.io

vocus|新世代的創作平台

最近两个月,两个国产开源 OCR 模型横空出世,几乎霸榜全球 OCR 评测榜单——

  • DeepSeek-OCR:从 LLM 视角重构视觉编码,实现“上下文感知光学压缩”,在复杂文档理解上惊艳四座;
  • PaddleOCR-VL:仅 **0.9B 参数**的超轻量 VLM,却在 OmniDocBench v1.5总分第一,公式识别精度甚至超越 Mathpix(见 [PaddleOCR-VL 技术报告]

作为科研党和程序员,经常使用markdown记录LaTeX公式笔记。对于论文或者博客里面的一大串公式,使用mathpix截图识别出latex可以节省很大的时间。mathpix是一款很优秀的公式识别助手,就是免费版经常限流。

于是,我做了 deepseekocr.io这个网站:一个完全免费、无需注册,不限次数的在线 OCR 工具,底层由**DeepSeek OCR** 和 **PaddleOCR-VL**双引擎驱动。该工具网站专为**科研党,学生,办公族,程序员**打造。

✨ 核心能力:

- ✅ **高精度识别**:PaddleOCR-VL 在 [OmniDocBench v1.0/v1.5](https://github.com/opendatalab/OmniDocBench) 总分第一;其公式识别甚至**超过 Mathpix**(见 [技术报告](https://arxiv.org/abs/2510.14528))

- ✅ **结构化 Markdown 输出**:自动还原标题、表格、公式(LaTeX)、图片位置

- ✅ **排版感知**:文字与图像分块保留原布局(PaddleOCR-VL 的 NaViT 视觉编码器加持)

- ✅ 支持 **图片 & PDF**,覆盖 **100+ 语言**

- ✅ 免费无门槛(仅轻量 Turnstile 防刷)

识别效果

手写公式笔记: 混有中文、公式、草图的手写笔记

vocus|新世代的創作平台
手写汉字 + 公式 + 草图分区识别——这对传统 OCR 是“地狱级”挑战,但 PaddleOCR-VL 的 **NaViT 动态分辨率编码器**轻松应对,这种效果还是比mathpix要好一些

  小票 

密集排版、倾斜拍摄、低光照

vocus|新世代的創作平台


无论是**拍一张黑板公式转成 LaTeX**、**扫描手写笔记整理成 Markdown**、**提取 PDF 论文中的多栏表格**,还是**识别餐馆菜单、购物小票、发票、护照、身份证、驾照等证件**,它都能高精度还原内容与排版,让杂乱图像秒变结构化文本。

对我而言,日常任务用 PaddleOCR-VL(仅 0.9B)已足够精准又高效;DeepSeek OCR 是在runpod gpu服务器上个人部署的,速度有点慢,只是略作尝鲜。


下一步计划

1. **多语言界面**(中/英/日/韩等)

3. **Pro 会员系统**:PDF 多页解析、10MB 文件支持、无验证、高优队列

2. **API 服务上线**(RapidAPI / Apify,供开发者集成)

相关链接

- GitHub(DeepSeek-OCR):https://github.com/deepseek-ai/DeepSeek-OCR

- GitHub(PaddleOCR):https://github.com/PaddlePaddle/PaddleOCR

- PaddleOCR-VL 论文:https://arxiv.org/abs/2510.14528

- 体验入口:https://deepseekocr.io

- 首发于个人博客:https://yeekal.com/indie-dev/free-ai-ocr-tool

留言
avatar-img
Yang ella的沙龍
1會員
8內容數
Yang ella的沙龍的其他內容
2025/08/07
通义团队重磅开源了首个图像生成模型 Qwen-Image,一款基于20B MMDiT架构的强大模型。本文将深度解析其核心亮点,包括在复杂文本渲染中英文字体处理以及图像编辑方面的卓越表现。我们将通过丰富的案例展示其能力,对比其在第三方基准测试中的领先地位,并提供详尽的本地部署与ComfyUI工作流指南
Thumbnail
2025/08/07
通义团队重磅开源了首个图像生成模型 Qwen-Image,一款基于20B MMDiT架构的强大模型。本文将深度解析其核心亮点,包括在复杂文本渲染中英文字体处理以及图像编辑方面的卓越表现。我们将通过丰富的案例展示其能力,对比其在第三方基准测试中的领先地位,并提供详尽的本地部署与ComfyUI工作流指南
Thumbnail
2025/06/17
labubu太火热,实体店难买,二手太贵,本文教你用 Labubu Doll Generator Lora, 借助together ai的免费api,通过简单的提示词生成我们想要的labubu图片。 本文涉及基本python代码,若不想自己折腾,可以在线体验: ai-labubu-genera
Thumbnail
2025/06/17
labubu太火热,实体店难买,二手太贵,本文教你用 Labubu Doll Generator Lora, 借助together ai的免费api,通过简单的提示词生成我们想要的labubu图片。 本文涉及基本python代码,若不想自己折腾,可以在线体验: ai-labubu-genera
Thumbnail
2025/06/05
获取完整的系统提示词文本:google-stitch-20250524 访问 leaked-system-prompts.com 查看更多 AI 系统提示词(ChatGPT、Claude 3.7、Claude 4、Grok、Gemini、Cursor、V0、Manus、DeepSeek、Bol
Thumbnail
2025/06/05
获取完整的系统提示词文本:google-stitch-20250524 访问 leaked-system-prompts.com 查看更多 AI 系统提示词(ChatGPT、Claude 3.7、Claude 4、Grok、Gemini、Cursor、V0、Manus、DeepSeek、Bol
Thumbnail
看更多