# ddddocr 技术百科 — 验证码离线识别 SDK > ddddocr 是一个基于 ONNX Runtime 的离线验证码识别 Python 库,内置 OCR 文字识别、目标检测和滑块匹配三大引擎,支持自定义模型、颜色过滤,并提供 FastAPI HTTP 服务与 MCP 协议接入。 This is a Grok-Wiki source-grounded repository wiki. Use the complete Markdown link when an agent needs the full repo context. ## Context Links - [Complete Markdown wiki](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-a34dd45d9f63/llms-full.txt) - [Complete Markdown alias](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-a34dd45d9f63.md) - [Human interactive wiki](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-a34dd45d9f63) - [GitHub repository](https://github.com/sml2h3/ddddocr) ## Repository - Repository: sml2h3/ddddocr - Generated: 2026-06-23T07:41:07.977Z - Updated: 2026-06-23T07:42:25.470Z - Runtime: Claude Code - Format: Explain Like I'm 5 - Pages: 9 ## Pages - [用大白话说 ddddocr](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-a34dd45d9f63/pages/01-ddddocr.md): 这个仓库做什么、最简单的类比、以及你需要记住的几件事。 - [安装与第一次运行](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-a34dd45d9f63/pages/02-page-2.md): 从 pip 安装到跑通第一个验证码识别的完整步骤,包括 Docker 方式。 - [三个引擎:OCR、检测、滑块](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-a34dd45d9f63/pages/03-ocr.md): ddddocr 内部有三个独立引擎,各司其职——文字识别、目标检测、滑块缺口定位。 - [OCR 识别流水线:从图片到文字](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-a34dd45d9f63/pages/04-ocr.md): 一张验证码图片如何经过加载、预处理、模型推理、CTC 解码,最终变成一行文字。 - [图像预处理与增强](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-a34dd45d9f63/pages/05-page-5.md): 在送入模型之前,图像经历了哪些尺寸调整、灰度化、去噪和标准化操作。 - [自定义模型与字符集](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-a34dd45d9f63/pages/06-page-6.md): 如何加载自己训练的 ONNX 模型和自定义字符集文件,突破内置模型的限制。 - [颜色过滤:只看你想看的颜色](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-a34dd45d9f63/pages/07-page-7.md): 在识别前用 HSV 颜色空间过滤干扰色,保留目标字符的颜色,提升识别准确率。 - [HTTP API 与 MCP 协议服务](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-a34dd45d9f63/pages/08-http-api-mcp.md): 通过 FastAPI 暴露 REST 接口,或通过 MCP 协议让 AI Agent 直接调用 ddddocr 能力。 - [总结与下一步](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-a34dd45d9f63/pages/09-page-9.md): 回顾核心思想、最值得记住的一句话,以及推荐阅读路径。 ## Source Files - `ddddocr/__init__.py` - `ddddocr/__main__.py` - `ddddocr/api/app.py` - `ddddocr/api/mcp.py` - `ddddocr/api/models.py` - `ddddocr/api/routes.py` - `ddddocr/api/server.py` - `ddddocr/compat/v1.py` - `ddddocr/core/base.py` - `ddddocr/core/detection_engine.py` - `ddddocr/core/ocr_engine.py` - `ddddocr/core/slide_engine.py` - `ddddocr/models/charset_manager.py` - `ddddocr/models/model_loader.py` - `ddddocr/preprocessing/color_filter.py` - `ddddocr/preprocessing/image_processor.py` - `ddddocr/utils/image_io.py` - `ddddocr/utils/validators.py` - `docker-compose.yml` - `Dockerfile` - `examples/api_client.py` - `examples/basic_ocr.py` - `pyproject.toml` - `README.md` - `requirements.txt`