# ddddocr 技术参考手册 > ddddocr 是一个离线通用验证码识别 Python SDK,基于 ONNX Runtime 推理,支持 OCR 文字识别、目标检测和滑块验证码匹配三大核心能力,同时提供 RESTful API 与 MCP 协议集成。 This is a Grok-Wiki source-grounded repository wiki. Use the complete Markdown link when an agent needs the full repo context. ## Context Links - [Complete Markdown wiki](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-10e2eae686bf/llms-full.txt) - [Complete Markdown alias](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-10e2eae686bf.md) - [Human interactive wiki](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-10e2eae686bf) - [GitHub repository](https://github.com/sml2h3/ddddocr) ## Repository - Repository: sml2h3/ddddocr - Generated: 2026-06-23T07:57:43.214Z - Updated: 2026-06-23T08:02:09.819Z - Runtime: Claude Code - Format: Technical - Pages: 10 ## Pages - [技术概览](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-10e2eae686bf/pages/01-page-1.md): ddddocr 项目定位、整体架构、核心入口与模块职责全景图 - [安装与环境配置](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-10e2eae686bf/pages/02-page-2.md): PyPI/源码安装方式、Python 版本要求、平台兼容性、GPU 加速配置与依赖说明 - [CLI 命令与 API 服务启动](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-10e2eae686bf/pages/03-cli-api.md): ddddocr CLI 子命令用法、API 服务启动参数、Docker 部署与健康检查 - [OCR 文字识别引擎](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-10e2eae686bf/pages/04-ocr.md): OCREngine 的初始化流程、图像预处理管线、CTC 解码逻辑、概率输出与字符集范围限制 - [目标检测引擎](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-10e2eae686bf/pages/05-page-5.md): DetectionEngine 的 YOLOX 风格推理流程:预处理、锚点解码、NMS 后处理与边界框输出 - [滑块验证码匹配引擎](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-10e2eae686bf/pages/06-page-6.md): SlideEngine 的两种匹配算法:边缘检测模板匹配与图像差异比较,以及结果坐标输出 - [图像预处理与颜色过滤](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-10e2eae686bf/pages/07-page-7.md): ImageProcessor 的尺寸调整、灰度转换、去噪与二值化能力,以及 ColorFilter 的 HSV 颜色空间过滤机制 - [模型加载与字符集管理](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-10e2eae686bf/pages/08-page-8.md): ModelLoader 的 ONNX 模型加载、GPU/CPU 提供者切换,CharsetManager 的字符集加载与范围限制机制 - [RESTful API 参考](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-10e2eae686bf/pages/09-restful-api.md): FastAPI 服务的全部端点定义、请求/响应模型、功能初始化与运行时切换流程 - [MCP 协议集成](https://grok-wiki.com/public/wiki/sml2h3-ddddocr-10e2eae686bf/pages/10-mcp.md): MCP(Model Context Protocol)端点、能力声明与工具调用机制,使 AI Agent 能直接调用 ddddocr 识别服务 ## Source Files - `ddddocr/__init__.py` - `ddddocr/__main__.py` - `ddddocr/api/__init__.py` - `ddddocr/api/app.py` - `ddddocr/api/mcp.py` - `ddddocr/api/models.py` - `ddddocr/api/routes.py` - `ddddocr/api/server.py` - `ddddocr/compat/v1.py` - `ddddocr/core/__init__.py` - `ddddocr/core/base.py` - `ddddocr/core/detection_engine.py` - `ddddocr/core/ocr_engine.py` - `ddddocr/core/slide_engine.py` - `ddddocr/models/__init__.py` - `ddddocr/models/charset_manager.py` - `ddddocr/models/model_loader.py` - `ddddocr/preprocessing/__init__.py` - `ddddocr/preprocessing/color_filter.py` - `ddddocr/preprocessing/image_processor.py` - `ddddocr/utils/exceptions.py` - `ddddocr/utils/image_io.py` - `ddddocr/utils/validators.py` - `docker-compose.yml` - `Dockerfile` - `pyproject.toml` - `README.md` - `requirements.txt`