PP-OCR模型架构
PP-OCR是一个实用的超轻量OCR系统。紧张由DB文本检测、检测框纠正和CRNN文本识别三部分组成。该系统从骨干网络选择和调度、预测头部的设计、数据增强、学习率变换策略、正则化参数选择、预演习模型利用以及模型自动裁剪量化8个方面,采取19个有效策略,对各个模块的模型进行效果调优和瘦身,终极得到整体大小为3.5M的超轻量中英文OCR和2.8M的英文数字OCR。
百度一共开源了两个版本的OCR模型,轻量版的适宜移动端利用识别效果还是不错的,相对付通用OCR模型的识别效果要差点。如果是在做事器上支配,建议还是利用通用的OCR模型。

最近官方也开源了除了中文之外其他措辞的OCR模型,有兴趣的同学可以去试试看。
把稳:上面的方向分类器是在笔墨检测后利用的,实际测试创造如果检测的图片不是90度或270度旋转时,会影响检测效果,建议纠正角度之后再进行识别可得到更好的识别效果。
环境准备安装PaddlePaddle把稳:最新版的PandleOCR须要安装2.0.0的PaddlePaddle
CUDA:9.0、10.1、10.2、11.0或CPU版本CUDNN:7.6+python -m pip install paddlepaddle-gpu==2.0.0.post101 -f https://paddlepaddle.org.cn/whl/stable.html
2.clone代码或直接下载
git clone https://github.com/PaddlePaddle/PaddleOCR.git
3.安装第三方库
cd PaddleOCRpip3 install -r requirements.txt
下载预演习模型
点击预演习模型中的表格链接下载预演习模型,在PaddleOCR目录下新建一个inference目录,将下载的模型文件放到该目录下并解压。
模型推理预测在实行预测时,须要通过参数image_dir指定单张图像或者图像凑集的路径、参数det_model_dir,cls_model_dir和rec_model_dir分别指定检测,方向分类和识别的inference模型路径。参数use_angle_cls用于掌握是否启用方向分类模型。可视化识别结果默认保存到 ./inference_results 文件夹里面。
# 利用方向分类器python3 tools/infer/predict_system.py --image_dir="./doc/imgs/00018069.jpg" --det_model_dir="./inference/det_db/" --cls_model_dir="./inference/cls/" --rec_model_dir="./inference/rec_crnn/" --use_angle_cls=true# 不该用方向分类器python3 tools/infer/predict_system.py --image_dir="./doc/imgs/00018069.jpg" --det_model_dir="./inference/det_db/" --rec_model_dir="./inference/rec_crnn/" --use_angle_cls=false
PaddleOCR供应2种做事支配办法:
基于PaddleHub Serving的支配:代码路径为"./deploy/hubserving"基于PaddleServing的支配:代码路径为"./deploy/pdserving"还供应了基于Paddle Lite 在移动端支配PaddleOCR方法,官方还供应了移动真个Demo程序感兴趣的同学可以下载试试看,详细先容的支配可以参考官方文档。