PaddleOCR 服务化部署(基于PaddleHub Serving)

基础环境

paddlepaddle 2.5.2

python 3.7

paddlehub 2.1.0

PaddleOCR 2.6

pip 20

#查看 python 版本

python --version

#查看pip版本

pip --version

#查看paddlepaddle版本

pip show paddlepaddle

部署过程中也尝试多次，不同版本遇到的问题不尽相同，这里选取其中一组进行部署说明

使用 docker部署paddlepaddle2.5.2容器

PaddleOCR 依赖飞桨环境运行，所以需要先安装paddlepaddle环境，默认 docker 已经安装，执行脚本获取paddlepaddle2.5.2 镜像并自动创建名称为 ppocr的容器，网络顺畅的话很快就可以下载完成，下载完成后执行attach命令就可以进入容器继续操作。

官方paddlepaddle2.5.2容器内python版本为3.7，pip版本为20，默认即可。

# 下载并创建容器

docker run -p 8866:8866 --name ppocr -itd -v $PWD:/paddle registry.baidubce.com/paddlepaddle/paddle:2.5.2 /bin/bash

# 进入容器

docker attach ppocr

参数说明

-p 指定 docker 映射的端口

-name 指定容器的名称

docker 部分常用管理命令

#查看容器情况

docker ps -a

#停止容器

docker stop ppocr

#启动容器

docker start ppocr

#查看所有镜像

docker images

以下操作都在容器内进行

安装paddlehub

进入容器后执行脚本安装paddlehub，版本为2.1.0

pip3 install paddlehub -i https://pypi.doubanio.com/simple

安装过程中会提示typing-extensions版本过低，要求版本要大于4.6.1，卸载当前版本安装指定版本，安装完成后再次执行上述命令安装paddlehub，安装时间较长等待安装完成接口。

image

#卸载当前包

pip uninstall typing-extensions

#安装4.6.1版本

pip3 install typing-extensions==4.6.1

安装PaddleOCR 2.6.0

PaddleOCR 使用 2.6.0版本

首先从gitee获取PaddleOCR代码，PaddleOCR在gitee仓库的最新版本为2.6.0，在 github仓库的最新版本为2.7.1，2.7.1依赖 python 版本需要>=3.8，此处需要注意.

cd /home

git clone https://gitee.com/paddlepaddle/PaddleOCR.git

代码下载完成后进入PaddleOCR文件夹内执行脚本安装依赖包

cd /home/PaddleOCR

#安装依赖包

pip3 install -r requirements.txt -i https://pypi.doubanio.com/simple

hubserving服务配置

hubserving服务部署目录下包括文本检测、文本方向分类，文本识别、文本检测+文本方向分类+文本识别3阶段串联，版面分析、表格识别和PP-Structure七种服务包，可以按需安装使用，使用前需要下载对应模型并进行配置，以下已文本检测+文本方向分类+文本识别3阶段串联服务(ocr_system)和表格识别(structure_table)为例进行说明。

文本检测+文本方向分类+文本识别3阶段串联服务(ocr_system)配置