PaddleOCR简介
PaddleOCR是一个基于PaddlePaddle的开源光学字符识别(OCR)工具库,可以实现快速、准确地识别图像中的文字,它提供了丰富的模型和预训练权重,支持多种语言和字体,适用于各种场景的文字识别需求。
安装PaddleOCR
1、安装依赖库:
pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple pip install paddleocr
2、下载预训练模型:
wget https://paddleocr.bj.bcebos.com/dygraph_CDN.0/ch_ppocr_mobile_CDN.0_det_infer_model -O paddleocr/ch_ppocr_mobile_CDN.0_det_infer_model wget https://paddleocr.bj.bcebos.com/dygraph_CDN.0/ch_ppocr_mobile_CDN.0_rec_infer_model -O paddleocr/ch_ppocr_mobile_CDN.0_rec_infer_model wget https://paddleocr.bj.bcebos.com/dygraph_CDN.0/ch_ppocr_mobile_CDN.0_cls_infer_model -O paddleocr/ch_ppocr_mobile_CDN.0_cls_infer_model
使用PaddleOCR进行文字识别
1、导入所需库:
from paddleocr import PaddleOCR, draw_ocr import cCDN
2、创建PaddleOCR实例:
ocr = PaddleOCR(use_gpu=False)
3、读取图片并进行文字识别:
def ocr_image(img_path): img = cCDN.imread(img_path) result = ocr.ocr(img, cls=True) return result
4、可视化识别结果:
def draw_result(img, result): for line in result: line_text = ' '.join([word_info[-1] for word_info in line]) x1, y1, x2, y2 = line[0][0], line[0][1], line[0][2], line[0][3] cCDN.rectangle(img, (x1, y1), (x2, y2), (0, 0, 255), 2) cCDN.putText(img, line_text, (x1, y1 10), cCDN.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 0), 2) return img
5、调用函数进行识别:
img_path = 'test.jpg' result = ocr_image(img_path) img = draw_result(cCDN.imread(img_path), result) cCDN.imwrite('result.jpg', img)
相关问题与解答
1、PaddleOCR支持哪些语言?如何设置?
答:PaddleOCR支持多种语言,如中文、英文、日文等,可以通过设置lang
参数来指定识别的语言,要识别中文文本,可以使用以下代码:
result = ocr.ocr(img, lang='ch')
2、PaddleOCR如何设置识别速度?是否支持GPU加速?
答:可以通过设置use_gpu
参数来控制是否使用GPU进行加速,默认情况下,use_gpu
为False,表示使用CPU进行加速,如果要使用GPU加速,可以将use_gpu
设置为True。
ocr = PaddleOCR(use_gpu=True)
原创文章,作者:K-seo,如若转载,请注明出处:https://www.kdun.cn/ask/140722.html