PaddleOCR 的使用,极简介绍

发布时间:2023年12月25日

安装

参考github的官网就可以:

github链接

简单的说,就是两句话:

python3 -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple

pip install "paddleocr>=2.0.1" # 推荐使用2.0.1+版本

Python下的使用

from paddleocr import PaddleOCR
import cv2
import numpy as np
if __name__=="__main__":

    ocr = PaddleOCR(use_angle_cls=True, use_gpu=True,ocr_version='PP-OCRv4')
    img_path = r'F:\dataset\images\1.bmp'
    img=cv2.imread(img_path)
    result = ocr.ocr(img, cls=True)[0]
    for line in result:
        list_points=line[0]
        str_data,conf=line[1]
        pts = np.array(list_points, np.int32)
        pts = pts.reshape((-1, 1, 2))
        cv2.polylines(img, [pts], isClosed=True, color=(0, 255, 255), thickness=1)
        cv2.imshow("img",img)
        cv2.waitKey(0)

这里面包括了图片的读取,推理过程,还有检测框的显示。

如果想对每一个字符都做框选,可以多写几句画,把每个框都拆出来。

from paddleocr import PaddleOCR
import cv2
import numpy as np
if __name__=="__main__":
    ocr = PaddleOCR(use_angle_cls=True, use_gpu=True,ocr_version='PP-OCRv4')
    img_path = r'F:\dataset\images\1.bmp'
    img=cv2.imread(img_path)
    result = ocr.ocr(img, cls=True)[0]
    for line in result:
        list_points=line[0]
        str_data,conf=line[1]
        len_str=len(str_data)
        p0,p1,p2,p3=np.array(list_points)
        for ic in range(len_str):
            p0_c=p0+(p1-p0)/len_str*ic
            p1_c=p0+(p1-p0)/len_str*(ic+1)
            p2_c=p3+(p2-p3)/len_str*(ic+1)
            p3_c=p3+(p2-p3)/len_str*(ic)
            list_ps=[p0_c,p1_c,p2_c,p3_c]
            pts = np.array(list_ps, np.int32)
            pts = pts.reshape((-1, 1, 2))
            cv2.polylines(img, [pts], isClosed=True, color=(0, 255, 255), thickness=1)
            cv2.imshow("img",img)
            cv2.waitKey(0)

文章来源:https://blog.csdn.net/lianbus/article/details/135206943
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。