1:图像库安装,然后导入相应的库文件包
(1)安装图像库PIL,可用pip install PIL;安装图像文本识别库pytesseract,可用pip install?pytesseract,或先下载依赖库文件后安装。
(2)用import导入相应的库文件包。
import os
from PIL import Image
import pytesseract
(1)用Image包的open()函数打开要进行图像文本识别的文件。
(2)使用pytesseract包的image_to_string()函数进行图像文本识别。
def image_to_words(image_path):
image = Image.open(image path)
words =pytesseract.image to string(image,'chi_sim')
print(words)
return words
(1)用文件操作的open()函数打开保存路径。
(2)用文件操作的write()函数写入识别出的文本内容。
(3)用文件操作的close()函数关闭文件。
def save_words(save_path, words):
f= open(save path,'a+')
f.write(words)
f.close