python实现提取图片中文字

时间:2024-10-15 08:21:08

1、首先我贴出代码:from PIL import Imageimport pytesseracttext=pytesseract.image_to_string(Image.open('demo.png'),lang='chi_sim')print(text)

python实现提取图片中文字

2、然后给出我的项目目录,以及图片信息,和最后的运行结果

python实现提取图片中文字
python实现提取图片中文字
python实现提取图片中文字

3、但是就这样去运行肯定不会对的,需要去安装相应的模块:首先安转pytesseract模块:在命令行中pip install pytesseract

python实现提取图片中文字

4、安装PIL模块,我直接使用pip install PIL出错了,是因为官方给出的PIL是32位的,但是我电脑是64位的,所以去下载Pillow-6.0.0-cp36-cp36m-win_amd64.whl 这里cp36是我的python版本为3.6,请根据自己版本下载

python实现提取图片中文字

5、下载好之后,我们先安装wheel模块,然后安装刚才下载的文件

python实现提取图片中文字

6、在所需要的模块安装好之后,可能运行还是回出错,所以需要下载识别引擎tesseract-ocr

python实现提取图片中文字

7、下载好之后,我们就安装好它,然后设置pytesseract使用该识别引擎

python实现提取图片中文字
python实现提取图片中文字

8、最后就基本ok了,但是如果要要识别中文,就需要下载 tesseract-ocr的中文语言包了。总结而言,就是两个模块的安装,然后识别引擎的安装与配置,还有相应的语言包

© 手抄报圈