爬虫教程(六)验证码识别
安装tesseract
安装pytesseract
pip install pytesseract
PIL
。
pip install pillow
实例
pytesseract
将图片上的文字转换为文本文字的示例代码如下:
import pytesseract
from PIL import Image
# 指定tesseract.exe所在的路径
pytesseract.pytesseract.tesseract_cmd = r'E:\Tesseract-OCR\tesseract.exe'
# 打开图片
image = Image.open("验证图片.png")
# 调用image_to_string将图片转换为文字
text = pytesseract.image_to_string(image)
print(text)
输出结果: