对于我一个python初学者来说，今天花了3个小时左右的时间完整搞定了图形验证码的识别功能，并且可以正常登录成功。

"MSG":"SUCCESS",

文章内容都是我和chatGPT的交流过程，内容比较长，加上代码块部分共计大约7000字（涉及网站登录，验证码自动识别以及相应的OCR工具调用等等）

先来个大招吧，直接让chapGPT输出读取图片验证码数字的代码块！

请用python3.10 写一段解析图片中数字的验证码

为了解析图片中的数字验证码，我们需要进行一些图像处理和数字识别的工作。在Python中，我们可以使用一些常见的库来完成这些任务，比如：

- Pillow：一个用于图像处理的库，可以进行图像格式转换、大小调整、滤镜应用等等操作。
- Tesseract：一个开源的OCR引擎，可以识别图片中的文本。
- OpenCV：一个计算机视觉库，可以进行图像处理和特征提取等操作。

下面是一个简单的示例代码，用于解析一张包含数字验证码的图片：

from PIL import Image
import pytesseract
import cv2

# 加载图片并进行灰度化处理
img = cv2.imread('captcha.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 对图片进行二值化处理
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]

# 对图片进行降噪处理
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
thresh = cv2.erode(thresh, kernel, iterations=1)
thresh = cv2.dilate(thresh, kernel, iterations=1)

# 使用Tesseract识别图片中的数字
result = pytesseract.image_to_string(Image.fromarray(thresh), config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')

# 输出识别结果
print(result)

这段代码的具体步骤如下：

1. 使用OpenCV库的`cv2.imread`函数加载验证码图片，并将其转换为灰度图像。
2. 对灰度图像进行二值化处理，将图片中的数字变为白色，背景变为黑色。
3. 对二值化图像进行降噪处理，去除一些不必要的干扰。
4. 使用Tesseract的`image_to_string`函数识别图像中的数字，并返回识别结果。

需要注意的是，这段代码的效果可能会受到验证码图片质量、字体、干扰等因素的影响，因此并不能保证在所有情况下都能正确识别验证码中的数字。

当我发现验证码是一个blob数据的时候，我要求chatGPT帮我修改代码逻辑，以能够正常解析blob数据

如果这个图片是一个blob数据，需要怎么处理

如果验证码图片是以blob数据的形式传入，我们可以使用Python的`io`模块将其转换为内存中的二进制数据，然后再使用Pillow的`Image`模块读取图像。下面是一个示例代码：
import io
from PIL import Image
import pytesseract
import cv2

# 假设验证码图片数据保存在名为image_blob的变量中
image_data = io.BytesIO(image_blob)

# 使用Pillow的Image模块读取图像
img = Image.open(image_data)

# 将Pillow的Image对象转换为OpenCV的numpy数组
img_array = cv2.cvtColor(np.array(img), cv2.COLOR_RGB2BGR)

# 接下来的处理步骤和上一个例子中的一样
gray = cv2.cvtColor(img_array, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
thresh = cv2.erode(thresh, kernel, iterations=1)
thresh = cv2.dilate(thresh, kernel, iterations=1)
result = pytesseract.image_to_string(Image.fromarray(thresh), config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')

print(result)

这段代码的主要变化在于，我们使用了`io.BytesIO`模块将blob数据转换为二进制数据，然后使用Pillow的`Image.open`函数读取图像。注意，由于不同的验证码图片格式可能不同，可能需要根据实际情况调整图像的颜色空间、二值化参数等。

好了，到现在解析的逻辑已经有了，但是我还没有写获取验证码的代码，懒得自己写了，也是交给chatGPT吧

如果通过get请求获得的图片如何处理

import requests
from PIL import Image
import pytesseract
import cv2

# 假设验证码图片的URL保存在名为image_url的变量中
response = requests.get(image_url)
img = Image.open(io.BytesIO(response.content))

# 将Pillow的Image对象转换为OpenCV的NumPy数组
img_array = cv2.cvtColor(np.array(img), cv2.COLOR_RGB2BGR)

# 接下来的处理步骤和前面的例子一样
gray = cv2.cvtColor(img_array, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
thresh = cv2.erode(thresh, kernel, iterations=1)
thresh = cv2.dilate(thresh, kernel, iterations=1)
result = pytesseract.image_to_string(Image.fromarray(thresh), config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')

print(result)

执行后发现，代码并不能正常执行，提示一个np错误，那么就继续修正吧

np的方法是哪里的

`np`指的是`NumPy`库，是Python中常用的科学计算库之一。它提供了丰富的多维数组（ndarray）对象和各种数组操作函数，是许多其他科学计算库的基础。

要使用`NumPy`库，需要先安装它。可以使用以下命令来安装：

pip install numpy

安装完成后，在代码中可以通过`import numpy as np`来导入`NumPy`库，然后使用`np`来代替`numpy`，例如：

import numpy as np

# 创建一个3x3的二维数组
a = np.array([[1, 2, 3], [4, 5, 6], [7,

pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information 为什么会提示这个错误，pytesseract已经安装了

又遇到了新的问题，真是太难为人了，不过好在chatGPT可以帮我们分析代码，已经不用自己去搜索了

这个错误提示表明`tesseract`并没有正确地安装或配置在系统的环境变量中。`pytesseract`是一个Python的OCR库，它需要调用`tesseract`命令行工具来进行图片识别，因此需要确保`tesseract`已经正确安装，并且可以通过命令行调用。

如果您已经安装了`tesseract`但仍然出现这个错误，可以尝试以下几种方法：

1. 检查`tesseract`是否正确安装并添加到了系统环境变量中。可以通过在命令行输入`tesseract`来检查。

2. 指定`tesseract`命令的路径，可以在调用`pytesseract.image_to_string`函数时，将`tesseract`命令的路径传递给`config`参数，例如：

   ```python
   pytesseract.image_to_string(Image.fromarray(thresh), config='--tessdata-dir /path/to/tessdata')
   ```

   其中`/path/to/tessdata`是`tesseract`命令所在的目录。

3. 如果您是在Windows上使用`tesseract`，可能需要将`tesseract`所在的路径添加到系统的Path环境变量中。可以通过以下步骤实现：

   - 右键单击“此电脑”，选择“属性”，然后点击“高级系统设置”。
   - 在“高级”选项卡中，点击“环境变量”。
   - 在“系统变量”中找到“Path”，并点击“编辑”。
   - 在弹出的对话框中，添加`tesseract`所在的路径，例如“C:\Program Files (x86)\Tesseract-OCR”。
   - 点击“确定”保存变更。

如果上述方法仍然无法解决问题，建议您参考`tesseract`的官方文档或相关的技术论坛进行进一步的调试和解决。

SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 17-18

再来，继续报错，还是得找chatGPT君来协助

这个错误通常发生在Windows系统中，原因是因为在字符串中使用了反斜杠`\`，但是反斜杠被解释成了转义字符，导致编码错误。

例如，在Windows系统中，如果要指定文件路径为`C:\Usersame\file.txt`，可以使用以下代码：

```python
file_path = 'C:\\Users\ame\\file.txt'
```

在这个例子中，由于反斜杠被解释成了转义字符，因此需要使用双反斜杠来表示单个反斜杠。

另外，还可以使用原始字符串来避免这个问题，例如：

```python
file_path = r'C:\Usersame\file.txt'
```

在原始字符串中，反斜杠不会被解释成转义字符，因此不需要进行转义。

如果您遇到了类似的编码错误，可以检查字符串中是否包含了反斜杠，并使用上述方法来避免这个问题。

离成功貌似近了一步，但是还是出错了，这里是我犯的一个低级错误，明明让我配置一个目录，我写了一个完整的文件路径，这个是我的错！

# 使用Tesseract识别图片中的数字 result = pytesseract.image_to_string(Image.fromarray(thresh), config='–tessdata-dir C:\\xxxxx\\tesseract.exe –psm 10 –oem 3 -c tessedit_char_whitelist=0123456789')

在这个代码中，您指定了`tesseract.exe`的目录，但是实际上`tesseract.exe`是一个可执行文件，而不是一个目录。因此，应该将`tesseract.exe`所在的目录作为参数传递给`--tessdata-dir`选项。

另外，`--tessdata-dir`选项通常用于指定`tesseract`的数据文件目录，而不是`tesseract.exe`的目录。如果您只是需要指定`tesseract.exe`的目录，可以在`config`参数中使用`--tessdata-dir`选项。

因此，您可以尝试使用以下代码来指定`tesseract.exe`的目录：

```python
result = pytesseract.image_to_string(Image.fromarray(thresh), config='--tessdata-dir "C:\\xxxx\\" --psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')
```

在这个代码中，`--tessdata-dir`选项指定了`tesseract`的数据文件目录为`"C:\\xxxx\\"`，双引号是为了避免反斜杠被解释成转义字符。`config`参数中的其他选项是用来指定识别参数的，您可以根据需要进行修改。

问题貌似更复杂了，
Traceback (most recent call last):
  File "xxxxx\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\site-packages\pytesseract\pytesseract.py", line 255, in run_tesseract
    proc = subprocess.Popen(cmd_args, **subprocess_args())
  File "C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.10_3.10.3056.0_x64__qbz5n2kfra8p0\lib\subprocess.py", line 971, in __init__
    self._execute_child(args, executable, preexec_fn, close_fds,
  File "C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.10_3.10.3056.0_x64__qbz5n2kfra8p0\lib\subprocess.py", line 1456, in _execute_child
    hp, ht, pid, tid = _winapi.CreateProcess(executable, args,
FileNotFoundError: [WinError 2] 系统找不到指定的文件。

During handling of the above exception, another exception occurred:
 return {
  File "xxxxx\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\site-packages\pytesseract\pytesseract.py", line 426, in <lambda>
    Output.STRING: lambda: run_and_get_output(*args),
  File "xxxxx\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\site-packages\pytesseract\pytesseract.py", line 288, in run_and_get_output
    run_tesseract(**kwargs)
  File "xxxxx\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\site-packages\pytesseract\pytesseract.py", line 260, in run_tesseract
    raise TesseractNotFoundError()
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.

chatGPT给了我完整的解释，多次配置重试后终于，这块也搞定了

根据报错信息显示，pytesseract在运行时无法找到tesseract的安装路径或者tesseract并没有被安装在你的计算机上。你需要安装tesseract，并将其添加到你的系统PATH环境变量中。你可以按照以下步骤安装tesseract：

1. 访问tesseract官方网站https://github.com/tesseract-ocr/tesseract，下载适合你的操作系统的最新版本的安装程序。
2. 运行安装程序，并按照提示完成tesseract的安装。
3. 在系统环境变量中添加tesseract安装目录的路径，例如“C:\Program Files\Tesseract-OCR”。
4. 重启你的计算机并尝试重新运行你的代码。

这个错误提示是由于 pytesseract 库找不到语言数据文件（traineddata）导致的。你可以尝试以下方法进行修复：

1. 首先，确认你已经安装了 Tesseract OCR 引擎，并且安装目录中包含了对应的 traineddata 文件（例如，对于英文识别，应该包含 eng.traineddata 文件）。

2. 打开 cmd 窗口，执行以下命令：

   setx TESSDATA_PREFIX "C:\Program Files (x86)\Tesseract-OCR\tessdata"

   这里需要把 "C:\Program Files (x86)\Tesseract-OCR\tessdata" 替换成你自己的 traineddata 文件所在的目录。

3. 重新运行你的 Python 代码，看看是否还有错误提示。

如果还有问题，请随时告诉我。

你需要下载 `eng.traineddata` 文件并将其放置到 `tessdata` 目录下。你可以在以下网址中下载此文件：

https://github.com/tesseract-ocr/tessdata/blob/main/eng.traineddata

然后，将下载的 `eng.traineddata` 文件复制到 `tessdata` 目录下。此目录的默认路径是在 Tesseract 安装文件夹下的 `tessdata` 目录。如果你不确定其位置，可以在命令行中输入以下命令：

```
tesseract --list-langs
```

它将打印出 Tesseract 可用的语言列表以及它们所在的路径。

好的，那么接下来你需要在系统环境变量中设置一个名为 `TESSDATA_PREFIX` 的变量，变量值为 tesseract 的安装路径加上 `tessdata` 子目录的完整路径，例如 `C:\Program Files\Tesseract-OCR\tessdata`。

设置完毕后，请重新启动 Python 程序，看看问题是否得到解决。

如果您已经将TESSDATA_PREFIX环境变量设置为包含Tesseract OCR的data文件夹的路径，但仍然遇到相同的问题，请确保以下事项：

1. 检查路径是否正确。确保路径中的斜杠/反斜杠正确，没有任何拼写错误。

2. 检查Tesseract OCR的data文件夹中是否包含正确的traineddata文件。检查文件夹路径和文件名是否正确，如果缺少traineddata文件，请下载它们并将它们放在正确的文件夹中。

3. 确保您的系统具有读取权限。确保您的用户帐户可以读取TESSDATA_PREFIX文件夹和其内容。

如果上述步骤都没有解决问题，您可能需要重新安装Tesseract OCR，并确保在安装过程中选择安装traineddata文件。

如果您已经设置了环境变量，并且 `tessdata` 目录中已经包含了 `eng.traineddata` 文件，但是 `pytesseract` 仍然无法找到语言数据，请尝试以下几个方法：

1. 确认您使用的是正确的语言数据文件：在 `tessdata` 目录下检查是否存在其他语言的 `.traineddata` 文件，如果有，请尝试更改 `pytesseract` 的语言设置。

2. 确认 `tesseract` 的版本是否正确：请检查您安装的 `tesseract` 版本是否与 `pytesseract` 兼容。可以尝试更新 `pytesseract` 或者降低 `tesseract` 的版本来解决问题。

3. 确认 `tesseract` 是否正确安装：如果以上方法仍然无法解决问题，您可以尝试重新安装 `tesseract`，确保安装过程中没有出现任何错误。

4. 尝试手动指定语言数据文件路径：您可以尝试手动指定语言数据文件路径，例如：

```python
custom_config = r'--tessdata-dir "C:\Program Files\Tesseract-OCR\tessdata"'
result = pytesseract.image_to_string(Image.fromarray(thresh), config=custom_config)
```

这里的 `--tessdata-dir` 参数可以指定语言数据文件的路径，替换为您实际的 `tessdata` 目录路径即可。

经过一系列的倒腾后，终于可以正常运行了，但是获取的验证码是空白的啊！！！要命了

如何调整参数，现在识别不到验证码


   # 对图片进行二值化处理
    thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
    # 对图片进行降噪处理

    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
    thresh = cv2.erode(thresh, kernel, iterations=1)
    thresh = cv2.dilate(thresh, kernel, iterations=1)

调整参数可能会有一定帮助，以下是一些常见的调整方法：

1. 调整阈值：可以尝试使用不同的阈值方法，例如cv2.THRESH_BINARY或cv2.THRESH_TRUNC等来进行处理。
    
2. 调整二值化处理时的kernel大小：可以通过调整kernel的大小来改善二值化处理的效果。一般来说，kernel越小，去噪能力越强，但也可能会导致验证码中的细节信息丢失。
    
3. 调整降噪处理的iterations次数：可以通过增加或减少iterations次数来调整去噪效果。
    
4. 调整pytesseract的参数：可以通过调整pytesseract的参数，例如psm和oem等参数，来优化验证码的识别效果。

以上方法都是可以尝试的，但不一定都能够有效解决问题。你可以通过不断尝试来调整参数，看看是否能够得到更好的效果。

这个方法我试了，不太行，放弃了

然后自己琢磨了，去掉了降噪处理这部分

    # 对图片进行降噪处理
    
    #kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
    #thresh = cv2.erode(thresh, kernel, iterations=1)
    #thresh = cv2.dilate(thresh, kernel, iterations=1)

令人振奋的时候可以获取验证码了，但是系统提示验证码不正确，呵呵，我就不行了，都到这一步了，继续捣鼓吧,

6524

{"MSG":"验证码错误!","STATUS":"3000"}

本来打算保存成文件对比看看的，结果在保存文件的时候又不错了，不过这次比较简单，很直观的看到文件名多了一个\n,知道问题就好办了，写个正则处理掉吧，结果。。。你知道的，小白来讲，写正则也是难事啊，刚开始就遇到问题

    pattern=re.compile(r'(\d+)).*',re.I)
    result1=''
    if pattern.match(result):
        result1=pattern.match(result)
    print(result1)

代码直接丢给chatGPT了，来吧，解释一下

万能的chatGPT，指出别人毛病都让我觉得舒服，好吧，既然帮我修复了，我就直接拿来主义了

在你的代码中有一个小错误：`re.compile` 中的正则表达式没有闭合括号。你可以尝试以下代码来修复这个错误：

```python
import re

pattern = re.compile(r'(\d+).*', re.I)
result1 = ''
match = pattern.match(result)
if match:
    result1 = match.group(1)
print(result1)
```

在这里，我们使用 `group(1)` 来获取匹配到的第一个分组。同时，我们还将正则表达式的括号闭合，并使用 `match.group(1)` 来获取第一个分组的匹配结果。

看到这，一切大功告成

"MSG":"SUCCESS",

生意营销3大宝：彩铃、定位、认证，一个也不能少，如有需要，添加微信：xnc528 备注：3

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 820277912@qq.com 举报，一经查实，本站将立刻删除。
如若转载，请注明出处：https://www.clzz8.com/48907.html

chatGPT真是太神了！小白也能变高手