算术图片验证码(四则运算)+selenium

一、表达式解析

这里假设已经识别出来表达式,如何识别验证码图片里的表达式,放在下面讲。涉及到的正则表达式的解析放在本篇文章最后面。

python 复制代码
import re
# 表达式解析(支持小数的 +-*/ 和中文运算符)
def parse_math_expression(text):
    # 替换中文运算符为英文
    text = text.replace('加', '+').replace('减', '-').replace('乘', '*').replace('除', '/')
    text = text.replace('x', '*').replace('X', '*').replace('÷', '/')

    # 正则表达式提取表达式中的数字和运算符
    # match = re.search(r'(\d+)\s*([+\-*/]|加|减|乘|除)\s*(\d+)', text)
    match = re.search(r'(\d+(?:\.\d+)?)\s*([+\-*/]|加|减|乘|除)\s*(\d+(?:\.\d+)?)', text) # 可匹配小数
    if not match:
        return None

    num1, operator, num2 = match.groups()
    try:
        num1 = float(num1)
        num2 = float(num2)

        # 计算结果
        if operator == '+':
            result = num1 + num2
        elif operator == '-':
            result = num1 - num2
        elif operator == '*':
            result = num1 * num2
        elif operator == '/':
            result = num1 / num2
        else:
            return None

        # 要么返回整数,要么返回最多两位小数,round()四舍六入五平分,如果五平分的进位不对,刷新页面重新识别吧,懒得处理了
        return int(result) if result.is_integer() else round(result, 2)
    except:
        return None


# 调试用
ocr_result = "9.1加3.2等于"

result = parse_math_expression(ocr_result)
if result is not None:
    print(f"计算结果: {result}")

else:
    print("无法解析表达式")

二、配合selenium

python 复制代码
#!/usr/bin/env python
# encoding: utf-8


from selenium import webdriver
from selenium.webdriver.common.by import By
import time
import ddddocr
import re


# 表达式解析(支持 +-*/ 和中文运算符)
def parse_math_expression(text):
    # 替换中文运算符为英文
    text = text.replace('加', '+').replace('减', '-').replace('乘', '*').replace('除', '/')
    text = text.replace('x', '*').replace('X', '*').replace('÷', '/')

    # 正则表达式提取表达式中的数字和运算符
    # match 对象包含匹配成功的信息,若未匹配到则返回 None
    # match = re.search(r'(\d+)\s*([+\-*/]|加|减|乘|除)\s*(\d+)', text) #匹配整数
    match = re.search(r'(\d+(?:\.\d+)?)\s*([+\-*/]|加|减|乘|除)\s*(\d+(?:\.\d+)?)', text) # 可匹配小数
    if not match:
        return None

    num1, operator, num2 = match.groups() #groups()	仅包含捕获组,索引从 0 开始,如('3.14', '乘', '2.71')
    try:
        num1 = float(num1)
        num2 = float(num2)

        # 计算结果
        if operator == '+':
            result = num1 + num2
        elif operator == '-':
            result = num1 - num2
        elif operator == '*':
            result = num1 * num2
        elif operator == '/':
            result = num1 / num2
        else:
            return None

        # 要么返回整数,要么返回最多两位小数,round()四舍六入五平分,如果五平分的进位不对,刷新页面重新识别吧
        return int(result) if result.is_integer() else round(result, 2)
    except:
        return None



# 配置浏览器
options = webdriver.ChromeOptions()
driver = webdriver.Chrome(options=options)
driver.implicitly_wait(5)

# 打开验证码页面
driver.get('http://127.0.0.1/1.html')
time.sleep(2)  # 等待页面加载

# 获取验证码图片
captcha_element = driver.find_element(By.ID, 'captcha')
captcha_png = captcha_element.screenshot_as_png


# 初始化 OCR 引擎(支持中文运算符)
ocr = ddddocr.DdddOcr(show_ad=False)
# OCR 识别
ocr_result = ocr.classification(captcha_png)
print(f"OCR 识别结果: {ocr_result}")

# 计算表达式结果
# ocr_result = '9.14加3.15等于' # debug使用
result = parse_math_expression(ocr_result)

if result is not None:
    print(f"计算结果: {result}")

    # 自动填写结果(假设输入框 ID 为 'captcha_input')
    input_element = driver.find_element(By.ID, 'captcha_input')
    input_element.send_keys(str(result))

    # 提交表单(假设按钮 ID 为 'submit')
    submit_button = driver.find_element(By.ID, 'submit')
    submit_button.click()
    print("已提交表单")
else:
    print("无法解析表达式")


# 等待用户查看结果后关闭浏览器
time.sleep(5)
driver.quit()

三、引申:正则表达式搭配group()

group() 是 Python 正则表达式模块 re 中用于提取匹配结果的核心方法,必须与正则表达式的匹配对象(Match 对象)搭配使用。

1. group()基本定义

  • match.group(n):返回正则表达式中第 n 个捕获组的匹配内容。
  • match.group(0):返回整个匹配的字符串(即正则表达式匹配到的完整文本)。
python 复制代码
import re

text = "今天是2023-06-07"
regex = r'(\d{4})-(\d{2})-(\d{2})'  # 三个捕获组:年、月、日
match = re.search(regex, text)

if match:
    print(match.group(0))  # 整个匹配: "2023-06-07"
    print(match.group(1))  # 第一个捕获组: "2023"
    print(match.group(2))  # 第二个捕获组: "06"
    print(match.group(3))  # 第三个捕获组: "07"

注意:match.groups()跟match.group()是不一样的,groups()返回内容仅包含捕获组(即括号()中定义的内容),不包含整个匹配结果。上面的算术代码用的是groups()。

2. 例子中的正则表达式解析

(1)(\d+(?:.\d+)?) 匹配整数或小数

部分 含义 示例匹配
\. 匹配小数点(. 需要转义) .
\d+ 匹配 1 个或多个数字 14、5
(?:...) 非捕获组(不创建分组) 仅用于分组,不保存结果
? 前面的内容可选(0 次或 1 次) .14、空字符串

(2)空白字符 \s*

  • \s:匹配任意空白字符(空格、制表符、换行等)
  • *:匹配 0 次或多次(即可有可无)

(3)运算符部分 ([+-*/]|加|减|乘|除)

  • 逻辑或 |:分隔多个可选模式,匹配其中任意一个
  • 分组 ():捕获匹配的内容,便于后续提取 [ ] :字符组,匹配其中任意一个字符
  • 需要转义(-),否则表示范围(如 [0-9])
  • +、* 理论上需要转义,但多数引擎允许不转义

四、用到的验证码识别库ddddocr

DdddOcr 带带弟弟OCR通用验证码离线本地识别SDK免费开源版

(链接包含各种强大用法的使用文档,感兴趣可看,如下图)

相关推荐
chao_78912 分钟前
链表题解——两两交换链表中的节点【LeetCode】
数据结构·python·leetcode·链表
大霞上仙1 小时前
nonlocal 与global关键字
开发语言·python
Mark_Aussie1 小时前
Flask-SQLAlchemy使用小结
python·flask
程序员阿龙2 小时前
【精选】计算机毕业设计Python Flask海口天气数据分析可视化系统 气象数据采集处理 天气趋势图表展示 数据可视化平台源码+论文+PPT+讲解
python·flask·课程设计·数据可视化系统·天气数据分析·海口气象数据·pandas 数据处理
ZHOU_WUYI2 小时前
Flask与Celery 项目应用(shared_task使用)
后端·python·flask
且慢.5892 小时前
Python_day47
python·深度学习·计算机视觉
佩奇的技术笔记2 小时前
Python入门手册:异常处理
python
大写-凌祁2 小时前
论文阅读:HySCDG生成式数据处理流程
论文阅读·人工智能·笔记·python·机器学习
爱喝喜茶爱吃烤冷面的小黑黑3 小时前
小黑一层层削苹果皮式大模型应用探索:langchain中智能体思考和执行工具的demo
python·langchain·代理模式
Blossom.1184 小时前
使用Python和Flask构建简单的机器学习API
人工智能·python·深度学习·目标检测·机器学习·数据挖掘·flask