从零构建Selenium自动化测试框架：POM模式与unittest实战指南

发布时间：2026/7/5 9:30:43

1. 项目概述从零构建一个可落地的UI自动化测试框架如果你是一名测试工程师或者正在学习Python自动化那么“Selenium自动化测试”这个词对你来说一定不陌生。但很多时候我们学到的知识是零散的今天学一个元素定位明天看一个unittest的例子真正要自己动手搭建一个能用在真实项目里的自动化框架时却感觉无从下手代码写得七零八落维护起来更是头疼。这正是我几年前的真实写照。后来我花了大量时间通过一个名为“Agileone”的开源项目作为实战靶场将Selenium的8种核心元素定位方法与Python的unittest框架深度整合设计出了一套结构清晰、易于维护的自动化测试框架。这套框架不仅帮我高效完成了回归测试更成为了我面试和带新人时的“硬通货”。今天我就把这个从“会用Selenium”到“会设计框架”的完整心法和实战代码毫无保留地分享给你。这个框架的核心价值在于“一体化”和“工程化”。它不仅仅是教你find_element_by_id怎么用而是系统地告诉你在真实的网页面前面对复杂的DOM结构如何选择最高效、最稳定的定位策略如何将这些定位操作封装成可复用的页面对象Page Object又如何利用unittest框架来组织测试用例、管理前置后置条件、生成漂亮的测试报告。整个过程我会以“定位方法解析 - 代码封装 - 框架集成 - 实战演练”为主线带你一步步走完。无论你是刚入门的新手还是想提升框架设计能力的老手这篇文章都能让你获得可以直接抄作业的解决方案。2. 核心需求解析为什么你的自动化脚本总是“脆弱”在深入技术细节之前我们必须先搞清楚一个根本问题为什么很多人的Selenium脚本跑几次就失效了常见的痛点无非是这几个元素定位不到、脚本运行不稳定、用例管理混乱、报告不直观。其根源在于大多数教程只教了“语法”没教“工程”。2.1 元素定位的“稳定性”与“可维护性”需求网页不是一成不变的。前端开发改了一个id或者把div换成了span你的脚本可能就立刻崩溃。因此我们的第一个核心需求是找到一种或多种尽可能不受前端微小改动影响的元素定位方法。这要求我们不仅要会8种定位方式更要理解它们的优先级和使用场景知道在什么情况下该用哪一种以及如何编写“防御性”的定位代码。2.2 测试用例的“结构化”与“可复用性”需求几十个测试用例如果全部写在一个.py文件里用一堆driver.find_element和assert堆砌而成那将是一场维护噩梦。我们需要像开发软件一样来组织测试代码。这就需要引入测试框架如unittest或pytest来实现测试用例的模块化管理、通用的前置登录后置退出、截图操作、测试数据的分离。2.3 框架的“易用性”与“可扩展性”需求一个好的框架应该让写新测试用例像搭积木一样简单而不是每次都要从头开始写WebDriver初始化。我们需要设计一个基础结构把浏览器驱动管理、公共操作如登录、页面元素定位、测试数据、测试用例、测试报告生成这些模块清晰地分离开。这样当项目从Web端扩展到移动端Appium或者需要加入接口测试时框架能够平滑地扩展而不是推倒重来。基于以上三点我们这次实战的目标就非常明确了以Agileone系统一个典型的Web应用为被测对象设计一个融合了最佳定位实践、页面对象模式Page Object Model, POM和unittest框架的、即拿即用的自动化测试框架。3. 环境准备与基础搭建工欲善其事必先利其器。在开始写第一行定位代码之前我们需要先把战场布置好。这里我推荐使用PyCharm作为IDE它的项目管理、虚拟环境管理和代码提示对新手非常友好。3.1 安装核心库打开你的终端或PyCharm的Terminal创建并激活一个虚拟环境是良好的习惯可以避免包版本冲突。然后执行以下安装命令pip install selenium pip install unittest-xml-reporting # 用于生成更详细的XML格式报告注意unittest是Python的标准库无需安装。unittest-xml-reporting是一个第三方库它能让我们生成的报告更容易被持续集成工具如Jenkins解析。3.2 下载浏览器驱动Selenium需要通过一个“驱动”来操作浏览器。这里以最常用的Chrome为例。查看你的Chrome浏览器版本在浏览器地址栏输入chrome://settings/help。访问ChromeDriver官网或国内镜像站下载与你的Chrome版本号完全匹配的驱动。将下载的chromedriver.exeWindows或chromedriverMac/Linux文件放在一个你记得住的目录比如C:\WebDriver\并将该目录添加到系统的PATH环境变量中。更简单的做法是在代码中指定驱动的绝对路径。3.3 项目目录结构设计一个清晰的目录结构是框架的骨架。在项目根目录下我建议创建如下文件夹和文件Agileone_AutoTest/ ├── common/ # 公共模块 │ ├── __init__.py │ ├── base_page.py # 所有页面类的基类封装通用方法 │ └── webdriver_utils.py # 浏览器驱动初始化和退出管理 ├── page_objects/ # 页面对象层 │ ├── __init__.py │ ├── login_page.py # 登录页面 │ ├── main_page.py # 主页面 │ └── ... # 其他页面 ├── test_cases/ # 测试用例层 │ ├── __init__.py │ ├── test_login.py │ └── ... # 其他测试模块 ├── test_data/ # 测试数据层 │ └── data.json 或 data.py ├── reports/ # 测试报告输出目录 ├── logs/ # 日志输出目录 └── run_tests.py # 测试执行入口文件这个结构遵循了经典的“分层设计”将定位、操作、用例、数据、报告分离极大提升了代码的可读性和可维护性。接下来我们就从最核心的元素定位开始填充这个框架。4. Selenium 8种元素定位方法深度解析与实战这是Selenium的基石也是脚本稳定性的第一道关卡。很多人只知道id和xpath但实际上根据场景灵活选用定位方式是写出健壮脚本的关键。我将结合Agileone登录页面的实际元素为你逐一拆解。4.1 定位方法总览与优先级策略Selenium提供的8种定位方式可以归纳为三大类首选高优先级id,name,class_name。这些通常是前端开发有意设置的唯一标识定位速度快稳定性最高。次选灵活性强tag_name,link_text,partial_link_text。适用于特定场景如链接、批量同类元素。终极大招万能但需谨慎xpath,css_selector。当上述所有方法都失效时使用功能最强大但编写复杂且可能因前端结构变化而失效。一个重要的实战原则是“能用简单的就不用复杂的”。优先使用id其次是name和class_name最后才考虑xpath和css_selector。4.2 逐一击破8种定位方法详解与代码示例假设Agileone登录页面的HTML片段如下input typetext idusername nameusername classform-control placeholder请输入用户名 input typepassword idpassword namepassword classform-control a href# idforgot-pwd忘记密码/a button typesubmit classbtn btn-primary btn-block登录/button通过ID定位 (By.ID)这是最理想、最快速的定位方式。ID在HTML中应该是唯一的。from selenium.webdriver.common.by import By username_input driver.find_element(By.ID, username)通过Name定位 (By.NAME)对于表单元素name属性也常常是唯一的。password_input driver.find_element(By.NAME, password)通过Class Name定位 (By.CLASS_NAME)注意class属性可能包含多个类名如btn btn-primary使用CLASS_NAME定位时只能传入其中一个且必须是完整的单个类名。# 正确使用其中一个类名 submit_button driver.find_element(By.CLASS_NAME, btn-primary) # 错误传入多个类名或部分类名 # driver.find_element(By.CLASS_NAME, btn btn-primary) # 会报错 # driver.find_element(By.CLASS_NAME, btn-) # 会报错通过Tag Name定位 (By.TAG_NAME)通常用于获取一类元素的集合比如获取页面上所有的input标签。all_inputs driver.find_elements(By.TAG_NAME, input) # 注意是find_elements返回列表 print(f页面共有 {len(all_inputs)} 个输入框)通过Link Text定位 (By.LINK_TEXT)专门用于定位超链接 (a标签)且需要完全匹配链接的可见文本。forgot_link driver.find_element(By.LINK_TEXT, 忘记密码)通过Partial Link Text定位 (By.PARTIAL_LINK_TEXT)这是LINK_TEXT的模糊版本只需匹配链接文本的一部分即可。forgot_link driver.find_element(By.PARTIAL_LINK_TEXT, 忘记) # 也能定位到通过XPath定位 (By.XPATH)XPath是一种在XML文档中定位节点的语言功能极其强大但语法也相对复杂。它是当前端元素没有id、name等属性时的救星。# 绝对路径脆弱不推荐 # username_input driver.find_element(By.XPATH, /html/body/div/div/div/div/form/input[1]) # 相对路径结合属性推荐 username_input driver.find_element(By.XPATH, //input[idusername]) # 使用文本内容定位 submit_button driver.find_element(By.XPATH, //button[text()登录]) # 使用包含函数进行模糊匹配 submit_button driver.find_element(By.XPATH, //button[contains(class, btn-primary)])实操心得在浏览器开发者工具中你可以直接右键元素 -Copy-Copy XPath但自动生成的XPath往往是冗长且脆弱的绝对路径。我强烈建议你学习手写简洁的相对路径XPath核心是//标签名[属性值]这个格式。使用contains()、starts-with()等函数可以应对部分属性值动态变化的情况。通过CSS Selector定位 (By.CSS_SELECTOR)CSS选择器是前端开发用来定义样式的Selenium也可以用它来定位元素。它的性能通常比XPath略好语法也更简洁。username_input driver.find_element(By.CSS_SELECTOR, #username) # 通过ID password_input driver.find_element(By.CSS_SELECTOR, input[namepassword]) # 通过标签属性 submit_button driver.find_element(By.CSS_SELECTOR, .btn-primary) # 通过Class all_inputs driver.find_elements(By.CSS_SELECTOR, input.form-control) # 标签Class组合注意事项CSS选择器无法像XPath那样直接使用文本内容(text())定位。对于通过文本定位链接XPath的//a[text()...]更有优势。4.3 定位策略的“组合拳”与等待机制在实际项目中几乎没有一种定位方法能通吃所有场景。我的策略是首选ID没有则看NAME或唯一的CLASS。对于链接用LINK_TEXT或PARTIAL_LINK_TEXT。对于复杂或动态元素优先尝试编写稳健的CSS Selector如果不行再使用XPath。永远不要假设元素立即可用。网络延迟、JS渲染都会导致元素加载慢于脚本执行。必须使用“显式等待”。from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC # 等待最多10秒直到ID为‘username’的元素出现 username_input WebDriverWait(driver, 10).until( EC.presence_of_element_located((By.ID, username)) ) # 或者等待元素可点击 submit_button WebDriverWait(driver, 10).until( EC.element_to_be_clickable((By.CSS_SELECTOR, .btn-primary)) )显式等待是编写稳定自动化脚本的必备技能它比固定的sleep时间更高效、更可靠。5. 基于Page Object Model (POM) 的页面对象封装掌握了定位方法如果直接在测试用例里写driver.find_element代码很快就会变得难以维护。Page Object Model (POM) 设计模式就是为了解决这个问题。它的核心思想是将一个页面的所有元素定位和操作封装在一个类中测试用例只调用这个类提供的方法不关心具体如何定位和操作。5.1 设计基础页面类 (BasePage)首先我们在common/base_page.py中创建一个所有页面类的父类封装一些通用操作比如查找元素、点击、输入等。from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.support import expected_conditions as EC class BasePage: def __init__(self, driver): self.driver driver self.wait WebDriverWait(driver, 10) # 设置一个全局等待超时时间 def find_element(self, *locator): 查找单个元素并加入显式等待 return self.wait.until(EC.presence_of_element_located(locator)) def find_elements(self, *locator): 查找多个元素 return self.wait.until(EC.presence_of_all_elements_located(locator)) def click(self, *locator): 点击元素等待其可点击 element self.wait.until(EC.element_to_be_clickable(locator)) element.click() def input_text(self, text, *locator): 向输入框输入文本先清空再输入 element self.find_element(*locator) element.clear() element.send_keys(text) def get_text(self, *locator): 获取元素的文本内容 return self.find_element(*locator).text5.2 封装登录页面 (LoginPage)现在我们来封装Agileone的登录页面。在page_objects/login_page.py中from common.base_page import BasePage from selenium.webdriver.common.by import By class LoginPage(BasePage): # 1. 定义页面所有元素的定位器Locator # 使用元组 (By.方法, 定位表达式) 的形式清晰且易于维护 USERNAME_INPUT (By.ID, username) PASSWORD_INPUT (By.NAME, password) LOGIN_BUTTON (By.CSS_SELECTOR, .btn-primary) FORGOT_PWD_LINK (By.PARTIAL_LINK_TEXT, 忘记) # 2. 定义页面的操作行为Action def open(self, url): 打开登录页面 self.driver.get(url) return self # 支持链式调用 def enter_username(self, username): 输入用户名 self.input_text(username, *self.USERNAME_INPUT) return self def enter_password(self, password): 输入密码 self.input_text(password, *self.PASSWORD_INPUT) return self def click_login(self): 点击登录按钮 self.click(*self.LOGIN_BUTTON) # 点击后通常会跳转到新页面这里返回一个MainPage的实例更合适需实现 # from page_objects.main_page import MainPage # return MainPage(self.driver) def login(self, username, password): 登录的完整流程输入用户名、密码、点击登录 self.enter_username(username) self.enter_password(password) return self.click_login() # 返回下一个页面对象通过这样的封装登录页面的所有细节元素如何定位、如何操作都被隐藏在了LoginPage类内部。测试用例的编写者只需要知道调用login(username, password)方法就能完成登录。这极大地降低了用例编写的复杂度和维护成本。6. 使用unittest框架组织测试用例页面对象封装好了接下来我们需要一个框架来组织和管理我们的测试用例。Python自带的unittest框架就是一个非常经典和强大的选择。它提供了测试夹具fixture、测试套件suite、断言assert等完整功能。6.1 理解unittest的核心概念测试用例 (TestCase)继承unittest.TestCase的类类里面每个以test_开头的方法就是一个独立的测试用例。测试夹具 (setUp/tearDown)setUp: 在每个测试方法开始前执行。通常用于初始化工作如启动浏览器、打开网站、登录。tearDown: 在每个测试方法结束后执行。通常用于清理工作如退出浏览器、截图如果失败。setUpClass/tearDownClass: 在整个测试类开始前/结束后执行一次用于更重量级的初始化和清理。6.2 编写第一个测试用例类我们在test_cases/test_login.py中创建一个测试登录功能的用例。import unittest import time from common.webdriver_utils import get_driver, quit_driver from page_objects.login_page import LoginPage class TestLogin(unittest.TestCase): 登录功能测试用例 classmethod def setUpClass(cls): 测试类开始前执行一次初始化浏览器驱动 cls.driver get_driver() # 封装好的获取driver的函数 cls.base_url http://你的Agileone服务器地址/ def setUp(self): 每个测试方法开始前执行打开登录页面 self.login_page LoginPage(self.driver).open(self.base_url) def test_login_success(self): 测试用例1使用正确的用户名和密码登录 # 调用页面对象的方法完成操作 self.login_page.enter_username(admin) self.login_page.enter_password(admin) self.login_page.click_login() time.sleep(2) # 简单等待跳转实际应用中应用显式等待判断新页面元素 # 断言验证登录成功后页面是否跳转到了主页面例如包含“欢迎”字样 # 这里假设主页面标题或某个元素包含“Agileone” self.assertIn(Agileone, self.driver.title) def test_login_failed_with_wrong_password(self): 测试用例2使用错误的密码登录应提示错误 self.login_page.enter_username(admin) self.login_page.enter_password(wrong) self.login_page.click_login() time.sleep(1) # 假设错误提示信息在一个id为‘alert’的元素里 # 在实际项目中LoginPage里应该封装一个获取错误提示的方法 error_msg self.driver.find_element(By.ID, alert).text self.assertIn(错误, error_msg) # 断言错误信息中包含“错误”二字 def tearDown(self): 每个测试方法结束后执行清理cookie为下一个测试准备干净环境 self.driver.delete_all_cookies() classmethod def tearDownClass(cls): 测试类结束后执行一次关闭浏览器 quit_driver(cls.driver) if __name__ __main__: # 运行当前脚本中的所有测试用例 unittest.main()6.3 设计浏览器驱动管理工具 (webdriver_utils.py)为了更优雅地管理浏览器的启动和退出我们在common/webdriver_utils.py中进行封装。from selenium import webdriver import os def get_driver(browserchrome): 获取WebDriver实例支持简单的多浏览器扩展 driver None if browser.lower() chrome: options webdriver.ChromeOptions() # 添加常用选项使自动化运行更稳定 options.add_argument(--disable-gpu) # 禁用GPU加速解决一些渲染问题 options.add_argument(--no-sandbox) # Linux环境下可能需要 options.add_argument(--disable-dev-shm-usage) # 解决Docker或小内存机器问题 # options.add_argument(--headless) # 无头模式不打开浏览器界面 # 指定驱动路径如果已加入PATH则无需此句 driver_path os.path.join(os.getcwd(), drivers, chromedriver) driver webdriver.Chrome(executable_pathdriver_path, optionsoptions) elif browser.lower() firefox: # 类似地配置Firefox driver webdriver.Firefox() else: raise ValueError(f不支持的浏览器类型: {browser}) # 全局隐式等待辅助不能替代显式等待 driver.implicitly_wait(10) # 窗口最大化 driver.maximize_window() return driver def quit_driver(driver): 安全退出WebDriver if driver: driver.quit()7. 构建测试套件与生成HTML测试报告单个测试文件可以运行了但一个项目会有很多测试用例分布在不同的文件中。我们需要一个方式来批量运行它们并生成一份直观的测试报告。unittest本身可以生成文本报告但不够美观。我们可以使用HTMLTestRunner或unittest-xml-reporting结合其他工具来生成HTML报告。7.1 创建测试套件并运行我们创建一个主运行脚本run_tests.py它负责发现所有测试用例运行它们并生成报告。import unittest import time import os from datetime import datetime # 使用unittest-xml-reporting生成XML报告也可用HTMLTestRunner直接生成HTML import xmlrunner # 1. 定义测试用例的目录 test_dir os.path.join(os.path.dirname(__file__), test_cases) # 2. 自动发现该目录下所有以‘test_’开头的.py文件中的测试用例 discover unittest.defaultTestLoader.discover(test_dir, patterntest_*.py) # 3. 定义报告存放路径和文件名 report_dir os.path.join(os.path.dirname(__file__), reports) if not os.path.exists(report_dir): os.makedirs(report_dir) # 生成带时间戳的报告文件名 timestamp datetime.now().strftime(%Y%m%d_%H%M%S) report_file os.path.join(report_dir, ftest_report_{timestamp}.xml) # 4. 使用xmlrunner运行测试并生成报告 with open(report_file, wb) as output: runner xmlrunner.XMLTestRunner(outputoutput, verbosity2) runner.run(discover) print(f测试完成报告已生成: {report_file})7.2 生成更友好的HTML报告unittest-xml-reporting生成的是XML格式可以被Jenkins等CI工具解析。如果你想看更漂亮的HTML报告可以安装pytest和pytest-html或者使用经典的HTMLTestRunner库。这里以HTMLTestRunner为例你需要先下载HTMLTestRunner.py文件放到项目里# run_tests_html.py import unittest import time import os from datetime import datetime # 假设HTMLTestRunner.py放在项目根目录 import sys sys.path.append(.) import HTMLTestRunner # ... (同上发现测试用例) report_file_html os.path.join(report_dir, ftest_report_{timestamp}.html) with open(report_file_html, wb) as f: runner HTMLTestRunner.HTMLTestRunner( streamf, titleAgileone自动化测试报告, description测试环境Chrome 浏览器, verbosity2 ) runner.run(discover)运行这个脚本后你会在reports文件夹下得到一个html文件用浏览器打开可以看到包含通过率、失败详情、错误日志的详细报告非常适合汇报和存档。8. 框架设计进阶数据驱动与日志记录一个成熟的自动化框架还需要考虑测试数据的管理和运行日志的记录以便于问题排查和测试分析。8.1 实现数据驱动测试将测试数据与测试脚本分离是基本原则。我们可以使用JSON、YAML或Excel来存储数据。这里以JSON为例。在test_data/login_data.json中[ { case_name: 正确用户名密码, username: admin, password: admin, expected: login_success }, { case_name: 错误密码, username: admin, password: wrong, expected: login_fail }, { case_name: 空用户名, username: , password: admin, expected: login_fail } ]然后修改测试用例使用ddt装饰器需要安装ddt库或循环来读取数据驱动测试。import json import os import unittest from ddt import ddt, data, unpack ddt class TestLoginDDT(unittest.TestCase): def setUp(self): # ... 初始化 classmethod def load_test_data(cls): data_file os.path.join(os.path.dirname(__file__), ../test_data/login_data.json) with open(data_file, r, encodingutf-8) as f: return json.load(f) data(*load_test_data()) unpack def test_login(self, case_name, username, password, expected): print(f正在执行用例: {case_name}) self.login_page.enter_username(username) self.login_page.enter_password(password) self.login_page.click_login() time.sleep(1) if expected login_success: self.assertIn(Agileone, self.driver.title) else: # 验证出现错误提示 error_msg self.driver.find_element(By.ID, alert).text self.assertTrue(error_msg)8.2 集成日志功能在common目录下创建logger.py配置日志。import logging import os from datetime import datetime def setup_logger(nameauto_test, log_levellogging.INFO): 配置并返回一个日志器 logger logging.getLogger(name) logger.setLevel(log_level) # 避免重复添加handler if not logger.handlers: # 创建控制台handler ch logging.StreamHandler() ch.setLevel(log_level) # 创建文件handler log_dir os.path.join(os.path.dirname(__file__), ../logs) if not os.path.exists(log_dir): os.makedirs(log_dir) timestamp datetime.now().strftime(%Y%m%d) log_file os.path.join(log_dir, ftest_{timestamp}.log) fh logging.FileHandler(log_file, encodingutf-8) fh.setLevel(log_level) # 设置日志格式 formatter logging.Formatter(%(asctime)s - %(name)s - %(levelname)s - %(message)s) ch.setFormatter(formatter) fh.setFormatter(formatter) # 添加handler到logger logger.addHandler(ch) logger.addHandler(fh) return logger # 创建一个全局默认日志器 logger setup_logger()然后在你的页面对象或测试用例中引入并使用这个logger。from common.logger import logger class LoginPage(BasePage): def login(self, username, password): logger.info(f尝试登录用户名: {username}) self.enter_username(username) self.enter_password(password) self.click_login() logger.info(登录操作执行完毕)9. 常见问题排查与实战技巧实录即使框架设计得再完美在实际运行中你依然会遇到各种“坑”。下面是我在多年实践中总结的一些高频问题和解决技巧。9.1 元素定位常见问题速查表问题现象可能原因排查步骤与解决方案NoSuchElementException1. 定位表达式写错。2. 元素在iframe/frame内。3. 元素尚未加载出来动态渲染。4. 元素在弹窗/新窗口内。1. 在浏览器控制台用$x(你的xpath)或$$(你的css)验证表达式。2. 使用driver.switch_to.frame(frame_reference)切换到对应frame。3.使用显式等待WebDriverWait这是最常用的解决方案。4. 获取所有窗口句柄并切换driver.switch_to.window(handles[-1])。ElementNotInteractableException1. 元素被遮挡如弹窗、其他div。2. 元素不可见styledisplay: none;。3. 元素是disabled状态。1. 等待遮挡物消失或直接操作遮挡物。2. 检查元素样式或使用JS使其可见driver.execute_script(arguments[0].style.displayblock;, element)。3. 检查元素disabled属性。StaleElementReferenceException你之前找到的元素其对应的DOM已经更新或不存在了常见于页面刷新或AJAX更新后。重新定位元素。这是唯一办法。避免在页面可能刷新的操作后还使用旧的元素对象。定位到了但点击/输入没反应1. 点错了元素如点到了不可见的父元素。2. 需要模拟更真实的操作如先click()再send_keys()。1. 使用开发者工具检查点击的坐标是否正确。2. 尝试使用ActionChains进行链式操作或者尝试使用JS直接点击driver.execute_script(arguments[0].click();, element)。9.2 浏览器与驱动版本不匹配这是新手最常踩的坑。症状是浏览器闪退或根本打不开。务必确保ChromeDriver版本与Chrome浏览器版本的主版本号一致。例如Chrome 120.x 需要 ChromeDriver 120.x.x.x。建议将驱动下载和版本检查写入脚本的初始化部分。9.3 处理弹窗和Alert网页上的JavaScript弹窗 (alert,confirm,prompt) 不属于DOM元素不能用普通方式定位。from selenium.webdriver.common.alert import Alert # 切换到alert alert Alert(driver) # 获取弹窗文本 print(alert.text) # 点击“确定” alert.accept() # 点击“取消” alert.dismiss() # 在prompt中输入文本 alert.send_keys(输入的内容)9.4 下拉框 (select) 处理不要尝试去点击option。Selenium提供了专门的Select类。from selenium.webdriver.support.ui import Select select_element driver.find_element(By.ID, dropdown) select Select(select_element) # 通过可见文本选择 select.select_by_visible_text(选项文本) # 通过value属性选择 select.select_by_value(option_value) # 通过索引选择从0开始 select.select_by_index(1)9.5 实战技巧使用XPath轴 (Axes) 定位复杂元素当元素本身没有特征但其相邻元素有特征时XPath轴是神器。# 定位一个复选框它前面有一个包含特定文本的label # label forcb1同意协议/labelinput typecheckbox idcb1 checkbox driver.find_element(By.XPATH, //label[contains(text(), 同意协议)]/following-sibling::input) # 定位表格中“张三”所在行的“操作”按钮 # 使用 ancestor 和 descendant 轴 operate_btn driver.find_element(By.XPATH, //td[text()张三]/ancestor::tr//button[text()操作])掌握这些轴parent,child,following-sibling,preceding-sibling,ancestor,descendant等能让你在复杂的页面结构中游刃有余。9.6 关于无头模式 (Headless) 和反爬在服务器或CI/CD流水线中运行测试时通常使用无头模式以节省资源。但有些网站会检测无头浏览器。此时需要添加一些参数来“伪装”成普通浏览器。options webdriver.ChromeOptions() options.add_argument(--headless) # 启用无头模式 options.add_argument(--disable-blink-featuresAutomationControlled) # 禁用自动化控制标志 options.add_experimental_option(excludeSwitches, [enable-automation]) options.add_experimental_option(useAutomationExtension, False) # 可以设置一个普通的User-Agent options.add_argument(user-agentMozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 ...) driver webdriver.Chrome(optionsoptions)走到这里你已经从一个只会写单条Selenium命令的初学者成长为能够设计、搭建并维护一个完整UI自动化测试框架的实践者。这个框架包含了稳健的元素定位策略、清晰的POM分层、结构化的unittest用例管理、数据驱动、日志报告等工程化要素。它可能还不是企业级那种配置极其复杂的框架但已经具备了所有核心思想足以应对中小型项目的自动化测试需求并且具备了良好的扩展性。下次当你需要为一个新项目搭建自动化体系时不妨直接复制这个项目骨架然后根据具体的页面和业务逻辑填充你的page_objects和test_cases。记住自动化测试不是一蹴而就的而是随着项目迭代不断维护和优化的过程。从这个稳固的起点开始你的自动化之路会走得更加顺畅。

k6性能测试脚本调试与优化实战指南

1. 项目概述：当性能测试脚本成为瓶颈在性能测试领域，我们常常把目光聚焦在服务器、数据库、网络带宽这些“硬”指标上，却容易忽略一个关键环节：测试脚本本身。一个设计不当、效率低下的k6脚本，不仅无法准确模拟真实负…

2026/7/5 9:30:20 阅读更多

Node.js反序列化漏洞原理与实战：从eval到RCE攻击链剖析

1. 项目概述：为什么Node.js反序列化漏洞值得深挖最近在复盘一些Web应用安全审计的案例时，我发现一个现象：很多团队对SQL注入、XSS这类“传统艺能”警惕性很高，防护措施也相对完善，但对于反序列化漏洞，尤其…

2026/7/5 9:30:20 阅读更多

Appium环境配置：解决android could NOT be found错误全攻略

1. 问题定位与核心原因剖析当你兴致勃勃地准备开始移动端自动化测试，却在环境校验这一步被appium-doctor泼了一盆冷水，看到 “WARN AppiumDoctor ✖ android could NOT be found in...” 这样的报错时，那种感觉确实很糟心。这个错误几乎是每一…

2026/7/5 9:30:20 阅读更多

汽车内外饰模具设计规范与关键技术解析

1. 汽车模具设计规范的重要性模具被称为"工业之母"，在汽车制造领域更是如此。一辆普通轿车由超过2万个零件组成，其中约70%的零部件需要通过模具成型。内外饰模具作为汽车外观和功能性的直接体现，其设计质量直接影响整车的品质、生产…

2026/7/5 10:47:16 阅读更多

CLLC谐振变换器双向控制与变频策略详解

1. 项目概述：CLLC谐振变换器的双向能量流动控制在电力电子领域，双向DC-DC变换器是实现能量双向流动的核心装置，而CLLC谐振拓扑因其独特的软开关特性和高效率表现，正成为中高功率应用的首选方案。这个仿真模型展示的是一种采用变频…

2026/7/5 10:46:55 阅读更多

VITA 93.0 QMC标准：军用电子高密度互连技术解析

1. 项目概述：VITA 93.0 QMC标准的技术革新在军用电子、航空航天和工业自动化领域，设备的小型化与高可靠性始终是核心诉求。Samtec最新推出的VITA 93.0 QMC（Quad Mezzanine Card）标准，正是针对这一需求提出的革命性解决…

2026/7/5 10:45:35 阅读更多

定制电源模块核心技术解析与应用案例

1. 项目概述：电源模块定制化服务的行业价值在广州钡源的实验室里，工程师们正在调试一款为医疗CT设备专门设计的电源模块。这款电源需要满足三个严苛条件：在0.1秒内响应200A的瞬时电流需求、工作时长噪音低于35分贝、电磁辐射干扰控制在CLASS…

2026/7/5 10:45:35 阅读更多

STM32F407VGT6核心板电路设计要点与常见问题解析

1. 项目概述 STM32F407VGT6核心板外部电路设计是嵌入式硬件开发中的关键环节。作为一款基于ARM Cortex-M4内核的高性能微控制器，STM32F407VGT6广泛应用于工业控制、消费电子和物联网设备等领域。核心板外部电路设计的好坏直接关系到整个系统的稳定性、可靠性和性能表…

2026/7/5 10:45:35 阅读更多

AI编曲工具：从清唱到专业音乐的智能创作指南

1. 从清唱到专业歌曲的AI编曲革命作为一名独立音乐人，我经历过无数次这样的场景：在深夜灵感迸发时录下一段清唱旋律，却苦于没有专业编曲能力将这些粗糙的音频变成完整的作品。直到三年前接触到AI编曲工具，这个创作瓶颈才被彻底打破…

2026/7/5 10:45:35 阅读更多

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 你是否曾为Windows右键菜单中那些…

2026/7/5 0:00:07 阅读更多

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述：从GitHub Trending看安全实战最近在GitHub Trending上看到一个项目，叫 skills4/skills ，它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景：一个旨在展示或教授某种技能的仓库，本身却成了安…

2026/7/5 0:01:07 阅读更多

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示：因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战：从“黑箱预测”到“可信推理”2026年6月，第7届机器学习与趋势国际会议（MLT 2026）将在悉尼召开。会议议程中，“因果与可解释机器学习…

2026/7/5 0:01:08 阅读更多

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

2026/7/5 0:00:07 阅读更多

从GitHub安全案例解析常见漏洞与防护实践

2026/7/5 0:01:07 阅读更多

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

2026/7/5 0:01:08 阅读更多

FAE放射组学分析工具：医学影像特征探索的完整解决方案

FAE放射组学分析工具：医学影像特征探索的完整解决方案【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手？想要从CT、MRI等影像中提取有价值的定量特征&#…

2026/7/5 0:18:44 阅读更多

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南【免费下载链接】happy-llm 📚 从零开始构建大模型项目地址: https://gitcode.com/GitHub_Trending/ha/happy-llm 还在为大型多模态模型动辄数十亿参数、显存占用高而烦恼&…

2026/7/5 0:22:11 阅读更多

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…

2026/7/5 0:22:19 阅读更多

相关文章

k6性能测试脚本调试与优化实战指南

Node.js反序列化漏洞原理与实战：从eval到RCE攻击链剖析

Appium环境配置：解决android could NOT be found错误全攻略

汽车内外饰模具设计规范与关键技术解析

CLLC谐振变换器双向控制与变频策略详解

VITA 93.0 QMC标准：军用电子高密度互连技术解析

定制电源模块核心技术解析与应用案例

STM32F407VGT6核心板电路设计要点与常见问题解析

AI编曲工具：从清唱到专业音乐的智能创作指南

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

FAE放射组学分析工具：医学影像特征探索的完整解决方案

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南