从0开始学AI测试系列-工具篇 前言在知识星球里已经写了很多篇 AI 提效的文章也搞了几次直播。 但可能之前我都是预设所有人都是有一定基础的。 所以没有从 0 开始讲解这导致有些同学有点跟不上。 所以这次我决定来一个从 0 开始系列。从最基础最基础的地方开始讲起。PS这里再推销一下自己的星球感兴趣的同学在知识星球中搜索测试发开之路。我们先选一个 AI 辅助编程工具实际上以测试的使用场景来说 选哪一个都差不多。 虽然现在公认 claude code 是当今最强 但老实讲对测试这些场景来说其实也发挥不出人家强大的性能。 我用过 codebuddy codex claude code cursor。 任何一款其实都够用了。 所以这里先给一些选择困难症的同学说一下别纠结了 看哪个顺眼用哪个。当然我这里也推荐一个 cursor毕竟用户体验世间最强。Cursor 的定位Cursor 是一款以 AI 为核心的代码编辑器基于 VS Code 深度定制。它不是在 VS Code 上装了一个 Copilot 插件——而是把 AI 能力嵌入到了编辑器的每一个交互环节代码补全、对话、多文件编辑、自主 Agent 执行全部原生集成。对测试工程师来说Cursor 最大的价值在于用自然语言描述测试需求AI 自动生成测试代码Agent 模式下 AI 可以自主执行终端命令、安装依赖、跑测试用户体验目前来说世界最强虽然效果距离现在的 CC 和 codex 略有差距但也只对大规模长程任务的差距对测试人员来说体会不到差距。结论如果你的主要工作是写代码/测试Cursor 是目前体验最好的 AI 编程工具。下载与安装下载官网地址https://www.cursor.com点击首页的Download按钮网站会自动识别你的操作系统并提供对应安装包。macOS 安装步骤下载.dmg文件双击打开将Cursor.app拖入Applications文件夹首次打开时可能有安全提示告诉你不安全选择信任就可以了启动后会引导你导入 VS Code 配置扩展、主题、快捷键可以一键迁移。如果喜欢之前的 VS Code 配置也可以手动导入。Windows 安装步骤其实都是类似的下载.exe安装包双击运行按向导安装默认路径即可安装完成后桌面会出现 Cursor 图标首次启动同样支持从 VS Code 一键迁移配置首次启动配置首次启动会进入引导流程1. 登录 / 注册账号。 这里需要邮箱账号。 如果大家想白嫖免费额度 可以搜索无线邮箱注册一个免费邮箱。它的特点是一个账号可以生成无限多个邮箱地址这样就可以一直蹭免费额度。适合想先试用一段时间的同学。当然我还是建议直接付费。2. 选择主题Dark / Light3. 选择是否导入 VS Code 配置4. 选择默认 AI 模型套餐选择Cursor 目前提供三个套餐套餐价格核心权益适合人群Free免费每月 2000 次 Tab 补全50 次慢速模型对话轻度体验Pro$20美元/月约 ¥145无限 Tab 补全大概 500 次快速高级模型对话无限慢速对话个人日常使用Pro$60(美元)/人/月Pro 全部权益 更多次数的高级模型对话。深度使用注意像是 claude code 和 codex 这种模型需要 PRO 套餐才能使用。PS 其实还有 企业 Teams 模式套餐但那个跟我们个人用户没什么关系了。购买步骤登录 Cursor 后点击齿轮图标的设置按钮选择Upgrade to Pro填写信用卡信息支持 Visa / Mastercard也支持支付宝通过 Stripe 绑卡完成支付即时生效关于快速与慢速的区别快速Fast调用高优先级 API响应速度快但有每月次数上限慢速Slow次数用完后自动降级响应速度变慢但功能不受影响对日常测试工作Pro 套餐完全够用。但想使用更多高级模型可以购买 PRO 套餐。Cursor 核心功能全览Tab 智能补全这是 Cursor 最基础也最高频的功能。不同于普通的代码补全Cursor 的 Tab 补全具备多行感知能力根据上下文预测你接下来要写的整个代码块支持跨行补全补全整个函数体理解你的编码意图比如你写了注释它会自动补全实现使用方式正常打字看到灰色预测文本后按Tab接受。如下图只要你写下了代码 AI 就能猜出你后面想写什么。PS这是节省 token 的重要功能也是我喜欢 curosr 的原因之一很多小任务没必要通过 Agent 对话直接用 TAB 补全就好了。Chat对话窗口快捷键CtrlLWindows/CmdLmacOS在右侧打开对话面板可以询问代码问题这段代码为什么报错让 AI 解释某个文件或函数基于当前文件内容生成测试用例上下文引用在对话中输入可以引用文件目录也可以选中代码块然后右键选择加入到对话中如下图圈选一段代码然后点击 Add to Chat 就可以加入到 chat 对话中 让大模型只针对这段代码进行优化。右边的那个选项我不建议用意义不大除非是特别简单的任务。主流大模型在 Cursor 中的应用Cursor 支持切换多种大模型不同模型各有侧重。以下是目前2026 年主流模型的特点与适用场景模型一览模型提供方特点测试场景推荐度Claude code 系列的 SonnetAnthropic代码能力强、上下文长、指令遵循好不差钱的可以选择更贵的 opus首选GPT 系列OpenAI综合能力强推荐Gemini 系列Google速度极快、但效果我觉得的一般备选DeepSeek 系列DeepSeek中文理解强、开源、成本低十分简单的任务可以试试其他模型就不说了 我也没用过很多。如何在 Cursor 中切换模型在 Chat 窗口的右下角点击模型名称下拉框即可切换。也可以在Settings → Models中开启/关闭特定模型管理你的模型列表。Agent 运行模式详解Cursor 支持多种 Agent 运行模式每种模式对应不同的 AI 行为方式。模式切换入口在对话窗口下拉菜单。Agent 模式默认这是最强大的模式。AI 具备完整的工具使用能力读取、创建、修改文件执行终端命令安装依赖、运行测试等搜索代码库自主决策下一步操作适用场景从零搭建一个项目多文件联动修改需要 AI 自主完成一系列步骤的复杂任务示例帮我在当前项目里搭建一个 pytest 接口测试框架包含目录结构、conftest.py、基础 fixture、一个示例测试AI 会自主创建目录、写文件、安装依赖全程不需要你手动操作。基本上咱们 95% 以上的场景用这个模式就可以了不熟悉的同学无脑莽这个。Plan 模式特点AI 先规划后执行在 Plan 模式下AI 不会直接修改文件而是先输出一份完整的执行计划等你确认后再开始执行。适用场景复杂的重构任务你需要先审查 AI 的计划不确定 AI 会改哪些文件时希望对 AI 行为有更多掌控工作流你输入需求 → AI 输出计划列出要改哪些文件、每步做什么 → 你审查确认 → AI 按计划执行说白了 就是特别复杂的任务可能影响很多个文件或者要分析和编写很多代码的无脑莽这个。它会先给你一个计划文件 告诉你要怎么干这个活儿你可以真毒你这个计划进行修改确定没问题了再提交给它。有点 spec 编程的那个意思。 但基本上咱们大部分任务用不上尤其是现在有了 superpowers 这种 skill这个可能更用不上了。Debug 模式特点专为调试错误优化Debug 模式下AI 会分析错误信息和堆栈定位问题根因给出修复方案并直接应用适用场景测试用例失败不知道原因有报错堆栈需要快速定位使用方式将报错信息粘贴到 Composer切换到 Debug 模式AI 会系统性地分析并修复。其实就是 AI 自己在你的代码里写日志 自己读取控制台跑出来的运行信息自己去调试修改错误算是一个偷懒的让 AI 自己找 bug 的模式有时候也挺好用的。Multitask 模式特点并行执行多个独立任务Multitask 模式允许 AI 同时处理多个互不依赖的任务速度更快。适用场景同时为多个接口生成测试用例同时重构多个互不依赖的模块批量生成文件注意任务之间如果有依赖关系不建议用此模式可能产生冲突。大规模生成测试用例的首选但我其实用的不太多。Ask 模式特点只问答不修改代码Ask 模式是一个纯对话模式AI 不会对文件做任何修改。适用场景想理解某段代码的含义询问方案建议不想让 AI 直接改代码代码评审、方案讨论示例Ask 模式请分析一下 tests/conftest.py 这个文件的设计告诉我有哪些可以改进的地方但不要直接修改它我用的不多 其实现在 Agent 模式也不会轻易修改代码的。Skill 生态与 Superpowers 安装什么是 Skill在 Cursor 的 Agent 模式下AI 的能力可以通过Skill技能包来扩展和规范化。Skill 本质上是一段结构化的指令文件它告诉 AI在特定场景下应该如何思考有哪些标准工作流程需要遵守哪些约束和规范类比理解没有 Skill 的 AI 一个有能力但没有经过培训的实习生有 Skill 的 AI 一个掌握了岗位 SOP 的熟练工大白话skill 就是一堆预设的提示词和一堆脚本的集合体针对特定任务指导大模型怎么去工作的。就好像代码里的公共方法专门提供给别人处理特定任务。你不知道这个任务要怎么执行 没关系下载一个别人开发好的 skill 就好了。什么是 SuperpowersSuperpowers是目前最流行的 Skill 之一由社区维护开源在 GitHub 上。它包含了一系列高质量的 Skill覆盖writing-plans—— 在实现前写详细计划brainstorming—— 在创作前探索需求和方案systematic-debugging—— 系统化调试流程test-driven-development—— TDD 工作流using-git-worktrees—— 安全的 Git 工作流verification-before-completion—— 完成前自动验证以及更多...*新手同学可以把 Superpowers 当做一个帮你想清楚要怎么做一件事的工具我们说用 AI 辅助编程需要你给 AI 提示词尤其是要精准的提示词但很多时候新手是没有这个能力来写那么精准的提示词的新手甚至不知道自己要怎么做。 而 Superpowers 中的 brainstorming头脑风暴则可以帮你去思考。 比如你说你要搭建一个接口自动化工程但其实你不知道怎么搭建brainstorming 则会帮你思考并询问你比如你想用哪个语言你想要哪个框架你希望的架构是什么他都会推荐给你让你选择。 通过这个方式向你收集需要完成工程搭建的所有信息。强迫你给出最精准的信息给 AI。 *Cursor 中安装 Superpowers现在不仅 cursor 任何 AI 辅助工具都有插件广场 直接去安装就好了。实战用 Superpowers 从零搭建 Playwright 的 UI 自动化项目我们现在要做的是从零开始搭一个 Playwright Web UI 自动化项目。目标很明确让一个最小的测试用例跑通打开官方文档站、验证页面标题。整个过程会严格遵循 Superpowers 的完整工作流brainstorming→writing-plans→executing→verification。你会看到每一步都做了什么、得到了什么输出更重要的是你会看到为什么这样分步工作能让我们避免一句话提示词导致生成的代码乱七八糟的陷阱。阶段一Brainstorming 从一句话到清晰设计Superpowers 提供了一个 brainstorming skill它的作用就是让 AI 当你的产品经理一个问题一个问题地追问直到想法变得足够清晰为止。这个过程看起来像是在浪费时间但实际上是在用说话的成本几分钟对话替代写代码的成本数小时重构。你打开 cursor输入这样一句话使用 brainstorming skill 帮我搭建一个 Web UI 自动化项目AI 问 你想测什么样的网站是自己的项目、开源项目、还是第三方公网站点什么技术栈你答 公网上的用 Playwright 的官方文档站 Fast and reliable end-to-end testing for modern web apps | Playwright 作为被测目标。Playwright TypeScript这是现在最流行的组合。AI 问 这次想覆盖多少场景完整的 Page Object 模式、多页面测试还是先从最小的单个测试开始你答 最小场景。就一个测试用例打开首页验证页面标题包含Playwright。其他的 Page Object、多页面、CI 集成都留到后续迭代。AI 问 明白了。那你需要把这个项目接入 CI/CD 吗GitHub Actions 或者别的自动化平台你答 这一期不要就本地跑通就行。CI 接入留给下一篇。................多轮对话以后Superpowers 会把你的所有答复整合成一份设计文档。这份文档会被保存在项目的 docs/.../specs/ 目录下看起来像这样## 项目设计文档**技术栈** Playwright TypeScript **npm 包管理器** npm**测试目标**- 网址https://playwright.dev/- 操作打开首页- 验证点页面标题包含Playwright**后续扩展路径**1. Page Object 模式第二期2. 多页面场景覆盖第三期3. CI/CD 集成第四期**关键决策**- 本期只验证首页标题不涉及表单交互- 暂不覆盖跨浏览器测试Chrome 足够- 暂不实现截图对比或视频录制由于篇幅限制不展开详细的计划但它就是会用这种反复询问的方式强行让你想清楚必要的信息。 这里需要提一下提示词的好坏和详细程度清晰程度很大程度决定了模型的效果。 所以这个 skill 就是在强迫你主动思考必要的细节。 这比新手无脑的用一句话来描述自己的需求效果要好很多。这里我推荐所有新手都多尝试这个 skill 来完成自己的需求。当我们确定计划没问题 就可以通过对话来让 AI 开始编码了 具体的过程和结果就不展示在这里。最终它会为我们编写好一个可用的 UI 自动化工程。结尾本篇主要演示如何快速安装 curosr 以及使用一个 skill 来完成最基础的任务。最后再宣传一下自己的星球