OpenClaw进阶篇：浏览器自动化——让AI帮你操作网页

发布时间：2026/6/20 23:12:31

OpenClaw进阶篇浏览器自动化——让AI帮你操作网页前言上篇我们写了自定义Skill发现核心是Prompt模板。但Skill只是告诉AI怎么做真正执行还需要Tool。今天讲一个强大的Toolbrowser。它让AI能像人一样操作浏览器——点击、输入、截图、执行JS。一、browser工具是什么OpenClaw的browser工具提供了三种连接模式1. 内置浏览器默认OpenClaw自带Playwright浏览器AI可以直接调用功能说明示例navigate打开网页访问百度、知乎snapshot获取页面快照了解当前页面状态screenshot截图保留证据click点击元素登录、搜索、提交type输入文字填表单、发评论evaluate执行JS提取数据、计算select下拉选择选择日期、分类hover悬停显示隐藏菜单特点开箱即用适合大多数场景。2. CDP模式Chrome DevTools Protocol连接你已有的Chrome浏览器通过调试端口控制// 启动Chrome时加上调试端口// macOS:/Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome--remote-debugging-port9222// Windows:C:\Program Files\Google\Chrome\Application\chrome.exe--remote-debugging-port9222// Linux:google-chrome--remote-debugging-port9222然后在OpenClaw配置中指定browser:remoteUrl:http://localhost:9222优势保持登录状态Cookie、Session持久化可以用已有浏览器不额外占用资源支持多个标签页3. 浏览器扩展插件模式安装OpenClaw的Chrome扩展可以控制已打开的标签页获取浏览器历史、书签在用户当前浏览上下文中执行适合需要「接管用户当前页面」的场景。4. 远程浏览器服务通过CDP协议连接远程服务器上的浏览器browser:node:your-remote-server# 指定远程节点# 或通过CDP URLcdpUrl:ws://your-server:9222适合服务器环境或需要更高隔离性的场景。核心能力让AI像人一样操作网页。选择建议个人使用、日常任务 → 内置浏览器需要保持登录态 → CDP模式需要接管用户当前页 → 扩展插件服务器批量任务 → 远程浏览器二、先看个例子我们用浏览器自动化的思路改造之前的热榜查询// 不再依赖外部API直接爬取constresultawaitbrowser.navigate(https://weibo.com/hot)// 获取快照了解页面结构constpageawaitbrowser.snapshot()// 提取热搜标题consttitlesawaitbrowser.evaluate((){return[...document.querySelectorAll(.hot-item .title)].map(elel.innerText).slice(0,10)})// 输出结果console.log(titles)这就是浏览器自动化的威力——不依赖API直接操作网页。三、实战自动获取微博热搜3.1 两种方式的对比获取微博热搜有两种方式方式优点缺点API调用速度快、代码简单、无反爬问题需要依赖第三方服务、可能有频率限制浏览器自动化数据完整、可获取任意页面、无需API Key速度较慢、需要处理反爬、占用资源各自适用场景定时任务、批量获取 → 用API省资源获取详细内容、分析页面 → 用浏览器更灵活3.2 用浏览器自动化的场景什么时候适合用browser工具API不支持的数据比如你想获取热搜的详细讨论、评论数等需要登录才能看到比如知乎的关注者列表网页结构复杂API返回的数据格式不够用本节示例演示如何用browser获取微博热搜作为browser工具的入门案例3.3 编写Skill---name:weibo_hot_browserdescription:获取微博热搜榜单了解最新热点话题浏览器方式---# 微博热搜查询browser版## 什么时候触发-用户问微博热搜-用户说今天有什么热点-用户说帮我看看微博## 如何执行### 第1步访问微博热搜使用 browser.navigate 打开 text https://s.weibo.com/top/summary第2步等待页面加载页面是动态渲染的需要等待热搜榜加载完成。使用browser.snapshot查看当前页面状态。如果页面还没加载完成继续等待或刷新。第3步提取数据使用browser.evaluate执行JS获取热搜列表constitemsdocument.querySelectorAll(.c-table tbody tr)return[...items].slice(0,15).map(item{constrankitem.querySelector(.td-01).innerTextconsttitleitem.querySelector(.td-02 a).innerTextconsthotitem.querySelector(.td-02 span)?.innerText||return${rank}.${title}${hot}})第4步格式化输出微博热搜榜 1. xxx热度过万 2. xxx热度8000 ... 数据来源微博 | 时间xxx注意事项微博有反爬机制可能需要登录如果访问失败尝试直接访问移动版https://m.weibo.cn返回结果要包含排名、标题、热度3.4 测试用户帮我看看微博热搜 AI → browser.navigate(https://s.weibo.com/top/summary) → browser.snapshot() → browser.evaluate(...) → 格式化输出四、进阶多步骤自动化browser工具的真正威力在于多步骤串联。4.1 案例自动登录知乎---name:zhihu_logindescription:自动登录知乎需要提供账号密码---# 知乎自动登录## 触发场景用户说帮我登录知乎、登录我的知乎账号## 执行步骤### 第1步打开知乎登录页javascript await browser.navigate(https://www.zhihu.com/signin) await browser.snapshot()第2步输入用户名awaitbrowser.click([nameusername])awaitbrowser.type([nameusername],你的手机号)第3步点击获取验证码awaitbrowser.click(.SignFlow-tab)awaitbrowser.click(.SignFlow-sendInput-button)第4步等待用户输入验证码AI应该提示用户验证码已发送到手机请在30秒内输入。第5步完成登录// 用户手动输入验证码后awaitbrowser.click(.SignFlow-submitButton)awaitbrowser.snapshot()// 验证是否登录成功注意这个Skill需要用户配合输入验证码不能自动跳过验证码这是安全机制登录状态会保持直到退出或过期五、进阶数据提取与保存浏览器自动化最强大的场景之一提取网页数据并保存。5.1 案例定期抓取B站热门视频---name:bilibili_trenddescription:获取B站热门视频排行榜---# B站热门榜查询## 触发场景-用户问B站热门-用户说今天B站什么视频火-用户说帮我看看哔哩哔哩排行榜## 执行步骤### 第1步访问B站排行榜javascript await browser.navigate(https://www.bilibili.com/v/popular/rank/all) await browser.snapshot()第2步等待内容加载B站是SPA单页应用需要等待视频列表渲染。检查是否有多于0个视频元素如果有则继续。第3步提取数据constvideosawaitbrowser.evaluate((){return[...document.querySelectorAll(.video-item)].slice(0,20).map(item{consttitleitem.querySelector(.title).innerTextconstauthoritem.querySelector(.author).innerTextconstplayitem.querySelector(.play).innerTextconstlikeitem.querySelector(.like).innerTextreturn{title,author,play,like}})})第4步格式化输出 B站热门榜 {videos[0].title} UP主{videos[0].author} | 播放{videos[0].play} | 点赞{videos[0].like} {videos[1].title} UP主{videos[1].author} | 播放{videos[1].play} | 点赞{videos[1].like} ...展示前10第5步保存数据可选如果用户要求每天定时发送可以将数据保存到文件或数据库。// 保存为JSONconstfsrequire(fs)constdata{date:newDate().toISOString(),platform:bilibili,videos:videos}fs.writeFileSync(/tmp/bilibili-trend.json,JSON.stringify(data,null,2))注意事项B站有反爬限制频繁访问可能需要登录排行榜每2小时更新一次视频标题可能包含emoji需要清理六、调试技巧6.1 查看页面快照// 获取当前页面所有可交互元素constsnapshotawaitbrowser.snapshot()console.log(JSON.stringify(snapshot,null,2))输出会包含当前URL页面标题所有可点击的按钮、链接所有输入框所有图片用于验证截图6.2 截图debug// 在关键步骤截图awaitbrowser.screenshot({path:/tmp/step1.png})// 出现问题时截图try{awaitbrowser.click(.login-button)}catch(e){awaitbrowser.screenshot({path:/tmp/error.png})throwe}6.3 等待技巧// 等待元素出现最多等10秒awaitbrowser.waitForSelector(.hot-list,{timeout:10000})// 等待页面加载完成awaitbrowser.waitForLoadState(networkidle)// 等待某个条件awaitbrowser.waitForFunction((){returndocument.querySelectorAll(.item).length0})七、常见问题Q1: 页面加载慢怎么办// 增加超时时间awaitbrowser.navigate(https://example.com,{waitUntil:networkidle,// 等待网络空闲timeout:30000// 30秒超时})Q2: 元素找不到// 先用snapshot看页面结构constpageawaitbrowser.snapshot()// 检查选择器是否正确// 注意很多网站动态生成class可能需要用其他选择器awaitbrowser.click(text登录)// 用文本选择器awaitbrowser.click([aria-label搜索])// 用aria属性Q3: 被反爬了怎么办// 设置User-Agentawaitbrowser.extra.setExtraHTTPHeaders({User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64) ...})// 或者用stealth模式// 注意频繁访问仍然可能被限制Q4: 登录状态如何保持// 保存浏览器上下文awaitbrowser.contexts[0].storageState({path:/tmp/zhihu-state.json})// 下次使用时恢复awaitbrowser.newContext({storageState:/tmp/zhihu-state.json})八、总结今天我们学会了✅ browser工具是什么操作浏览器的瑞士军刀✅ 如何用navigate snapshot evaluate组合抓取数据✅ 编写微博热搜、B站热门等Skill✅ 多步骤自动化登录、填表、提交✅ 调试技巧snapshot、screenshot、wait更多内容如果你对AI开发、Agent实战感兴趣欢迎关注公众号【码头码农】每日AI热点解读实战项目复盘技术成长心得

突破语言壁垒：Unity游戏翻译破局工具如何重构跨文化体验

突破语言壁垒：Unity游戏翻译破局工具如何重构跨文化体验【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 当你满怀期待地启动一款国际热门Unity游戏，却被满屏陌生文字阻挡了探索脚步…

2026/6/19 7:35:53 阅读更多

LumiPixel开箱即用教程：快速上手这个专为人像设计的AI创作平台

LumiPixel开箱即用教程：快速上手这个专为人像设计的AI创作平台 1. 认识LumiPixel：纯净人像创作平台 LumiPixel: Canvas Quest是一款专注于人像创作的AI视觉平台，它将先进的Z-Image扩散模型与复古像素艺术美学完美结合。这个平台特别适合需要…

2026/6/20 18:17:35 阅读更多

计算机毕业设计 | SpringBoot大型旅游网站旅行后台管理系统（附源码）

1， 概述 1.1 项目背景随着互联网技术的快速发展和普及，旅游行业逐渐转向线上，越来越多的游客选择在线预订旅游产品。传统的线下旅行社模式已不能满足市场需求，因此，开发一个高效、便捷的旅游网站成为行业的迫切需求…

2026/6/20 10:13:39 阅读更多

CANN/GE算子参数更新接口

aclopUpdateParams 【免费下载链接】ge GE（Graph Engine）是面向昇腾的图编译器和执行器，提供了计算图优化、多流并行、内存复用和模型下沉等技术手段，加速模型执行效率，减少模型内存占用。 GE 提供对 PyTorch、TensorF…

2026/6/20 23:12:15 阅读更多

Ascend C 文档搜索技能评估

【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills skill_name: ascendc-docs-search eval_mode: text Case 1: API 变体…

2026/6/20 23:12:15 阅读更多

Playwright MCP终极指南：让AI助手拥有浏览器自动化超能力

Playwright MCP终极指南：让AI助手拥有浏览器自动化超能力【免费下载链接】playwright-mcp Playwright MCP server 项目地址: https://gitcode.com/gh_mirrors/pl/playwright-mcp Playwright MCP（模型上下文协议）是微软官方推出的革命…

2026/6/20 23:11:55 阅读更多

法硕考试分析正版|法硕考研冲刺背诵手册|法硕背诵宝典pdf

法硕考试分析正版|法硕考研冲刺背诵手册|法硕背诵宝典pdf资料全科都有法硕背诵手册 PDFhttps://tool.nineya.com/s/1jpq3effr 【英语真题】1. The rapid development of AI has raised concerns about its potential impact on ______. A. employment B. weather C. geography …

2026/6/20 23:11:55 阅读更多

终极指南：HunterPie 5分钟快速部署教程与核心功能解析

终极指南：HunterPie 5分钟快速部署教程与核心功能解析【免费下载链接】HunterPie-legacy A complete, modern and clean overlay with Discord Rich Presence integration for Monster Hunter: World. 项目地址: https://gitcode.com/gh_mirrors/hu/HunterPie-le…

2026/6/20 23:10:13 阅读更多

Android工程师进阶手册：8年开发者的成长感悟，从初级到高级的完整指南

Android工程师进阶手册：8年开发者的成长感悟，从初级到高级的完整指南【免费下载链接】AndroidDeveloperAdvancedManual Android 工程师进阶手册（8 年 Android 开发者的成长感悟） 项目地址: https://gitcode.com/gh_mirrors/an/…

2026/6/20 23:09:11 阅读更多

MCU系统集成模块(SIM)详解：复位、中断与低功耗管理实战

1. 系统集成模块(SIM)在MCU中的核心角色在嵌入式开发领域，尤其是面对工业控制、汽车电子这类对可靠性要求极高的场景，我们常常把目光聚焦在CPU性能、外设功能或者通信协议栈上。然而，一个真正稳定、可靠的系统，其基石往往是一个默…

2026/6/20 0:00:26 阅读更多

MC68HC908RF2A定时器PWM生成原理与实战：无缓冲与缓冲模式详解

1. 项目概述与核心价值在嵌入式开发，尤其是电机驱动、LED调光、开关电源这些需要精确控制“能量”的领域，脉冲宽度调制（PWM）技术是工程师手中的一把瑞士军刀。它的本质很简单：用一个固定频率的方波，通过改变…

2026/6/20 0:02:08 阅读更多

在银河麒麟V10桌面(2205版本)上实战部署软RAID 1：从模块黑名单到自动挂载

1. 银河麒麟V10桌面系统与软RAID 1基础认知第一次在银河麒麟V10桌面上折腾软RAID 1时，我踩了不少坑。这个国产操作系统基于Linux内核，但2205版本对软RAID模块做了特殊处理，需要额外操作才能正常使用。软RAID 1其实就是磁盘镜像技术&#xff…

2026/6/20 0:02:08 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/20 0:58:06 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/20 0:58:07 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/20 0:58:03 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/20 11:30:09 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/20 11:30:15 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…