什么是 Browser UseBrowser Use 是一个开源的浏览器自动化工具生态核心项目包括browser-harness—— 一个轻量级、可编辑的 CDP (Chrome DevTools Protocol) 控制层让 AI 能够直接操控你的真实 Chrome 浏览器。它的设计理念是“你将永远不再亲自操作浏览器”。AI 代理通过截图、坐标点击和 JS 执行来操控页面仿佛给浏览器装上了眼睛和双手。为什么选择 Browser Use1. 极简架构核心代码只有约 1000 行分布在 4 个文件中。没有冗余的抽象层、重试框架或复杂配置。2. 截图优先的交互模式传统自动化工具Selenium/Playwright要求你找到选择器才能点击。Browser Harness 反其道而行之先截图→ 看像素坐标坐标点击click_at_xy(x, y)→ 穿透 iframe/阴影 DOM/跨域再截图验证结果3. 连接真实 Chrome不需要启动新的浏览器实例。直接连接你正在使用的 Chrome登录态、Cookie、扩展全部保留。4. 原始 CDP 能力可以直接调用任意 Chrome DevTools 协议方法没有封装损耗。快速上手安装Setup promptSet up https://github.com/browser-use/browser-harnessforme. Readinstall.mdand follow the steps toinstallbrowser-harness and connect it to my browser.gitclone https://github.com/browser-use/browser-harnesscdbrowser-harness uv toolinstall-e.连接浏览器在 Chrome 地址栏输入chrome://inspect/#remote-debugging勾选 “Allow remote debugging for this browser instance”运行测试:browser-harnessPY new_tab(https://example.com) wait_for_load() print(page_info()) PY第一个脚本browser-harnessPYnew_tab(https://www.baidu.com)wait_for_load()capture_screenshot(baidu.png)click_at_xy(500,300)wait_for_load()print(page_info())PY主要能力能力说明页面导航打开新标签页、切换标签页、跳转 URL截图识别截取页面截图通过像素坐标点击坐标点击click_at_xy(x, y) 穿透 iframe/Shadow DOMJS 执行在页面中运行 JavaScriptHTTP 请求http_get(url) 直接发请求不走浏览器原始 CDP调用任意 Chrome DevTools 协议云浏览器连接 Browser Use 云端隔离浏览器设计哲学Browser Harness 坚持以下原则坐标点击优先通过Input.dispatchMouseEvent在合成层级发送鼠标事件穿透 iframe/阴影 DOM/跨域限制连接真实浏览器不启动新实例直接复用用户的 Chrome核心保持简洁不添加重试框架、会话管理器、配置系统自我进化代理在执行中发现缺失的工具函数时可以直接写入agent_helpers.py总结Browser Use 代表了浏览器自动化的新范式——不再是找选择器→点击而是截图→坐标点击→验证更接近人类操作浏览器的方式。配合 LLM 的视觉能力可以处理任何复杂度的 Web 任务。GitHub: https://github.com/browser-use/browser-harness官网: https://browser-use.com这篇介绍博客也是使用了Browser Use完整流程发布的然后我再进行编辑修改的安装到发布文章接近300w token消耗还是挺大的差不多3毛钱左右
Browser Use — AI驱动浏览器自动化的全新范式
发布时间:2026/6/1 1:44:01
什么是 Browser UseBrowser Use 是一个开源的浏览器自动化工具生态核心项目包括browser-harness—— 一个轻量级、可编辑的 CDP (Chrome DevTools Protocol) 控制层让 AI 能够直接操控你的真实 Chrome 浏览器。它的设计理念是“你将永远不再亲自操作浏览器”。AI 代理通过截图、坐标点击和 JS 执行来操控页面仿佛给浏览器装上了眼睛和双手。为什么选择 Browser Use1. 极简架构核心代码只有约 1000 行分布在 4 个文件中。没有冗余的抽象层、重试框架或复杂配置。2. 截图优先的交互模式传统自动化工具Selenium/Playwright要求你找到选择器才能点击。Browser Harness 反其道而行之先截图→ 看像素坐标坐标点击click_at_xy(x, y)→ 穿透 iframe/阴影 DOM/跨域再截图验证结果3. 连接真实 Chrome不需要启动新的浏览器实例。直接连接你正在使用的 Chrome登录态、Cookie、扩展全部保留。4. 原始 CDP 能力可以直接调用任意 Chrome DevTools 协议方法没有封装损耗。快速上手安装Setup promptSet up https://github.com/browser-use/browser-harnessforme. Readinstall.mdand follow the steps toinstallbrowser-harness and connect it to my browser.gitclone https://github.com/browser-use/browser-harnesscdbrowser-harness uv toolinstall-e.连接浏览器在 Chrome 地址栏输入chrome://inspect/#remote-debugging勾选 “Allow remote debugging for this browser instance”运行测试:browser-harnessPY new_tab(https://example.com) wait_for_load() print(page_info()) PY第一个脚本browser-harnessPYnew_tab(https://www.baidu.com)wait_for_load()capture_screenshot(baidu.png)click_at_xy(500,300)wait_for_load()print(page_info())PY主要能力能力说明页面导航打开新标签页、切换标签页、跳转 URL截图识别截取页面截图通过像素坐标点击坐标点击click_at_xy(x, y) 穿透 iframe/Shadow DOMJS 执行在页面中运行 JavaScriptHTTP 请求http_get(url) 直接发请求不走浏览器原始 CDP调用任意 Chrome DevTools 协议云浏览器连接 Browser Use 云端隔离浏览器设计哲学Browser Harness 坚持以下原则坐标点击优先通过Input.dispatchMouseEvent在合成层级发送鼠标事件穿透 iframe/阴影 DOM/跨域限制连接真实浏览器不启动新实例直接复用用户的 Chrome核心保持简洁不添加重试框架、会话管理器、配置系统自我进化代理在执行中发现缺失的工具函数时可以直接写入agent_helpers.py总结Browser Use 代表了浏览器自动化的新范式——不再是找选择器→点击而是截图→坐标点击→验证更接近人类操作浏览器的方式。配合 LLM 的视觉能力可以处理任何复杂度的 Web 任务。GitHub: https://github.com/browser-use/browser-harness官网: https://browser-use.com这篇介绍博客也是使用了Browser Use完整流程发布的然后我再进行编辑修改的安装到发布文章接近300w token消耗还是挺大的差不多3毛钱左右