Browser Use — AI驱动浏览器自动化的全新范式

发布时间：2026/6/1 1:44:01

什么是 Browser UseBrowser Use 是一个开源的浏览器自动化工具生态核心项目包括browser-harness—— 一个轻量级、可编辑的 CDP (Chrome DevTools Protocol) 控制层让 AI 能够直接操控你的真实 Chrome 浏览器。它的设计理念是“你将永远不再亲自操作浏览器”。AI 代理通过截图、坐标点击和 JS 执行来操控页面仿佛给浏览器装上了眼睛和双手。为什么选择 Browser Use1. 极简架构核心代码只有约 1000 行分布在 4 个文件中。没有冗余的抽象层、重试框架或复杂配置。2. 截图优先的交互模式传统自动化工具Selenium/Playwright要求你找到选择器才能点击。Browser Harness 反其道而行之先截图→ 看像素坐标坐标点击click_at_xy(x, y)→ 穿透 iframe/阴影 DOM/跨域再截图验证结果3. 连接真实 Chrome不需要启动新的浏览器实例。直接连接你正在使用的 Chrome登录态、Cookie、扩展全部保留。4. 原始 CDP 能力可以直接调用任意 Chrome DevTools 协议方法没有封装损耗。快速上手安装Setup promptSet up https://github.com/browser-use/browser-harnessforme. Readinstall.mdand follow the steps toinstallbrowser-harness and connect it to my browser.gitclone https://github.com/browser-use/browser-harnesscdbrowser-harness uv toolinstall-e.连接浏览器在 Chrome 地址栏输入chrome://inspect/#remote-debugging勾选 “Allow remote debugging for this browser instance”运行测试:browser-harnessPY new_tab(https://example.com) wait_for_load() print(page_info()) PY第一个脚本browser-harnessPYnew_tab(https://www.baidu.com)wait_for_load()capture_screenshot(baidu.png)click_at_xy(500,300)wait_for_load()print(page_info())PY主要能力能力说明页面导航打开新标签页、切换标签页、跳转 URL截图识别截取页面截图通过像素坐标点击坐标点击click_at_xy(x, y) 穿透 iframe/Shadow DOMJS 执行在页面中运行 JavaScriptHTTP 请求http_get(url) 直接发请求不走浏览器原始 CDP调用任意 Chrome DevTools 协议云浏览器连接 Browser Use 云端隔离浏览器设计哲学Browser Harness 坚持以下原则坐标点击优先通过Input.dispatchMouseEvent在合成层级发送鼠标事件穿透 iframe/阴影 DOM/跨域限制连接真实浏览器不启动新实例直接复用用户的 Chrome核心保持简洁不添加重试框架、会话管理器、配置系统自我进化代理在执行中发现缺失的工具函数时可以直接写入agent_helpers.py总结Browser Use 代表了浏览器自动化的新范式——不再是找选择器→点击而是截图→坐标点击→验证更接近人类操作浏览器的方式。配合 LLM 的视觉能力可以处理任何复杂度的 Web 任务。GitHub: https://github.com/browser-use/browser-harness官网: https://browser-use.com这篇介绍博客也是使用了Browser Use完整流程发布的然后我再进行编辑修改的安装到发布文章接近300w token消耗还是挺大的差不多3毛钱左右

给树莓派新手的第一课：Raspbian、Ubuntu、Debian到底有啥区别？别再傻傻分不清了

树莓派新手避坑指南：Raspbian、Ubuntu、Debian三大发行版全解析刚拿到树莓派的小白们，面对官网下载页面上Raspbian、Ubuntu Server、Debian这些选项是不是一头雾水？就像走进一家从没去过的餐厅，菜单上全是看不懂的菜名。别担心&am…

2026/6/1 1:44:01 阅读更多

房地产宣传片从策划到渲染：一条三分钟UE5动画的完整制作笔记

项目背景去年下半年，我们团队接到了一条三分钟的房地产宣传片制作需求。项目定位是二线城市的高端改善型楼盘，宣传片需要在售楼处12㎡的LED大屏上循环播放，同时生成一个60秒的手机竖版用于朋友圈投放。技术选型确定了UE5LumenNanite的实时…

2026/6/1 1:43:41 阅读更多

2026年房地产数字沙盘市场价格全景图从3万到80万的完整价格带

经过对2025-2026年多个公开采购公告和行业数据的分析，本文梳理出房地产数字沙盘的完整市场价格体系。价格分档入门级：3-8万。基于模板化框架，做少量定制填充。功能覆盖：基础鸟瞰浏览、楼栋点选、简单户型展示、手机H5链接。不含城…

2026/6/1 1:43:41 阅读更多

5分钟掌握B站视频转文字神器：bili2text让你的内容创作效率翻倍

5分钟掌握B站视频转文字神器：bili2text让你的内容创作效率翻倍【免费下载链接】bili2text Bilibili视频转文字，一步到位，输入链接即可使用项目地址: https://gitcode.com/gh_mirrors/bi/bili2text 你是否经常需要将B站视频内容转换为…

2026/6/1 8:16:12 阅读更多

《HarmonyOS技术精讲》三：记忆链接 ── 跨场景数据融合

记忆链接：不只是“绑定”那么简单 HarmonyOS NEXT 开发里，Multimodal Awareness Kit 的记忆链接功能，官方文档把它叫 Metadata Binding。很多第一次接触这个能力的开发者会问：这不就是把设备状态和一段自定义数据绑在一起存起来…

2026/6/1 8:15:52 阅读更多

Anno 1800 Mod Loader实用指南：掌握XML智能合并与游戏模组开发

Anno 1800 Mod Loader实用指南：掌握XML智能合并与游戏模组开发【免费下载链接】anno1800-mod-loader The one and only mod loader for Anno 1800, supports loading of unpacked RDA files, XML merging and Python mods. 项目地址: https://gitcode.com/gh_mir…

2026/6/1 8:13:10 阅读更多

数据驱动的科学写作优化：基于34,584篇论文的文本特征分析

1. 项目概述：当数据开口说话 “Inside the Numbers: How 34,584 Science Papers Reveal the Secrets of Simpler Writing”，这个标题本身就充满了张力。它不是一个关于如何写论文的泛泛而谈，而是一次基于大规模、真实数据的深度挖掘。作为一名…

2026/6/1 8:13:10 阅读更多

8个生产力模板网站深度解析：从选型到自动化工作流构建

1. 项目概述：为什么我们需要模板来引爆生产力？ 如果你和我一样，每天的工作都充斥着大量重复性的文档、邮件、演示文稿和计划表，那你一定对“从零开始”的恐惧感同身受。那种面对空白文档，大脑也跟着一片空白&#xff0…

2026/6/1 8:12:49 阅读更多

告别依赖Ubuntu包：在银河麒麟V10上直接安装达梦数据库RPM包的实战记录

在银河麒麟V10上直接安装达梦数据库RPM包的实战指南国产操作系统银河麒麟V10与达梦数据库的组合，正在成为越来越多政企核心系统的技术选择。然而官方并未提供针对麒麟V10的专用安装包，常规做法是使用基于Debian的适配版本。本文将带你探索一条更硬核的技…

2026/6/1 8:12:29 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/1 0:00:11 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/1 0:03:17 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/1 0:06:19 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/1 0:24:01 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/1 2:19:25 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/1 0:23:56 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

2026/6/1 0:00:11 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

2026/6/1 0:03:17 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

2026/6/1 0:06:19 阅读更多

相关文章

给树莓派新手的第一课：Raspbian、Ubuntu、Debian到底有啥区别？别再傻傻分不清了

房地产宣传片从策划到渲染：一条三分钟UE5动画的完整制作笔记

2026年房地产数字沙盘市场价格全景图从3万到80万的完整价格带

5分钟掌握B站视频转文字神器：bili2text让你的内容创作效率翻倍

《HarmonyOS技术精讲》三：记忆链接 ── 跨场景数据融合

Anno 1800 Mod Loader实用指南：掌握XML智能合并与游戏模组开发

数据驱动的科学写作优化：基于34,584篇论文的文本特征分析

8个生产力模板网站深度解析：从选型到自动化工作流构建

告别依赖Ubuntu包：在银河麒麟V10上直接安装达梦数据库RPM包的实战记录

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因