影刀RPA新手教程XPath语法速查表从入门到实战的15个核心表达式很多刚接触影刀RPA的朋友跟我说元素定位是卡住时间最长的环节。点击捕获元素按钮抓到的路径动不动就失效一换页面就不认了。其实原因很简单系统自动生成的XPath太死了页面稍微变化就找不到元素。学会手写XPath你的自动化流程稳定性直接上一个台阶。我也是非技术出身今天就按最实用的方式整理一份XPath速查手册。XPath的四种最常用写法影刀RPA的捕获元素功能虽然方便但自动生成的路径类似这样/html/body/div[3]/div[2]/div[1]/div[5]/span这种路径一旦页面加了广告位或改了布局就全废了。下面四种手写方式要掌握1. 属性精确匹配店群矩阵自动化突破运营极限最稳的方式通过元素的id、class等属性定位# 通过id定位唯一性最高 //*[idsearch-input] # 通过class定位 //input[classsearch-key]  # 通过任意属性定位 //a[href/login]表示属性*表示任意标签。影刀RPA中点击捕获元素后可以在高级编辑里把自动生成的路径替换成手写的。2. 文本内容匹配当你只知道元素里的文字不知道它是什么标签时# 精确匹配文本 //*[text()登录] # 模糊匹配包含某段文字 //*[contains(text(),拼多多)]实测好用电商页面很多按钮文字会带空格这时候contains(text(),搜索)比text()搜索稳得多。3. 参照物定位这是我采集小红书数据时最常用的技巧。你不知道目标元素怎么定位但你知道它旁边有个固定文字# 场景要找粉丝数数字先定位粉丝标签 //*[contains(text(),粉丝)]/../following-sibling::*[1] # 场景要找价格通过符号定位 //*[contains(text(),)]/ancestor::div[1]//*[classprice]/..表示回到父级following-sibling是后面的兄弟节点ancestor是祖先节点。4. 层级与序号定位# 取第3个匹配的元素 (//div[classitem])[3] # 取最后一个 (//div[classitem])[last()] # 取某标签下的第一个子元素 //ul[classlist]/li[1]五个容易踩坑的场景场景典型报错解决方案动态class名“未找到元素”用contains(class,固定部分)替代class全名iframe内元素捕获不到先用切换到iframe指令再捕获内部元素元素未加载“元素不存在”在操作前加等待元素出现指令超时设10秒| 多个匹配结果 | 操作了错误元素 | 加序号[N]或用父级缩小范围 || 隐藏元素 | 无报错但无效 | 检查display:none先滚动到可见区域 |影刀RPA的一个细节在捕获元素弹窗里右键已捕获的元素可以选编辑XPath这里改路径比在指令面板里逐层点方便得多。三个推荐工具temu店群自动化报活动案例XPath HelperChrome插件打开任意网页按CtrlShiftX打开调试面板输入XPath表达式实时高亮匹配结果。这是学习XPath最快的方式。影刀内置的元素编辑器捕获元素后点验证如果匹配数是0就是路径写错了匹配数大于1就说明不够精确需要加序号。浏览器F12控制台在Console里输入$x(//div[classitem])能直接看匹配了几个元素。$x是Chrome内置的XPath查询函数。实战拼多多商品标题定位假设拼多多商品列表的HTML结构是这样的divclassgoods-itemdivclassgoods-title【官方补贴】冬季羽绒服男款加厚保暖/divdivclassgoods-price89.9/div/div直接捕获很可能拿到一个包含数字索引的长路径。手写的话# 捕获元素拼多多商品列表页——商品标题 //div[contains(class,goods-title)] # 捕获元素拼多多商品列表页——商品价格取第一个 (//div[contains(class,goods-price)])[1]contains写法不依赖精确class名页面加了goods-title v2这种后缀也不影响。#影刀RPA #RPA自动化 #XPath #元素定位 #数据采集作者林焱本文为《影刀RPA学习手册》系列文章之一内容源于实操经验的整理与分享。
影刀RPA新手教程_XPath语法速查表从入门到实战的15个核心表达式
发布时间:2026/6/15 5:04:47
影刀RPA新手教程XPath语法速查表从入门到实战的15个核心表达式很多刚接触影刀RPA的朋友跟我说元素定位是卡住时间最长的环节。点击捕获元素按钮抓到的路径动不动就失效一换页面就不认了。其实原因很简单系统自动生成的XPath太死了页面稍微变化就找不到元素。学会手写XPath你的自动化流程稳定性直接上一个台阶。我也是非技术出身今天就按最实用的方式整理一份XPath速查手册。XPath的四种最常用写法影刀RPA的捕获元素功能虽然方便但自动生成的路径类似这样/html/body/div[3]/div[2]/div[1]/div[5]/span这种路径一旦页面加了广告位或改了布局就全废了。下面四种手写方式要掌握1. 属性精确匹配店群矩阵自动化突破运营极限最稳的方式通过元素的id、class等属性定位# 通过id定位唯一性最高 //*[idsearch-input] # 通过class定位 //input[classsearch-key]  # 通过任意属性定位 //a[href/login]表示属性*表示任意标签。影刀RPA中点击捕获元素后可以在高级编辑里把自动生成的路径替换成手写的。2. 文本内容匹配当你只知道元素里的文字不知道它是什么标签时# 精确匹配文本 //*[text()登录] # 模糊匹配包含某段文字 //*[contains(text(),拼多多)]实测好用电商页面很多按钮文字会带空格这时候contains(text(),搜索)比text()搜索稳得多。3. 参照物定位这是我采集小红书数据时最常用的技巧。你不知道目标元素怎么定位但你知道它旁边有个固定文字# 场景要找粉丝数数字先定位粉丝标签 //*[contains(text(),粉丝)]/../following-sibling::*[1] # 场景要找价格通过符号定位 //*[contains(text(),)]/ancestor::div[1]//*[classprice]/..表示回到父级following-sibling是后面的兄弟节点ancestor是祖先节点。4. 层级与序号定位# 取第3个匹配的元素 (//div[classitem])[3] # 取最后一个 (//div[classitem])[last()] # 取某标签下的第一个子元素 //ul[classlist]/li[1]五个容易踩坑的场景场景典型报错解决方案动态class名“未找到元素”用contains(class,固定部分)替代class全名iframe内元素捕获不到先用切换到iframe指令再捕获内部元素元素未加载“元素不存在”在操作前加等待元素出现指令超时设10秒| 多个匹配结果 | 操作了错误元素 | 加序号[N]或用父级缩小范围 || 隐藏元素 | 无报错但无效 | 检查display:none先滚动到可见区域 |影刀RPA的一个细节在捕获元素弹窗里右键已捕获的元素可以选编辑XPath这里改路径比在指令面板里逐层点方便得多。三个推荐工具temu店群自动化报活动案例XPath HelperChrome插件打开任意网页按CtrlShiftX打开调试面板输入XPath表达式实时高亮匹配结果。这是学习XPath最快的方式。影刀内置的元素编辑器捕获元素后点验证如果匹配数是0就是路径写错了匹配数大于1就说明不够精确需要加序号。浏览器F12控制台在Console里输入$x(//div[classitem])能直接看匹配了几个元素。$x是Chrome内置的XPath查询函数。实战拼多多商品标题定位假设拼多多商品列表的HTML结构是这样的divclassgoods-itemdivclassgoods-title【官方补贴】冬季羽绒服男款加厚保暖/divdivclassgoods-price89.9/div/div直接捕获很可能拿到一个包含数字索引的长路径。手写的话# 捕获元素拼多多商品列表页——商品标题 //div[contains(class,goods-title)] # 捕获元素拼多多商品列表页——商品价格取第一个 (//div[contains(class,goods-price)])[1]contains写法不依赖精确class名页面加了goods-title v2这种后缀也不影响。#影刀RPA #RPA自动化 #XPath #元素定位 #数据采集作者林焱本文为《影刀RPA学习手册》系列文章之一内容源于实操经验的整理与分享。