影刀RPA实操指南1688货源数据采集——价格区间、起批量与供应商筛选自动化影刀RPA采集1688数据是做电商选品和比价的标配。1688的页面结构和淘宝京东差别不小——价格展示的是区间如5.00-12.00还有起批量约束、混批规则、供应商认证等级这些用普通的商品采集模板拿不到完整数据。作者林焱 | 影刀RPA实操系列1688页面特点和传统C端电商相比1688的数据结构有几个特殊点价格显示为区间“¥5.00-12.00”对应不同起批量的价格起批量是关键字段最少起批量、混批规则供应商信息很重要经营模式生产厂家/经销商、诚信通年限、认证类型SKU表格复杂一个商品可能有十几个SKU每个SKU不同规格对应不同价格第一步关键词搜索1. 打开 https://www.1688.com/ 2. 定位搜索框 3. 输入关键词并搜索 4. 等待搜索结果加载 5. 可选切换到「供应商」Tab直接搜供应商拼多多店群自动化上架方案第二步搜索结果列表采集# 搜索结果卡片数据提取cards获取所有元素(选择器.sm-offer-item, .offer-list-item)results[]forcardincards:# 商品标题title获取子元素文本(card,.title, .offer-title)# 价格区间1688特有price_text获取子元素文本(card,.price)min_price,max_priceparse_price_range(price_text)# 起批量min_order获取子元素文本(card,.min-order)# 成交数trade_count_text获取子元素文本(card,.trade-count)trade_countparse_trade_count(trade_count_text)# 供应商名称supplier获取子元素文本(card,.supplier-name)# 供应商所在地location获取子元素文本(card,.location)results.append({标题:title,最低价:min_price,最高价:max_price,起批量:min_order,成交笔数:trade_count,供应商:supplier,所在地:location,采集时间:datetime.now().strftime(%Y-%m-%d %H:%M)})价格区间解析函数defparse_price_range(price_text):解析 1688 价格区间 5.00-12.00 importre price_textstr(price_text).strip().replace(¥,).replace(,)# 匹配 5.00-12.00 格式matchre.match(r([\d.])\s*[-~到至]\s*([\d.]),price_text)ifmatch:returnfloat(match.group(1)),float(match.group(2))# 只有单个价格singlere.search(r([\d.]),price_text)ifsingle:pricefloat(single.group(1))returnprice,pricereturnNone,None成交笔数转换defparse_trade_count(text): 1688成交笔数格式成交 1.2万笔、成交 856笔 importre textstr(text)# 万笔wan_matchre.search(r([\d.])万,text)ifwan_match:returnint(float(wan_match.group(1))*10000)# 普通数字num_matchre.search(r(\d),text)ifnum_match:returnint(num_match.group(1))return0第三步供应商信息采集进入供应商店铺首页采集经营资质数据1. 点击供应商名称进入店铺首页 2. 采集供应商核心字段 - 经营模式生产厂家/经销批发/招商代理 - 诚信通年限如诚信通9年 - 认证类型企业认证/个人认证 - 货描/响应/发货三项评分 - 所在地区 - 主营类目defextract_supplier_info():提取供应商资质信息info{}# 诚信通年限years_text获取元素文本(.year-num, .tp-year)info[诚信通]parse_years(years_text)# 经营模式biz_mode获取元素文本(.biz-mode)info[经营模式]biz_mode# 三项评分scores获取所有元素文本(.score-item .score-value)# 1688 评分通常是 货描相符/响应速度/发货速度iflen(scores)3:info[货描]scores[0]info[响应]scores[1]info[发货]scores[2]# 所在地location获取元素文本(.company-location)info[所在地]locationreturninfo第四步翻页策略1688 搜索结果最大展示100页约4000条数据翻页方式为传统分页page1max_pages100all_data[]whilepagemax_pages:print(f正在采集第{page}页...)# 采集当前页数据page_dataextract_search_results()all_data.extend(page_data)# 检查是否有下一页next_btn获取元素(.next-page:not(.disabled), .pagination-next)ifnotnext_btn:print(已到最后一页)break# 点击下一页点击元素(next_btn)# 等待新页面加载随机等待(1500,3000)page1第五步详情页SKU采集进入单个商品详情页采集完整SKU信息defextract_sku_data():采集商品SKU表格skus[]# 1688 SKU通常以表格形式展示sku_rows获取所有元素(.sku-table tr, .sku-item)forrowinsku_rows:spec获取子元素文本(row,.sku-name, .spec-name)price获取子元素文本(row,.sku-price)stock获取子元素文本(row,.sku-stock)skus.append({规格:spec.strip(),单价:parse_price(price),库存:parse_number(stock)})returnskus数据分析比价与供应商筛选TEMU店群如何管理运营采集完成后做供应商筛选分析importpandasaspd dfpd.read_excel(1688_采集结果.xlsx)# 按价格排序找出最优df_sorteddf.sort_values(最低价)# 筛选条件起批量≤50诚信通≥3年有成交记录qualifieddf[(df[起批量_num]50)(df[诚信通年限]3)(df[成交笔数]0)]# 按价格分组统计df[价格段]pd.cut(df[最低价],bins[0,10,30,50,100,500,float(inf)],labels[0-10,10-30,30-50,50-100,100-500,500])price_statsdf.groupby(价格段).size()反爬注意事项1688的反爬策略中等偏严翻页太快会弹出验证码建议每页间隔2-3秒频繁访问同一商品详情会被限流不要连续采集超过2小时中间休息10-15分钟小结1688采集和C端电商最大的区别重点不只是产品数据更是供应商资质。诚信通年限、经营模式、起批量——这些才是选供应商的核心维度。把供应商筛选逻辑融入采集流程实现从采集数据到采集决策依据的升级。内容标签影刀RPA / 1688采集 / 货源比价 / 供应商筛选 / SKU数据作者林焱本文是「影刀RPA从零到实战」系列文章之一持续更新实操技巧与避坑经验。
影刀RPA实操指南_1688货源数据采集价格区间起批量与供应商筛选自动化
发布时间:2026/6/13 11:23:48
影刀RPA实操指南1688货源数据采集——价格区间、起批量与供应商筛选自动化影刀RPA采集1688数据是做电商选品和比价的标配。1688的页面结构和淘宝京东差别不小——价格展示的是区间如5.00-12.00还有起批量约束、混批规则、供应商认证等级这些用普通的商品采集模板拿不到完整数据。作者林焱 | 影刀RPA实操系列1688页面特点和传统C端电商相比1688的数据结构有几个特殊点价格显示为区间“¥5.00-12.00”对应不同起批量的价格起批量是关键字段最少起批量、混批规则供应商信息很重要经营模式生产厂家/经销商、诚信通年限、认证类型SKU表格复杂一个商品可能有十几个SKU每个SKU不同规格对应不同价格第一步关键词搜索1. 打开 https://www.1688.com/ 2. 定位搜索框 3. 输入关键词并搜索 4. 等待搜索结果加载 5. 可选切换到「供应商」Tab直接搜供应商拼多多店群自动化上架方案第二步搜索结果列表采集# 搜索结果卡片数据提取cards获取所有元素(选择器.sm-offer-item, .offer-list-item)results[]forcardincards:# 商品标题title获取子元素文本(card,.title, .offer-title)# 价格区间1688特有price_text获取子元素文本(card,.price)min_price,max_priceparse_price_range(price_text)# 起批量min_order获取子元素文本(card,.min-order)# 成交数trade_count_text获取子元素文本(card,.trade-count)trade_countparse_trade_count(trade_count_text)# 供应商名称supplier获取子元素文本(card,.supplier-name)# 供应商所在地location获取子元素文本(card,.location)results.append({标题:title,最低价:min_price,最高价:max_price,起批量:min_order,成交笔数:trade_count,供应商:supplier,所在地:location,采集时间:datetime.now().strftime(%Y-%m-%d %H:%M)})价格区间解析函数defparse_price_range(price_text):解析 1688 价格区间 5.00-12.00 importre price_textstr(price_text).strip().replace(¥,).replace(,)# 匹配 5.00-12.00 格式matchre.match(r([\d.])\s*[-~到至]\s*([\d.]),price_text)ifmatch:returnfloat(match.group(1)),float(match.group(2))# 只有单个价格singlere.search(r([\d.]),price_text)ifsingle:pricefloat(single.group(1))returnprice,pricereturnNone,None成交笔数转换defparse_trade_count(text): 1688成交笔数格式成交 1.2万笔、成交 856笔 importre textstr(text)# 万笔wan_matchre.search(r([\d.])万,text)ifwan_match:returnint(float(wan_match.group(1))*10000)# 普通数字num_matchre.search(r(\d),text)ifnum_match:returnint(num_match.group(1))return0第三步供应商信息采集进入供应商店铺首页采集经营资质数据1. 点击供应商名称进入店铺首页 2. 采集供应商核心字段 - 经营模式生产厂家/经销批发/招商代理 - 诚信通年限如诚信通9年 - 认证类型企业认证/个人认证 - 货描/响应/发货三项评分 - 所在地区 - 主营类目defextract_supplier_info():提取供应商资质信息info{}# 诚信通年限years_text获取元素文本(.year-num, .tp-year)info[诚信通]parse_years(years_text)# 经营模式biz_mode获取元素文本(.biz-mode)info[经营模式]biz_mode# 三项评分scores获取所有元素文本(.score-item .score-value)# 1688 评分通常是 货描相符/响应速度/发货速度iflen(scores)3:info[货描]scores[0]info[响应]scores[1]info[发货]scores[2]# 所在地location获取元素文本(.company-location)info[所在地]locationreturninfo第四步翻页策略1688 搜索结果最大展示100页约4000条数据翻页方式为传统分页page1max_pages100all_data[]whilepagemax_pages:print(f正在采集第{page}页...)# 采集当前页数据page_dataextract_search_results()all_data.extend(page_data)# 检查是否有下一页next_btn获取元素(.next-page:not(.disabled), .pagination-next)ifnotnext_btn:print(已到最后一页)break# 点击下一页点击元素(next_btn)# 等待新页面加载随机等待(1500,3000)page1第五步详情页SKU采集进入单个商品详情页采集完整SKU信息defextract_sku_data():采集商品SKU表格skus[]# 1688 SKU通常以表格形式展示sku_rows获取所有元素(.sku-table tr, .sku-item)forrowinsku_rows:spec获取子元素文本(row,.sku-name, .spec-name)price获取子元素文本(row,.sku-price)stock获取子元素文本(row,.sku-stock)skus.append({规格:spec.strip(),单价:parse_price(price),库存:parse_number(stock)})returnskus数据分析比价与供应商筛选TEMU店群如何管理运营采集完成后做供应商筛选分析importpandasaspd dfpd.read_excel(1688_采集结果.xlsx)# 按价格排序找出最优df_sorteddf.sort_values(最低价)# 筛选条件起批量≤50诚信通≥3年有成交记录qualifieddf[(df[起批量_num]50)(df[诚信通年限]3)(df[成交笔数]0)]# 按价格分组统计df[价格段]pd.cut(df[最低价],bins[0,10,30,50,100,500,float(inf)],labels[0-10,10-30,30-50,50-100,100-500,500])price_statsdf.groupby(价格段).size()反爬注意事项1688的反爬策略中等偏严翻页太快会弹出验证码建议每页间隔2-3秒频繁访问同一商品详情会被限流不要连续采集超过2小时中间休息10-15分钟小结1688采集和C端电商最大的区别重点不只是产品数据更是供应商资质。诚信通年限、经营模式、起批量——这些才是选供应商的核心维度。把供应商筛选逻辑融入采集流程实现从采集数据到采集决策依据的升级。内容标签影刀RPA / 1688采集 / 货源比价 / 供应商筛选 / SKU数据作者林焱本文是「影刀RPA从零到实战」系列文章之一持续更新实操技巧与避坑经验。