通过DrissionPage爬取某获客平台内容

发布时间：2026/5/16 20:43:14

前言最近想用自己之前写的脚本看看市场行情结果发现代码竟然跑不通了仔细一查发现拓客吧做了三个改动反爬检测打开开发者工具就进入无限循环或者整个网页闪退关闭分页机制取消以前通过page 参数翻页的方式失效了。薪资数据加密搜索结果页的薪资数字变成了乱码用字体加密的方式防止直接采集。不过我发现虽然搜索结果页加密了但每个详情页里的薪资还是明文的基于这个发现我的主要调整思路是临时禁用JavaScript让页面以纯静态形式加载。适配新的页面加载方式改为滚动加载职位信息。无视搜索结果页的薪资加密直接解析详情页。缺点由于是通过自动化的方式采集数据效率比较一般优点稳定不容易触发反爬试了五个关键词采集也就是1500个详情页解析个人的话应该够用我把脚本整理了一下发出来供有类似需求的朋友参考。欢迎交流1.cookie处理脚本打开浏览器后打开登录界面扫码登录等待脚本保存cookiedef get_cookie(self, urlhttps://www.tuokeba.com, timeout30): 获取Cookie手动登录 logger.info(请打开登录窗口扫码登录您的个人账号...) self.page.get(url) time.sleep(timeout) # 等待手动登录 cookies self.page.cookies() self.file_manager.save_json(cookies, self.config.cookie_file) logger.info(fCookie已保存到{self.config.cookie_file}) def load_cookie(self) - bool: 加载Cookie if not os.path.exists(self.config.cookie_file): logger.warning(fCookie文件不存在: {self.config.cookie_file}) return False logger.info(开始加载Cookie) self.page.get(https://www.tuokeba.com) time.sleep(2) cookies self.file_manager.load_json(self.config.cookie_file) for cookie in cookies: self.page.set.cookies(cookie) self.page.refresh() time.sleep(2) logger.info(Cookie加载完成) # 保存首页HTML if self.config.save_html_debug: self.file_manager.save_html(self.page.html, 01_首页_加载Cookie后) return True2.首页处理2.1 前置步骤绕过反爬检测仅调试时勾选注正常访问网站时发生异常比如一直在空白页加载可能是这个禁用js的选项没有取消勾选取消勾选后再刷新网站即可正常访问由于目标网站设置了严格的反爬虫机制直接按F12进入开发者工具网站会闪退。我们可以通过临时禁用浏览器JavaScript来绕过大部分检测让页面以纯静态形式加载这个模式下我们可以随意定位元素。操作步骤打开浏览器按F12进入开发者工具点击右上角的齿轮图标⚙进入设置向下找到Debugger调试器部分勾选Disable JavaScript禁用JavaScript图示

YOLOv5/v7改进系列——融合EfficientNetV2主干网络的轻量化部署实践

1. 为什么选择EfficientNetV2作为YOLO的主干网络在目标检测领域，YOLO系列算法因其出色的实时性能而广受欢迎。但当我们把YOLOv5/v7部署到移动端或嵌入式设备时，模型的计算量和内存占用就成了必须面对的难题。这时候，EfficientNetV2就像一位轻…

2026/5/16 20:42:53 阅读更多

微信小程序wx.navigateTo传参实战：从基础到动态数据绑定

1. 微信小程序页面跳转基础入门第一次接触微信小程序开发时，页面跳转是最基础也最常用的功能之一。wx.navigateTo这个API就像是一座连接不同页面的桥梁，让用户能在小程序的不同功能模块间自由穿梭。想象一下，你正在开发一个电商小程序&…

2026/5/16 20:42:53 阅读更多

12000㎡智造基地，赋能服装工厂自动化务实升级

在服装制造自动化转型的关键阶段，设备企业的研产实力、交付能力、场景适配度，成为决定企业升级成败的核心因素。慧拿自动化作为国内缝纫自动化领域的深耕者，依托 12000㎡标准工业厂房、校企合作技术储备、全流程服务体系，为中小服…

2026/5/16 20:42:13 阅读更多

鲸鱼蜣螂算法光伏MPPT优化技术【附代码】

✨ 长期致力于分布式光伏、最大功率点跟踪、粒子群算法、鲸鱼算法、蜣螂算法、收敛因子、随机差分变异、莱维飞行、种群多样化研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 &a…

2026/5/16 21:30:56 阅读更多

Unity SLG大地图实战：用TileManager和AOI搞定网格管理与视野同步（附Demo代码）

Unity SLG大地图开发实战：网格管理与AOI视野同步的工程化解决方案在SLG游戏开发中，大地图系统是核心体验的基石。面对动辄数万网格的动态管理需求，以及需要与后端高效协作的视野同步问题，传统开发方式往往陷入性能瓶颈和逻辑混乱…

2026/5/16 21:30:15 阅读更多

AtCoder Beginner Contest 454

[赛时A~D] AtCoder Beginner Contest 454 https://www.bilibili.com/video/BV17WdsBuEDg/ 【赛时ABC/又双叒叕读错题】AtCoder Beginner Contest 454 https://www.bilibili.com/video/BV1eUdWBAEUU/ AtCoder Beginner Contest 454讲解 https://www.bilibili.com/video/BV1NA9hB…

2026/5/16 21:29:55 阅读更多

Koikatsu Sunshine增强补丁完整指南：5分钟快速安装与核心功能解析

Koikatsu Sunshine增强补丁完整指南：5分钟快速安装与核心功能解析【免费下载链接】KKS-HF_Patch Automatically translate, uncensor and update Koikatsu Sunshine! 项目地址: https://gitcode.com/gh_mirrors/kk/KKS-HF_Patch 如果你正在寻找一款能够彻底…

2026/5/16 21:29:14 阅读更多

在自动化客服系统中集成Taotoken实现多模型智能回复

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度在自动化客服系统中集成Taotoken实现多模型智能回复对于构建智能客服系统的技术团队而言，核心挑战往往不在于模型本身…

2026/5/16 21:29:14 阅读更多

aztfexport实战：批量导出资源组内所有资源的终极教程

aztfexport实战：批量导出资源组内所有资源的终极教程【免费下载链接】aztfexport A tool to bring existing Azure resources under Terraforms management 项目地址: https://gitcode.com/gh_mirrors/az/aztfexport 你是否曾经面对Azure门户中数十甚至上百…

2026/5/16 21:28:54 阅读更多

SD-PPP：在Photoshop中开启智能设计革命的终极AI插件

SD-PPP：在Photoshop中开启智能设计革命的终极AI插件【免费下载链接】sd-ppp A Photoshop AI plugin 项目地址: https://gitcode.com/gh_mirrors/sd/sd-ppp 你是否厌倦了在Photoshop和AI工具之间频繁切换，打断了创意的流畅性？SD-PPP正…

2026/5/16 0:00:07 阅读更多

NomNom存档编辑器：解放你的《无人深空》游戏体验终极指南

NomNom存档编辑器：解放你的《无人深空》游戏体验终极指南【免费下载链接】NomNom NomNom is the most complete savegame editor for NMS but also shows additional information around the data youre about to change. You can also easily look up each item i…

2026/5/16 0:00:27 阅读更多

5个专业策略：构建企业级本地漏洞情报分析平台

5个专业策略：构建企业级本地漏洞情报分析平台【免费下载链接】cve-search cve-search - a tool to perform local searches for known vulnerabilities 项目地址: https://gitcode.com/gh_mirrors/cv/cve-search 在当今复杂的网络安全环境中，快速…

2026/5/16 0:00:27 阅读更多

贾子理论与AI时代文明竞争：从暴力计算到本质贯通的范式重构

贾子理论与AI时代文明竞争：从暴力计算到本质贯通的范式重构摘要本文基于贾子理论的文明竞争视角，揭示中美AI战略差异的本质并非技术参数较量，而是“暴力计算”与“本质贯通”两种文明范式的根本对立。美国依赖算力堆叠与资本逻辑追求技术霸权…

2026/5/16 8:21:07 阅读更多

2026年AI大模型API中转平台排名揭晓，诗云API(ShiyunApi)脱颖而出成省心之选

在AI开发领域，如何接入模型厂商的官方API是一个绕不开的现实问题。对于海外开发者来说，注册、绑卡、调用，三步即可轻松搞定。然而，国内开发者却面临着跨境网络波动、外币支付门槛、发票合规需求以及多厂商Key碎片化管理等诸多“非…

2026/5/16 21:19:19 阅读更多

基于飞书与OpenAI构建企业级AI助手：架构、部署与深度优化指南

1. 项目概述：当飞书遇上AI，一个企业级智能助手的诞生最近在折腾一个挺有意思的项目，叫“ConnectAI-E/feishu-openai”。简单来说，它就是一个桥梁，把飞书这个强大的企业协作平台，和以ChatGPT为代表的OpenA…

2026/5/16 8:21:07 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…