【AI玩游戏】一、搭建Claude+vscode环境,看看ok-nte项目 ⚠️ 重要声明本文所有内容仅供技术学习与自动化原理研究探讨图像识别、任务调度、模拟输入等计算机技术。严禁将文中提及的任何工具或代码用于违反游戏用户协议、破坏游戏公平性或干扰正常服务的行为。使用第三方工具所导致的账号封禁、法律纠纷等后果均由使用者本人承担。请务必尊重游戏开发者的劳动与规则。相信很多玩家都曾想过能不能利用程序自动完成游戏里一些高度重复的操作把精力留给真正有趣的体验这也是技术领域一个有趣的课题——如何通过计算机视觉与模拟交互实现对游戏任务的理解与自动执行。抱着学习和验证技术可行性的心态我开始了这个系列。希望能通过拆解几个开源项目搞清楚自动化脚本的工作原理和框架设计。这个过程中我会借助 AI 编程工具来帮助阅读代码、搭建环境。AI代码助手最快速接入AI代码能力的办法就是VSCODEAI插件。如果想免费可以安装一个通义灵码目前不收费。如果有预算可以买一个编码套餐然后使用Claude接入我这里用了智谱的GLM可以参考这个文档配置有任何问题都去可以咨询豆包链接: 智谱CodingPlan接入claude-for-ide其中最重要一步是进入下面目录修改setting文件配置对应的apikey和指定的模型。cdC:\Users\你自己的用户名\.claude\settings.json学习任意游戏工具我让 AI 推荐一个结构清晰的项目来研究一下游戏自动化任务的实现它推荐了这个基于 ok-script 框架的项目供参考ok-nte: link注意此仓库仅用于研究任务调度与图像识别框架请勿用于实际游戏运行它言之有理赶紧fork下让AI教我看看这个项目依赖正在后台安装。先给你代码阅读路线图代码阅读顺序由浅入深顺序文件作用为什么先读它1main.py入口3行代码理解启动流程2src/config.py全局配置了解项目注册了哪些任务、用什么OCR/截图方式3src/tasks/BaseNTETask.py任务基类二次开发最核心的文件所有任务都继承它4src/tasks/DailyTask.py日常任务最完整的任务实现范例写新任务参照它5src/interaction/NTEInteraction.py游戏交互键鼠操作封装自动化脚本的操作基础6src/scene/NTEScene.py场景定义场景识别和判断逻辑7src/combat/BaseCombatTask.py战斗系统自动战斗核心体力刷本会复用8src/globals.py全局单例OpenVINO模型、线程池、声音系统建议先读前4个文件就够了理解任务框架后再看具体实现。你可以先打开上面列的文件开始阅读从 main.py 开始然后看 src/config.py。重点看 config.py 里的 onetime_tasks 和 trigger_tasks 列表——这就是任务注册机制我们开发新模块也是往这里加。那我们就相信AI的安排开始看。这里学到了一个冷知识在下面文件夹里可以找到自己和calude的聊天记录复制出来就是md的格式可以直接发给大家看啦explorer%USERPROFILE%\.claude\projects看完代码后我打算在严格控制的研究环境下跑一下这个框架看看它的任务识别和模拟输入能否正常工作。AI 帮我梳理了依赖安装和运行方式cdD:\autoProject\ok-nte D:\anaconda3\envs\endfield\python.exe main.py运行后弹出了一个 GUI 界面集成了截图、任务选择和运行控制功能。为了理解它的工作机制我把运行日志发给 AI 一起分析总结了几个关键技术细节图像识别对分辨率有要求框架依赖固定的窗口比例进行图像匹配测试时发现 16:9 比例如1280x720可以稳定识别而非标准比例会影响场景判定。模拟输入需要系统权限脚本使用了 PostMessage 等方式模拟键鼠在 Windows 下必须以管理员身份运行调用进程否则会报拒绝访问 错误。这属于操作系统的安全限制并非程序刻意提权。2026-05-1721:32:40,456 ERROR TaskExecutor intercation:PostMessage error591472:(5,PostMessage,拒绝访问。)部分任务需要手动进入交互状态比如一些非传送直达的场景钓鱼等脚本未实现自主寻路需要手动让游戏进入相应界面后再由框架接管这也是纯视觉脚本的常见局限性。这些验证让我们更清楚地看到基于图像识别和模拟输入的框架能完成哪些自动化步骤又有哪些边界。对于想要了解这种技术方案可行性的同学来说是一次有效的实践四款游戏自动化工具完整对比扩展调研不同游戏的开源自动化框架既然对 ok-script 框架有了一定认识我打算横向比较一下其他游戏自动化项目都用到了哪些技术栈这有助于拓宽技术视野。AI 帮我整理了一个基于公开仓库的技术调研表游戏推荐工具技术栈同ok-script框架异环ok-ntePython ok-script✅原神BetterGIC# / .NET 8❌原神ok-genshin-impactPython ok-script✅终末地MaaEndGo MaaFramework❌终末地ok-end-fieldPython ok-script✅星穹铁道ok-StarRailAssistantPython ok-script✅注上表仅为技术栈调研所有仓库均来自公开 GitHub 搜索。请勿将这些工具用于任何违反游戏协议或破坏游戏环境的行为。从表格可以看出同一游戏可能存在不同语言和架构的实现选择哪种方案往往取决于个人技术偏好以及对框架成熟度的取舍。对于我们学习任务调度和图像识别来说Python 生态下的 ok-script 系列相对易于上手。今天的探索就到这里通过阅读代码和实际跑通框架对自动化脚本的“感知-决策-执行”闭环有了初步理解。后续如果进一步学习会继续分享任务注册机制、场景判断逻辑等具体细节。再次提醒技术学习的价值在于理解原理、提升能力请始终在法律与规则允许的范围内使用技术。