来自推荐一个程序员编程资料站http://cxyroad.com副业赚钱专栏https://xbt100.top2024年IDEA最新激活方法后台回复激活码CSDN免登录复制代码插件下载CSDN复制插件以下是正文。我是小路。最近看到一个挺有意思的 AI 安全审计项目。说实话现在 AI Coding 工具已经很多了但真正往代码安全审计方向做的其实还不算多。这个项目叫 DeepAudit Github。目前在 GitHub 已经有 6k Star作者给它的定位挺直接国内首个开源代码漏洞挖掘多智能体系统。我第一反应其实是这东西如果真跑通了价值会非常大。因为代码安全审计本来就是很多公司最烧钱的一部分。尤其是金融SaaS政企互联网平台。很多时候一次专业安全审计报价都不便宜。所以我这两天也专门研究了一下 DeepAudit 到底是怎么做的。这篇文章就拆开聊聊它的架构、思路以及它目前真实存在的问题。01 | DeepAudit 本质上不是 AI 问答而是 AI 协作系统很多人现在一提 AI Agent其实本质上还是套一层 Claude包一层 GPT做几个 Prompt最后就敢叫 Agent。但 DeepAudit 不太一样。它是真的把任务拆成了多个独立角色。整个系统里目前有四个核心 Agent。分别负责不同事情。第一个是Orchestrator。相当于总调度。你把项目丢进去之后它会先分析整个仓库结构用了什么技术栈有哪些目录哪些模块重要任务怎么拆。然后再把不同工作派给后面的 Agent。最后也是它负责汇总漏洞过滤误报生成最终报告。第二个是Recon Agent。这个有点像侦察兵。它负责扫描项目结构、分析依赖、识别 API 入口。本质上是在建立攻击面地图。这一点其实挺关键。因为传统 SAST 工具有个老问题只会扫规则。它不理解框架约定路由结构业务入口。但 Agent 可以从语义层面理解代码。第三个是Analysis Agent。这个才是真正负责漏洞分析的。它后面接了 RAG 知识库。里面包含CWECVE漏洞规则历史案例。分析代码时它会做语义匹配而不是单纯关键词扫描。这一点和传统规则引擎区别很大。以前很多安全工具本质上是if else 扫描器。现在开始有点像AI 安全研究员。第四个也是最关键的Verification Agent。这也是 DeepAudit 和很多 AI 审计工具最大的区别。它不是发现漏洞就结束。而是自动生成 PoC。然后把 PoC 丢进 Docker 沙箱执行。只有真正跑通的漏洞才会被写进最终报告。这一点特别重要。因为传统 SAST 最大的问题就是误报。扫 100 条漏洞真正能利用的可能不到一半。但 DeepAudit 相当于自己帮你做了一轮漏洞验证。这个思路其实挺聪明。02 | 它真正厉害的地方是把 AI 拉进了完整安全流程很多 AI 工具现在的问题是只能做分析。但安全审计真正耗时间的其实不是看代码。而是验证复现确认写报告。DeepAudit 其实是在尝试把整个链路串起来。从代码理解攻击面分析漏洞推理PoC 生成漏洞验证最终报告。全部自动化。这已经不是传统意义上的代码助手了。更像一个自动化安全研究流程。尤其是 Verification 这一层。这个设计我觉得是整个项目最有价值的地方。因为它开始尝试解决AI 安全工具最致命的问题。误报。以前很多 AI 审计产品的问题是看起来很聪明。但最后报出来一堆疑似风险可能漏洞潜在问题。安全团队还得自己重新验证。等于工作量根本没减少。但 DeepAudit 的逻辑是不能利用的漏洞不进报告。这件事的意义其实非常大。03 | 整个架构其实很标准但思路挺现代DeepAudit 的技术栈其实不复杂。后端Python FastAPI。Agent 编排LangGraph。向量库ChromaDB。数据库PostgreSQL。缓存Redis。前端React TypeScript。UI 用的是shadcn/ui。整个项目结构挺清晰。backend/agents/ 目录下面就是几个核心 Agentorchestrator.pyrecon.pyanalysis.pyverification.py。而且它有一个点我挺认可沙箱是独立容器。PoC 验证不会直接在宿主机执行。因为安全工具如果直接在本机跑漏洞验证其实风险很大。尤其是RCE命令注入反序列化。这些东西如果隔离不好工具本身就可能变成风险源。所以 Docker 沙箱隔离这个设计是对的。04 | 它已经真实挖出来不少漏洞了目前 DeepAudit 团队已经拿它跑了不少国内开源项目。而且最关键的是很多漏洞已经被官方确认。甚至进入了 CVE。比如禅道 PMSDataeaseO2OAJimureportLitemallMallxxl-jobeladmin。这些项目里它都挖出来过真实漏洞。包括SSRFJNDI 注入反序列化XSS硬编码凭据命令注入。很多 CVSS 分数都在 9.8。已经属于高危级别。还有 OpenClaw 那边的多个 GHSA 漏洞也都是官方确认过的。这一点其实很重要。因为 AI 安全工具最怕的就是看起来很厉害但没有真实成果。而 DeepAudit 至少已经证明它确实能挖出东西。这也是目前它最有说服力的地方。05 | 但它的问题其实也非常明显不过研究完之后我也发现它现在的问题其实不少。首先是太依赖模型能力。DeepAudit 的 Agent 是典型 ReAct 工作流。也就是ThoughtActionAction Input。这种模式特别依赖模型稳定输出固定格式。如果模型不够强很容易跑偏。比如GPT-4oClaudeDeepSeek V3。问题还不算大。但如果你换成本地小模型Qwen2.5-7B小参数 Llama。很多时候跑几步之后格式漂移Agent 卡死上下文错乱。整个链路直接断掉。所以现在其实存在一个问题支持 Ollama不等于本地模型真能跑好。第二个问题是成本很高。因为它不是单 Agent。而是四个 Agent 轮流工作。每一步都在消耗 Token。如果你扫的是大型项目几十万行代码复杂微服务长上下文仓库。API 成本会非常夸张。尤其 Claude 这种模型。可能一次完整审计就能跑掉不少钱。而传统 SAST几秒钟就扫完了。所以它现在更像高精度模式。不是快速模式。06 | PoC 验证也不是万能的很多人看到自动 PoC 验证会觉得这是不是已经能替代安全专家了其实还差得远。因为很多真实漏洞根本不是单机环境能复现的。比如复杂微服务联动多组件依赖内网环境特殊认证链路内存破坏类漏洞。这些东西Docker 沙箱根本搭不出来。还有一些漏洞理论上存在但自动生成的 PoC 根本打不通。所以现在的 PoC 验证更适合SQL 注入命令注入XSSSSRF。这种偏通用型漏洞。复杂漏洞目前还是很依赖人工。07 | AI 安全审计这个方向其实很值得关注虽然 DeepAudit 现在还不算特别成熟。Issues 里其实也有不少问题项目加载失败路径识别错误报告定位偏差沙箱镜像拉取失败。这些都是典型开源早期项目会遇到的问题。但我觉得它真正有价值的地方不是现在完成度有多高。而是它证明了一件事。AI 开始真正进入代码安全领域了。而且不是简单问答。而是在尝试接管完整安全流程。这件事其实很重要。因为未来安全行业很可能会越来越像AI 初筛AI 验证人工复核。尤其是中小团队。以前很多公司根本没有能力做专业安全审计。但 AI 可能会把这个门槛快速拉低。当然它现在肯定还替代不了专业安全研究员。但作为辅助工具项目摸底漏洞初筛。已经开始有实用价值了。后面就看作者团队能不能继续把稳定性、误报率、上下文能力继续往上做。如果真能把 Agent 漏洞审计这条路跑通未来可能会是 AI Coding 之外非常重要的一条赛道。END推荐阅读副业赚钱推荐让你的时间开始变现免费体验AI图片生成就在 Image Generator Hub程序员在线工具站cxytools.com 推荐一个自己写的工具站https://cxytools.com专为程序员设计包括时间日期、 JSON处理、SQL格式化、随机字符串生成、UUID生成、文本Hash...等功能提升开发效 率。 ⬇戳阅读原文直达 朕已阅
GitHub 6k Star,挖出49个CVE:这个国产AI代码审计工具杀疯了!
发布时间:2026/5/26 12:37:18
来自推荐一个程序员编程资料站http://cxyroad.com副业赚钱专栏https://xbt100.top2024年IDEA最新激活方法后台回复激活码CSDN免登录复制代码插件下载CSDN复制插件以下是正文。我是小路。最近看到一个挺有意思的 AI 安全审计项目。说实话现在 AI Coding 工具已经很多了但真正往代码安全审计方向做的其实还不算多。这个项目叫 DeepAudit Github。目前在 GitHub 已经有 6k Star作者给它的定位挺直接国内首个开源代码漏洞挖掘多智能体系统。我第一反应其实是这东西如果真跑通了价值会非常大。因为代码安全审计本来就是很多公司最烧钱的一部分。尤其是金融SaaS政企互联网平台。很多时候一次专业安全审计报价都不便宜。所以我这两天也专门研究了一下 DeepAudit 到底是怎么做的。这篇文章就拆开聊聊它的架构、思路以及它目前真实存在的问题。01 | DeepAudit 本质上不是 AI 问答而是 AI 协作系统很多人现在一提 AI Agent其实本质上还是套一层 Claude包一层 GPT做几个 Prompt最后就敢叫 Agent。但 DeepAudit 不太一样。它是真的把任务拆成了多个独立角色。整个系统里目前有四个核心 Agent。分别负责不同事情。第一个是Orchestrator。相当于总调度。你把项目丢进去之后它会先分析整个仓库结构用了什么技术栈有哪些目录哪些模块重要任务怎么拆。然后再把不同工作派给后面的 Agent。最后也是它负责汇总漏洞过滤误报生成最终报告。第二个是Recon Agent。这个有点像侦察兵。它负责扫描项目结构、分析依赖、识别 API 入口。本质上是在建立攻击面地图。这一点其实挺关键。因为传统 SAST 工具有个老问题只会扫规则。它不理解框架约定路由结构业务入口。但 Agent 可以从语义层面理解代码。第三个是Analysis Agent。这个才是真正负责漏洞分析的。它后面接了 RAG 知识库。里面包含CWECVE漏洞规则历史案例。分析代码时它会做语义匹配而不是单纯关键词扫描。这一点和传统规则引擎区别很大。以前很多安全工具本质上是if else 扫描器。现在开始有点像AI 安全研究员。第四个也是最关键的Verification Agent。这也是 DeepAudit 和很多 AI 审计工具最大的区别。它不是发现漏洞就结束。而是自动生成 PoC。然后把 PoC 丢进 Docker 沙箱执行。只有真正跑通的漏洞才会被写进最终报告。这一点特别重要。因为传统 SAST 最大的问题就是误报。扫 100 条漏洞真正能利用的可能不到一半。但 DeepAudit 相当于自己帮你做了一轮漏洞验证。这个思路其实挺聪明。02 | 它真正厉害的地方是把 AI 拉进了完整安全流程很多 AI 工具现在的问题是只能做分析。但安全审计真正耗时间的其实不是看代码。而是验证复现确认写报告。DeepAudit 其实是在尝试把整个链路串起来。从代码理解攻击面分析漏洞推理PoC 生成漏洞验证最终报告。全部自动化。这已经不是传统意义上的代码助手了。更像一个自动化安全研究流程。尤其是 Verification 这一层。这个设计我觉得是整个项目最有价值的地方。因为它开始尝试解决AI 安全工具最致命的问题。误报。以前很多 AI 审计产品的问题是看起来很聪明。但最后报出来一堆疑似风险可能漏洞潜在问题。安全团队还得自己重新验证。等于工作量根本没减少。但 DeepAudit 的逻辑是不能利用的漏洞不进报告。这件事的意义其实非常大。03 | 整个架构其实很标准但思路挺现代DeepAudit 的技术栈其实不复杂。后端Python FastAPI。Agent 编排LangGraph。向量库ChromaDB。数据库PostgreSQL。缓存Redis。前端React TypeScript。UI 用的是shadcn/ui。整个项目结构挺清晰。backend/agents/ 目录下面就是几个核心 Agentorchestrator.pyrecon.pyanalysis.pyverification.py。而且它有一个点我挺认可沙箱是独立容器。PoC 验证不会直接在宿主机执行。因为安全工具如果直接在本机跑漏洞验证其实风险很大。尤其是RCE命令注入反序列化。这些东西如果隔离不好工具本身就可能变成风险源。所以 Docker 沙箱隔离这个设计是对的。04 | 它已经真实挖出来不少漏洞了目前 DeepAudit 团队已经拿它跑了不少国内开源项目。而且最关键的是很多漏洞已经被官方确认。甚至进入了 CVE。比如禅道 PMSDataeaseO2OAJimureportLitemallMallxxl-jobeladmin。这些项目里它都挖出来过真实漏洞。包括SSRFJNDI 注入反序列化XSS硬编码凭据命令注入。很多 CVSS 分数都在 9.8。已经属于高危级别。还有 OpenClaw 那边的多个 GHSA 漏洞也都是官方确认过的。这一点其实很重要。因为 AI 安全工具最怕的就是看起来很厉害但没有真实成果。而 DeepAudit 至少已经证明它确实能挖出东西。这也是目前它最有说服力的地方。05 | 但它的问题其实也非常明显不过研究完之后我也发现它现在的问题其实不少。首先是太依赖模型能力。DeepAudit 的 Agent 是典型 ReAct 工作流。也就是ThoughtActionAction Input。这种模式特别依赖模型稳定输出固定格式。如果模型不够强很容易跑偏。比如GPT-4oClaudeDeepSeek V3。问题还不算大。但如果你换成本地小模型Qwen2.5-7B小参数 Llama。很多时候跑几步之后格式漂移Agent 卡死上下文错乱。整个链路直接断掉。所以现在其实存在一个问题支持 Ollama不等于本地模型真能跑好。第二个问题是成本很高。因为它不是单 Agent。而是四个 Agent 轮流工作。每一步都在消耗 Token。如果你扫的是大型项目几十万行代码复杂微服务长上下文仓库。API 成本会非常夸张。尤其 Claude 这种模型。可能一次完整审计就能跑掉不少钱。而传统 SAST几秒钟就扫完了。所以它现在更像高精度模式。不是快速模式。06 | PoC 验证也不是万能的很多人看到自动 PoC 验证会觉得这是不是已经能替代安全专家了其实还差得远。因为很多真实漏洞根本不是单机环境能复现的。比如复杂微服务联动多组件依赖内网环境特殊认证链路内存破坏类漏洞。这些东西Docker 沙箱根本搭不出来。还有一些漏洞理论上存在但自动生成的 PoC 根本打不通。所以现在的 PoC 验证更适合SQL 注入命令注入XSSSSRF。这种偏通用型漏洞。复杂漏洞目前还是很依赖人工。07 | AI 安全审计这个方向其实很值得关注虽然 DeepAudit 现在还不算特别成熟。Issues 里其实也有不少问题项目加载失败路径识别错误报告定位偏差沙箱镜像拉取失败。这些都是典型开源早期项目会遇到的问题。但我觉得它真正有价值的地方不是现在完成度有多高。而是它证明了一件事。AI 开始真正进入代码安全领域了。而且不是简单问答。而是在尝试接管完整安全流程。这件事其实很重要。因为未来安全行业很可能会越来越像AI 初筛AI 验证人工复核。尤其是中小团队。以前很多公司根本没有能力做专业安全审计。但 AI 可能会把这个门槛快速拉低。当然它现在肯定还替代不了专业安全研究员。但作为辅助工具项目摸底漏洞初筛。已经开始有实用价值了。后面就看作者团队能不能继续把稳定性、误报率、上下文能力继续往上做。如果真能把 Agent 漏洞审计这条路跑通未来可能会是 AI Coding 之外非常重要的一条赛道。END推荐阅读副业赚钱推荐让你的时间开始变现免费体验AI图片生成就在 Image Generator Hub程序员在线工具站cxytools.com 推荐一个自己写的工具站https://cxytools.com专为程序员设计包括时间日期、 JSON处理、SQL格式化、随机字符串生成、UUID生成、文本Hash...等功能提升开发效 率。 ⬇戳阅读原文直达 朕已阅