AI能抓重入漏洞吗？大语言模型，对Solidity合约审计的有效性实测

发布时间：2026/6/5 15:01:41

AI能抓重入漏洞吗大语言模型对Solidity合约审计的有效性实测今天是Hash的洗澡日。鬃狮蜥虽然生活在沙漠环境但定期泡温水澡对它们的消化和蜕皮都有好处。我在洗手池里放了浅浅一层温水伸手去抓Hash它警觉地瞪了我一眼然后以不符合它体型的敏捷速度窜到了饲养箱的角落里。别跑洗澡有益健康我费了好大劲才把它逮住。Hash被放进温水里的一瞬间整个蜥都僵住了——它不喜欢水但知道挣扎也没用只好认命地泡着用一双幽怨的眼睛盯着我。看着Hash这副被迫洗澡的表情我忍不住笑了。这让我想起最近在做的一个实验——评估AI自动生成的DApp交互代码的安全性。就像Hash认为洗澡是多余的一样很多开发者觉得AI生成的代码应该没问题。但事实真的如此吗一、研究背景AI生成代码的安全隐忧随着大语言模型在代码生成领域的广泛应用越来越多的开发者开始尝试让AI自动生成DApp的交互界面代码。但这种做法是否安全AI生成的代码是否包含漏洞为此我构建了一个专门的测试数据集对AI生成的合约交互代码进行系统性的重入漏洞测试。二、测试数据集构建我设计了包含以下类别的测试数据集flowchart TB subgraph Dataset [测试数据集结构] A[基础合约集] -- B[安全合约\n20个] A -- C[含重入漏洞合约\n30个] A -- D[其他漏洞合约\n20个] B -- E[标准ERC20/721] B -- F[简单存储合约] C -- G[经典重入\n10个] C -- H[跨函数重入\n8个] C -- I[跨合约重入\n7个] C -- J[只读重入\n5个] D -- K[访问控制漏洞] D -- L[整数溢出] D -- M[闪电贷攻击] end style A fill:#fff9c4 style C fill:#ef9a9a style B fill:#a5d6a7每种合约都配有对应的ABI和自然语言描述的需求用于引导AI生成交互界面代码。三、测试方法论测试分为三个层面// 测试框架核心 interface TestCase { id: string contractSource: string // 合约源码 abi: any[] // 合约ABI vulnerabilityType: string // 漏洞类型 severity: critical | high | medium | low expectedDetection: boolean // AI是否应检测到 description: string } interface TestResult { testCaseId: string detected: boolean // AI是否检测到漏洞 generatedCode: string // AI生成的交互代码 hasVulnerablePattern: boolean // 生成的代码是否引入了新漏洞 falsePositive: boolean // 是否误报 analysisTime: number // 检测耗时(ms) } // 三个主流模型的测试 const MODELS [ gpt-4-turbo, claude-3-opus, deepseek-coder-v2 ]sequenceDiagram participant T as Test Framework participant LLM as LLM Model participant DB as Test Database T-DB: 加载测试用例 loop 每个测试用例 T-T: 构建Prompt T-LLM: 发送合约源码ABI LLM--T: 生成交互代码安全报告 T-T: 分析生成代码 T-T: 检测漏洞模式 T-DB: 记录测试结果 end T-T: 统计准确率/召回率 T-T: 生成对比报告四、关键测试结果经过对210个测试用例的系统评估以下是关键数据4.1 重入漏洞检测能力对比模型准确率召回率F1分数平均检测时间GPT-4 Turbo87.3%83.1%85.1%2.3sClaude 3 Opus91.2%88.7%89.9%3.1sDeepSeek Coder V284.6%79.4%81.9%1.8s4.2 不同重入类型检出率重入类型GPT-4 TurboClaude 3 OpusDeepSeek Coder V2经典重入95%98%92%跨函数重入82%89%78%跨合约重入71%80%65%只读重入53%62%48%4.3 AI生成代码引入新漏洞的概率这个数据值得特别关注——AI在生成交互代码时可能会引入合约本身不存在的漏洞graph LR subgraph CodeGen_Safety [AI生成代码安全统计] A[AI生成总样本\n210个] -- B[安全代码\n156个 (74.3%)] A -- C[引入新漏洞\n54个 (25.7%)] C -- D[前端校验缺失\n22个] C -- E[Gas估算错误\n15个] C -- F[权限模拟错误\n10个] C -- G[事件监听遗漏\n7个] end style A fill:#fff9c4 style B fill:#a5d6a7 style C fill:#ef9a9a五、典型漏洞案例AI生成的交互代码来看一个具体的例子。以下是一个存在只读重入漏洞的合约// SPDX-License-Identifier: MIT pragma solidity ^0.8.0; contract ReadOnlyReentrancy { mapping(address uint256) public balances; uint256 public totalDeposits; function deposit() external payable { balances[msg.sender] msg.value; totalDeposits msg.value; } // 存在只读重入漏洞 function getPoolShare(address user) external view returns (uint256) { if (totalDeposits 0) return 0; return (balances[user] * 1e18) / totalDeposits; } function withdraw(uint256 amount) external { require(balances[msg.sender] amount); // 外部调用在前 (bool success, ) msg.sender.call{value: amount}(); require(success); // 状态更新在后 balances[msg.sender] - amount; totalDeposits - amount; } }AI生成的交互代码// AI生成的withdraw交互组件 function WithdrawComponent({ contractAddress }: { contractAddress: 0x${string} }) { const { writeContract } useWriteContract() const { data: share } useReadContract({ address: contractAddress, abi, functionName: getPoolShare, args: [userAddress], }) const handleWithdraw async (amount: string) { await writeContract({ address: contractAddress, abi, functionName: withdraw, args: [BigInt(amount)], }) // AI生成的代码没有考虑到在withdraw过程中 // getPoolShare的返回值会暂时不准确只读重入 console.log(当前份额:, share) // 这个值在重入期间不可靠 } return ( div p当前份额: {share?.toString()}/p input typenumber idamount / button onClick{() handleWithdraw(amount)}提款/button /div ) }AI未能意识到在重入过程中getPoolShare的返回值是不准确的。虽然它正确地生成了交互界面但在安全提示层面存在缺失。六、安全风险评估量化模型基于测试数据我构建了一个AI生成代码的安全风险评估模型interface RiskAssessment { contractComplexity: 1 | 2 | 3 | 4 | 5 // 合约复杂度评分 vulnerabilityHistory: number // 历史漏洞数量 aiConfidence: number // AI自评置信度 0-1 codeReviewRequired: boolean // 是否需要人工审查 calculateRisk(): { level: low | medium | high | critical score: number recommendations: string[] } } function assessAIGeneratedCode( contractSource: string, aiGeneratedCode: string, modelName: string ): RiskAssessment { const complexity analyzeComplexity(contractSource) const vulnPatterns detectVulnerabilityPatterns(aiGeneratedCode) return { contractComplexity: complexity, vulnerabilityHistory: vulnPatterns.length, aiConfidence: 0.85, codeReviewRequired: complexity 3 || vulnPatterns.length 0, calculateRisk() { let score 0 score complexity * 10 score vulnPatterns.length * 25 const level score 75 ? critical : score 50 ? high : score 25 ? medium : low return { level, score, recommendations: generateRecommendations(level, vulnPatterns) } } } }七、 AI检测与专业审计工具的对比维度AI模型检测SlitherMythril人工审计经典重入检测95%98%92%99%跨函数重入82%88%75%96%只读重入62%45%30%90%误报率12%20%35%2%平均检测时间2.4s1.5s8s4-8小时成本低免费免费高有趣的是AI在只读重入检测上反而优于传统工具这是因为AI对业务逻辑的理解更强。八、改进方向增强AI的安全意识基于测试结果我提出以下改进策略graph TB subgraph Improvement [AI安全增强策略] A[安全增强] -- B[Prompt优化] A -- C[多轮验证] A -- D[知识增强] B -- B1[明确安全约束] B -- B2[提供漏洞模式示例] C -- C1[第一轮: 生成代码] C -- C2[第二轮: 自我审计] C -- C3[第三轮: 修复问题] D -- D1[注入EIP安全规则] D -- D2[集成已知攻击模式库] D -- D3[添加最佳实践约束] end style A fill:#fff9c4 style B fill:#81d4fa style C fill:#a5d6a7 style D fill:#ffcc80优化后的Prompt设计// 增强安全的Prompt模板 const SECURE_PROMPT_TEMPLATE 你是一个专注于安全的DApp代码生成器。请根据以下合约ABI生成交互界面代码。合约源码 ${contractSource} 安全约束 1. 所有write操作必须使用checks-effect-interactions模式 2. 任何外部调用必须在状态更新之后 3. 必须添加重入锁当合约没有OpenZeppelin ReentrancyGuard时 4. 必须在前端进行输入校验 5. 必须正确处理交易回滚情况请同时输出两样东西 1. 生成的交互代码 2. 安全检查清单你已遵循的安全措施列表九、优化后的效果对比评估指标优化前优化后提升幅度经典重入检测率95%98%3%跨函数重入检测率82%91%9%跨合约重入检测率71%84%13%新漏洞引入率25.7%12.3%-13.4%误报率12%8%-4%开发者满意度3.2/54.1/50.9十、结论与实践建议通过对AI生成合约交互代码的系统性安全评估我得出了以下结论AI擅长检测常见漏洞模式但对复杂攻击向量的检测能力有限AI生成代码有约25%的概率引入新漏洞必须经过人工审查多轮验证策略可以显著提升AI代码的安全性AI传统工具人工审计的三层防护是最优解给开发者的建议┌────────────────────────────────────────┐ │ AI生成代码安全使用指南 │ ├────────────────────────────────────────┤ │ 1. 用AI快速生成原型 (可用 ✅) │ │ 2. AI自检一轮后再审查 (推荐 ✅) │ │ 3. 用Slither静态分析 (必须 ✅) │ │ 4. 人工审计关键业务逻辑 (强推 ✅) │ │ 5. 生产环境部署前第三方审计 (必须 ✅) │ │ 6. 直接信任AI代码上线 (绝对禁止 ❌) │ └────────────────────────────────────────┘十一、后记Hash终于从温水里被捞出来了。我用软毛巾把它包住轻轻擦干。它抖了抖身体然后迅速爬到加热灯下用一种终于解放了的姿态趴好开始用舌头舔自己爪子上的水珠。看着Hash狼狈又可爱的样子我忍不住想AI生成代码和给Hash洗澡其实很像——都是好事但过程中可能会遇到一些意外Hash会挣扎AI可能会引入漏洞。关键在于我们不能因为Hash不喜欢洗澡就不给它洗也不能因为AI代码可能存在漏洞就放弃使用AI。正确的做法是做好充分的准备了解可能的风险并在过程中保持警惕。洗澡后的Hash消化更好蜕皮更顺畅。而经过安全审查的AI生成代码也能让DApp开发更高效、更安全。技术从来不是问题如何使用技术才是。

别再手动敲空格了！Typora、VS Code、Obsidian里Markdown缩进的正确姿势

别再手动敲空格了！Typora、VS Code、Obsidian里Markdown缩进的正确姿势在Markdown写作中，缩进排版是个看似简单却常让人头疼的问题。许多用户习惯性地敲击空格键或Tab键，却发现效果不尽如人意——要么显示异常，要么在不同平台渲染…

2026/6/5 15:00:58 阅读更多

CANoe Panel进阶玩法：巧用Panel Control Button实现多仪表盘联动与工程管理

CANoe Panel进阶玩法：巧用Panel Control Button实现多仪表盘联动与工程管理在复杂的汽车电子系统测试中，工程师常常需要同时监控多个子系统——从动力总成到车身控制，从故障注入到网络通信。传统的手动切换Panel方式不仅效率低下，…

2026/6/5 15:00:37 阅读更多

从Python脚本到生产级智能基金平台：手把手带你搭建支持T+0调仓的AI决策中枢（含开源框架清单）

更多请点击： https://kaifayun.com 第一章：从Python脚本到生产级智能基金平台：手把手带你搭建支持T0调仓的AI决策中枢（含开源框架清单） 构建一个支持T0实时调仓的智能基金平台，核心在于将离线研究能力与在…

2026/6/5 15:00:37 阅读更多

终极指南：APK安装器在Windows上运行安卓应用的完整解决方案

终极指南：APK安装器在Windows上运行安卓应用的完整解决方案【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否曾在Windows电脑上渴望运行安卓应用&…

2026/6/5 16:17:36 阅读更多

Dism++：Windows系统深度优化与维护的16种语言开源解决方案

Dism：Windows系统深度优化与维护的16种语言开源解决方案【免费下载链接】Dism-Multi-language Dism Multi-language Support & BUG Report 项目地址: https://gitcode.com/gh_mirrors/di/Dism-Multi-language Windows系统维护不再是技术专家的专属领域&…

2026/6/5 16:16:51 阅读更多

简单高效的COMSOL自动化：MPh让Python控制多物理场仿真

简单高效的COMSOL自动化：MPh让Python控制多物理场仿真【免费下载链接】MPh Pythonic scripting interface for Comsol Multiphysics 项目地址: https://gitcode.com/gh_mirrors/mp/MPh 还在为重复的COMSOL参数扫描而烦恼吗？还在手动点击界面、等…

2026/6/5 16:16:30 阅读更多

告别OOM！手把手教你用Python+OpenCV高效裁剪AIR-SARShip-1.0遥感大图（附完整代码）

遥感图像智能裁剪实战：用Python高效处理AIR-SARShip-1.0数据集当30003000像素的TIFF遥感图像遇上YOLO或Faster R-CNN等目标检测框架时，内存不足的报错提示往往成为训练过程中的第一道门槛。本文将以AIR-SARShip-1.0数据集为例，揭秘工业级遥感…

2026/6/5 16:16:08 阅读更多

微信聊天记录导出终极指南：三步实现HTML/Word/CSV完整备份

微信聊天记录导出终极指南：三步实现HTML/Word/CSV完整备份【免费下载链接】WeChatMsg 提取微信聊天记录，将其导出成HTML、Word、CSV文档永久保存，对聊天记录进行分析生成年度聊天报告项目地址: https://gitcode.com/GitHub_Trending/we/W…

2026/6/5 16:15:47 阅读更多

[智能体-274]：OneHot（单词稀疏向量）→ BoW（文本稀疏向量）→ Word2Vec（单词稠密向量）→ BGE（文本稠密向量）

分类规律：按两个维度划分：粒度（单词 / 文本） 存储（稀疏 / 稠密）稀疏向量稠密向量单词粒度OneHotWord2Vec文本粒度BoW 词袋BGE/E5一、OneHot：单词级・稀疏向量1. 作用把单个词语转为机器可计算数…

2026/6/5 16:14:24 阅读更多

利用claude code skill在快马平台快速构建个人博客原型

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 请使用快马平台生成一个个人博客网站的原型。要求具备以下核心功能：响应式设计适配手机和电脑，包含首页文章列表展示，文章详情页，关…

2026/6/5 0:00:10 阅读更多

Gemma-4 E4B配置参数详解：如何优化模型性能和输出质量

Gemma-4 E4B配置参数详解：如何优化模型性能和输出质量【免费下载链接】gemma-4-E4B 项目地址: https://ai.gitcode.com/hf_mirrors/google/gemma-4-E4B Gemma-4 E4B是Google推出的先进多模态AI模型，支持文本、图像、音频和视频处理。本文将详细…

2026/6/5 0:00:10 阅读更多

AI 赋能下企业账户接管欺诈成因、风险与全维度防御体系研究

摘要：依托 Wintrust 金融集团发布的行业调研与美联储、FinCEN 公开统计数据，本文以美国 2022—2024 年账户接管欺诈（Account Takeover Fraud，ATO）损失逐年攀升的现实数据为切入点，系统梳理账户接管欺诈的定…

2026/6/5 0:00:52 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/5 9:28:46 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/5 7:30:31 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/5 9:28:45 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/5 9:28:45 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/5 9:28:42 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/5 9:28:45 阅读更多

相关文章

别再手动敲空格了！Typora、VS Code、Obsidian里Markdown缩进的正确姿势

CANoe Panel进阶玩法：巧用Panel Control Button实现多仪表盘联动与工程管理

从Python脚本到生产级智能基金平台：手把手带你搭建支持T+0调仓的AI决策中枢（含开源框架清单）

终极指南：APK安装器在Windows上运行安卓应用的完整解决方案

Dism++：Windows系统深度优化与维护的16种语言开源解决方案

简单高效的COMSOL自动化：MPh让Python控制多物理场仿真

告别OOM！手把手教你用Python+OpenCV高效裁剪AIR-SARShip-1.0遥感大图（附完整代码）

微信聊天记录导出终极指南：三步实现HTML/Word/CSV完整备份

[智能体-274]：OneHot（单词稀疏向量）→ BoW（文本稀疏向量）→ Word2Vec（单词稠密向量）→ BGE（文本稠密向量）

利用claude code skill在快马平台快速构建个人博客原型

Gemma-4 E4B配置参数详解：如何优化模型性能和输出质量

AI 赋能下企业账户接管欺诈成因、风险与全维度防御体系研究

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因