阿里推出Blade AI智能体,让故障演练低成本成日常 【导语阿里正式推出Blade AI自主韧性测试智能体旨在降低故障演练成本使其成为日常操作。它作为ChaosBlade生态的智能代理层接管繁琐环节具有七大核心特点。】Blade AI接管故障演练繁琐环节Blade AI是ChaosBlade生态的智能代理层不替代ChaosBlade而是接管“人 - ChaosBlade”之间的所有繁琐环节。用户只需用自然语言描述故障场景如“给cms - demo命名空间的accounting服务注入CPU压力80%持续5分钟”Blade AI就能自动完成剩下的定位Pod、匹配技能等一系列操作。七大核心特点保障演练效果Blade AI涵盖自然语言驱动 主动调研澄清、多层安全纵深确定性大于聪明、两层效果验证 基线对比、故障恢复与注入同等重要、目标健康预检 FCAT自适应、三种运行模式覆盖全场景等七大核心特点。这些特点确保了故障演练的安全、完整和可追溯。基于LangGraph的多阶段状态机内核Blade AI的内核是基于LangGraph构建的多阶段状态机由5个独立的ReAct loop组成包括intent_clarification意图澄清、agent_loop计划生成、safety_check规则校验、execute_loop注入执行、verifier_loop效果验证。编辑观点Blade AI的推出为故障演练带来了新的解决方案降低成本的同时提高了效率和安全性有望推动故障演练成为日常操作提升系统的韧性。