【DB2】克隆环境IP不同,DB2连接为何从10ms变20秒? 背景接到客户求助说有一个环境进行了克隆克隆后的环境使用DBeaver链接要20s原本环境是10ms,需要分析链接慢原因定位首先确定两个环境真的是除了IP完全一模一样排查了/etc/hostsdb2nodes.cfg等文件没有任何区别为了确保不是数据库本身问题在linux中进行连接都是很快的连接成功接下来怀疑网络问题在windows对两个环境进行ping测试延迟都很低网络也没问题怀疑是克隆出的实例有问题对连接慢实例进行更新su-db2inst1 db2stop force su-root db2iupdt db2inst1更新实例后重新连接测试还是很慢真凶排查所有外界因素后还是没有头绪只能查看下日志db2diag -f 查看日志后发现连接慢的有大量密码错误报错本地测试环境复现通过db2top查看两边连接数差距很大怀疑就是连接数太多导致阻塞影响将svcename修改防止应用连接连接变得很快由此确认是大量连接密码错误涌入连接池导致连接池阻塞思考因为现象太具有迷惑性了。两个环境一模一样只是IP不同很自然地会先怀疑网络、DNS、认证这些跟IP强相关的因素。而连接池阻塞这个根因和改IP这件事看起来毫无关联容易被忽略。这次排查让我深刻体会到当所有常规路径都走不通时一定要回到最原始的手段——看日志。 很多时候真相就藏在被忽略的细节里。