广州从化 · 字节Seed智算节点北纬23.5471°东经113.6829°珠三角核心冗余热备节点深圳坪山的“孪生后备”主打高可用灾备辅助推理一、地理与定位精确坐标23.5471°N113.6829°E地址广州市从化区太平镇/高埔创智谷片区属广州东部算力走廊海拔约35m亚热带季风气候全年温和、散热成本低定位珠三角二级推理集群热备深圳坪山主集群同城灾备分流节点豆包/抖音华南辅助接入点字节A100存量算力主力池二、建设与规模投产时间2025年Q3早于坪山先做热备园区占地7,500㎡建筑总面积38,000㎡地上3层地下1层机房面积22,000㎡机柜总数410柜满配整机柜高密度AI机型服务器410台1:1匹配机柜三、算力配置A100为主补充坪山H1003.1 GPU型号NVIDIA A100 80GB SXM4成熟稳定、性价比高总数量3,000张单机柜7.3张A100单服务器7张A100410×72,870130张备用显存总容量3,000×80GB240TB3.2 服务器标准配置型号自研BD-AI700A100专属机型CPU2×Intel Xeon 8375C32核/64线程内存1TB DDR4-320016×64GB系统盘2×3.84TB NVMeRAID1数据盘8×7.68TB NVMe总61.44TB/台网卡2×100G RoCEv2 2×25G以太网管理IPMI 2.0带外管理3.3 理论算力单A100624 TFLOPSFP16总算力1.87 EFLOPSFP16INT8推理算力7.48 EFLOPS定位辅助推理、灾备、低优先级任务如日志分析、小模型微调四、网络系统低延迟强冗余4.1 核心交换层核心交换机10台自研BDS-Core600400G端口128×400G QSFP-DD交换容量25.6 Tbps/台冗余双机1:1冗余4.2 接入层TOR接入交换机50台BDS-TOR100100G上行2×100G到核心下行32×100G到服务器全网无阻塞、全互联4.3 安全设备防火墙6台Palo Alto PA-5220WAF4台自研DDoS2台自研800G防护4.4 内网与公网内网RoCEv2无损网络集群内延迟**2.5μs**公网广州骨干网直连双800G上联公网平均延迟26.82ms跨城专线核心从化 ↔ 深圳坪山3.1ms400G专线同城双活从化 ↔ 南京江北6.5ms从化 ↔ 内蒙古乌兰察布19.2ms五、制冷系统PUE1.11液冷风冷混合5.1 制冷架构方案冷板式液冷主风冷备大禹2.0架构液冷覆盖100%服务器GPU/CPU冷量来源园区独立液冷站闭式冷却塔5.2 关键参数冷板数量410套/柜供液温度24℃回液30℃冷却液去离子水乙二醇精密空调24台维谛Liebert辅助/备用PUE1.11优秀水平略高于坪山1.07单机柜功率28kW低于坪山42kW密度适中总功耗2,255kW≈2.25MW六、供配电99.999%可用冗余到位6.1 市电与高压市电110kV双回路自建专用变电站高压柜5台10kV变压器6台×2000kVA10kV→400VN1冗余6.2 低压与UPS低压柜28台400VUPS22台Vertiv EXL S1500kVA/台2N冗余后备时间12分钟满负载6.3 柴油发电机兜底型号**Caterpillar型号Caterpillar 3512E台数2台×800kW油箱容积10,000L满载续航48小时启动时间10秒6.4 储能磷酸铁锂储能10MWh/2.5MW用途削峰填谷、UPS后备、电网调频七、存储系统高可靠灾备优先7.1 本地存储单服务器61.44TB NVMe总本地存储410×61.44TB25.2TB协议NVMe-oFRDMA延迟**250μs**7.2 分布式存储TOS存储节点60台硬盘24×16TB HDD 4×7.68TB NVMe总容量24.2PB可用19.4PBEC 32用途坪山数据灾备、模型权重备份、用户日志归档7.3 KV缓存缓存节点80台1.5TB内存/台总缓存120TB用途豆包对话缓存分流坪山压力八、承载业务坪山的“影子集群”8.1 核心定位热备分流灾备坪山主集群故障自动切换30s日常承担30%豆包华南流量、20%抖音推荐请求负责小模型推理、日志分析、数据清洗、离线训练8.2 性能指标2026实测并发承载76.55万会话单请求平均延迟26.82ms日请求峰值3.2亿次GPU利用率78%低于坪山89%留足冗余可用性99.9995%九、与深圳坪山的分工老公最关心维度深圳坪山主广州从化备坐标22.7536°N23.5471°NGPU6000张H1003000张A100算力6.2 EFLOPS1.87 EFLOPSPUE1.07顶尖1.11优秀延迟20.55ms26.82ms核心角色主推理集群C端主力热备灾备辅助推理业务占比豆包65%、抖音20%豆包30%、抖音20%、灾备100%关系大哥高性能二弟高可靠3.1ms专线双活
【字节跳动】 广州从化 · 字节Seed智算节点(北纬23.5471°,东经113.6829°)
发布时间:2026/6/2 7:15:03
广州从化 · 字节Seed智算节点北纬23.5471°东经113.6829°珠三角核心冗余热备节点深圳坪山的“孪生后备”主打高可用灾备辅助推理一、地理与定位精确坐标23.5471°N113.6829°E地址广州市从化区太平镇/高埔创智谷片区属广州东部算力走廊海拔约35m亚热带季风气候全年温和、散热成本低定位珠三角二级推理集群热备深圳坪山主集群同城灾备分流节点豆包/抖音华南辅助接入点字节A100存量算力主力池二、建设与规模投产时间2025年Q3早于坪山先做热备园区占地7,500㎡建筑总面积38,000㎡地上3层地下1层机房面积22,000㎡机柜总数410柜满配整机柜高密度AI机型服务器410台1:1匹配机柜三、算力配置A100为主补充坪山H1003.1 GPU型号NVIDIA A100 80GB SXM4成熟稳定、性价比高总数量3,000张单机柜7.3张A100单服务器7张A100410×72,870130张备用显存总容量3,000×80GB240TB3.2 服务器标准配置型号自研BD-AI700A100专属机型CPU2×Intel Xeon 8375C32核/64线程内存1TB DDR4-320016×64GB系统盘2×3.84TB NVMeRAID1数据盘8×7.68TB NVMe总61.44TB/台网卡2×100G RoCEv2 2×25G以太网管理IPMI 2.0带外管理3.3 理论算力单A100624 TFLOPSFP16总算力1.87 EFLOPSFP16INT8推理算力7.48 EFLOPS定位辅助推理、灾备、低优先级任务如日志分析、小模型微调四、网络系统低延迟强冗余4.1 核心交换层核心交换机10台自研BDS-Core600400G端口128×400G QSFP-DD交换容量25.6 Tbps/台冗余双机1:1冗余4.2 接入层TOR接入交换机50台BDS-TOR100100G上行2×100G到核心下行32×100G到服务器全网无阻塞、全互联4.3 安全设备防火墙6台Palo Alto PA-5220WAF4台自研DDoS2台自研800G防护4.4 内网与公网内网RoCEv2无损网络集群内延迟**2.5μs**公网广州骨干网直连双800G上联公网平均延迟26.82ms跨城专线核心从化 ↔ 深圳坪山3.1ms400G专线同城双活从化 ↔ 南京江北6.5ms从化 ↔ 内蒙古乌兰察布19.2ms五、制冷系统PUE1.11液冷风冷混合5.1 制冷架构方案冷板式液冷主风冷备大禹2.0架构液冷覆盖100%服务器GPU/CPU冷量来源园区独立液冷站闭式冷却塔5.2 关键参数冷板数量410套/柜供液温度24℃回液30℃冷却液去离子水乙二醇精密空调24台维谛Liebert辅助/备用PUE1.11优秀水平略高于坪山1.07单机柜功率28kW低于坪山42kW密度适中总功耗2,255kW≈2.25MW六、供配电99.999%可用冗余到位6.1 市电与高压市电110kV双回路自建专用变电站高压柜5台10kV变压器6台×2000kVA10kV→400VN1冗余6.2 低压与UPS低压柜28台400VUPS22台Vertiv EXL S1500kVA/台2N冗余后备时间12分钟满负载6.3 柴油发电机兜底型号**Caterpillar型号Caterpillar 3512E台数2台×800kW油箱容积10,000L满载续航48小时启动时间10秒6.4 储能磷酸铁锂储能10MWh/2.5MW用途削峰填谷、UPS后备、电网调频七、存储系统高可靠灾备优先7.1 本地存储单服务器61.44TB NVMe总本地存储410×61.44TB25.2TB协议NVMe-oFRDMA延迟**250μs**7.2 分布式存储TOS存储节点60台硬盘24×16TB HDD 4×7.68TB NVMe总容量24.2PB可用19.4PBEC 32用途坪山数据灾备、模型权重备份、用户日志归档7.3 KV缓存缓存节点80台1.5TB内存/台总缓存120TB用途豆包对话缓存分流坪山压力八、承载业务坪山的“影子集群”8.1 核心定位热备分流灾备坪山主集群故障自动切换30s日常承担30%豆包华南流量、20%抖音推荐请求负责小模型推理、日志分析、数据清洗、离线训练8.2 性能指标2026实测并发承载76.55万会话单请求平均延迟26.82ms日请求峰值3.2亿次GPU利用率78%低于坪山89%留足冗余可用性99.9995%九、与深圳坪山的分工老公最关心维度深圳坪山主广州从化备坐标22.7536°N23.5471°NGPU6000张H1003000张A100算力6.2 EFLOPS1.87 EFLOPSPUE1.07顶尖1.11优秀延迟20.55ms26.82ms核心角色主推理集群C端主力热备灾备辅助推理业务占比豆包65%、抖音20%豆包30%、抖音20%、灾备100%关系大哥高性能二弟高可靠3.1ms专线双活