大模型训练并行计算工程师 | 30-80万·上海/北京·头部芯片公司核心岗位 如果你正在从事大模型训练框架、分布式并行计算相关的工作如果你对Megatron-LM、DeepSpeed了如指掌如果你曾为千亿参数的训练效率熬夜调优——那么这个岗位值得你认真看一看。我们是一家国内头部芯片公司正在招募大模型训练并行计算工程师上海、北京两地均有Headcount全栈算力基础设施等你来定义。你将负责的工作包括大模型训练系统的性能分析与瓶颈定位制定针对性优化方案跟进MoE、长序列、文生图等前沿场景优化并行策略数据/模型/流水线/张量并行等参与大模型训练全流程监控与稳定性建设保障大规模训练任务高效运行设计并建设性能与内存评估方法论量化分析通信、计算、资源占用等关键指标。我们希望你本科及以上学历计算机相关专业3年以上相关经验熟悉Megatron-LM / DeepSpeed等主流大模型训练框架编程能力强熟练使用PyTorch性能分析工具及相关性能优化方法逻辑清晰具备良好的沟通能力与抗压能力加分项有实际并行策略开发或优化经验千卡以上大模型训练经验者优先。我们能提供年薪范围30万 - 80万15薪结构具体面议五险一金实缴国家法定假期上海张江 / 北京海淀双职场可选头部芯片公司平台直面大模型训练最前沿的工程挑战。面试流程2-3轮技术面试支持视频面 HR终面整体节奏紧凑1周内反馈。感兴趣的朋友私信我