沐曦芯生，开源共创 | 沐曦股份 × SGLang联合举办技术交流Meetup，共同探索AI推理落地新路径

发布时间：2026/6/10 7:26:10

6月6日由沐曦股份联合SGLang开源社区、阿里云、龙蜥社区、腾讯云及融科资讯中心举办的“沐曦芯生开源共创——SGLang技术交流Meetup”在北京圆满举办。本次Meetup不仅集结了沐曦股份、SGLang开源社区、阿里云、龙蜥社区与腾讯云的多位核心开发人员与技术专家还定向邀请了100多名独立开发者与高校学生到场。围绕SGLang开源生态演进、大模型推理性能优化与工程落地、异构算力适配等核心议题整场技术交流活动展开了深入探讨与思维碰撞。五大主题演讲聚焦SGLang生态覆盖推理全技术链路今年以来OpenClaw“龙虾”Agent智能体风靡全球PD分离、长上下文的KV Cache显存利用、多智能体推理成为了AI行业热议话题。本次Meetup活动共设置五场主题演讲与一场圆桌对话从底层可观测性到上层多智能体推理架构从社区前沿演进到落地工程实践完整勾勒了SGLang推理生态的技术版图。SGLang Core MaintainerSGLang社区核心维护者童心源率先登台带来了《SGLang Roadmap面向大模型与多模态模型的高性能开源推理系统》主题演讲。演讲系统介绍了SGLang 开源推理框架的发展历史并重点讲解了SGLang在 PD分离、多模态模型与硬件支持、以RL/post-training强化学习/后训练部署等关键技术场景的创新突破以及其在开源社区协作的进展与最新性能优化路线图。阿里云工程师、SGLang Developer苏峰与常怀鑫则分享了题为《从全链路可观测到智能分析AI性能分析范式的演进与实践》的演讲。两位嘉宾在演讲中回顾了SGLang Tracing的可观测性建设历程并结合具体案例探讨如何利用AI Agent实现SGLang框架的性能优化。活动下半场阿里云高级技术专家马腾上台发表了《记忆感知驱动基于Mooncake的多智能体推理架构优化》主题演讲深入剖析了Mooncake如何以KV Cache显存为“物理工作记忆”载体并通过PD分离架构与全局共享KV Cache显存池实现多智能体场景“一次计算、全局共享”的记忆复用。腾讯云高级工程师陈凯悦分享了《从社区到生产基于SGLang HiCache Mooncake的深度优化与企业级落地工程实践》还原了如何将HiCache与Mooncake规模化部署到内部推理集群、以及落地企业客户环境中的具体实践。沐曦股份SGLang推理引擎核心开发者杨鑫压轴登场带来《沐曦GPU对SGLang的深度适配与工程实践》主题演讲详细介绍了SGLang在沐曦GPU上的适配流程、沐曦自研MXMACA软件栈、最新模型适配情况与性能优化实践。针对主题演讲的硬核分享现场观众踊跃提问结合实际开发部署中遇到的具体问题与嘉宾现场积极探讨各种可能的解决方案。圆桌对话异构算力下的推理效能革命圆桌环节由沐曦AI研究院院长李兆石主持童心源、常怀鑫、马腾、陈凯悦与沐曦股份SGLang项目核心开发者王志鹏五位技术专家共同参与围绕“异构算力下的推理效能革命SGLang前沿优化与企业落地实践”展开展开讨论。针对百万长下文的KV Cache利用策略、AI存储需求的趋势走向、AI云端与本地部署的方案选择等热点话题圆桌嘉宾分享了各自的洞察与思考。结语本次SGLang技术交流Meetup是沐曦股份在开源生态建设中的一次深度实践。作为国产高性能GPU企业沐曦股份始终秉持“全栈自研生态兼容”战略围绕MXMACA软件栈持续投入上游开源社区建设。从MXMACA软件栈深度兼容SGLang、vLLM在内的40多种AI框架到公司与阿里云、腾讯云、龙蜥开源社区等伙伴的联合创新沐曦股份正以“技术共建者”之姿推动国产GPU在大模型推理基础设施中的实质性落地。面向未来沐曦股份将持续深化与SGLang等开源社区的技术协同在推理性能优化、模型适配广度、开发者工具链等维度加速迭代为国产算力从“能用”走向“好用”提供坚实的底座。

兔饲料颗粒机

在兔养殖业规模化、集约化发展的今天，兔饲料颗粒机已从简单的物理成型设备，演变为决定养殖效益与饲料品质的关键环节。然而，当前行业普遍面临的技术瓶颈，正制约着养殖户的盈利能力与市场竞争力。行业痛点分析当前兔饲料颗粒机领域…

2026/6/10 7:26:10 阅读更多

财富保卫战：读懂通胀与通缩，普通人如何跑赢通胀？

在理财的世界里，我们最常听到的一个词就是“跑赢通胀”。但很多人对此一知半解：到底什么是通胀？它和通缩有什么区别？我们辛辛苦苦赚来的钱，究竟要怎样才算真正“跑赢”了通胀？ 一、什么是通胀与通缩&#…

2026/6/10 7:25:10 阅读更多

DGX系列有铁芯直线电机模组结构与性能分析

能点到点快速定位型有铁芯直线电机模组，重复定位精度达微米级，适用于对定位速度与精度均有要求的自动化应用场景。模组采用有铁芯直线电机。有铁芯结构磁路磁阻低，同体积下推力密度高于无铁芯方案，在重负载高速运动中优势明显。该…

2026/6/10 7:24:29 阅读更多

机器人正向逆向运动学

一、正向运动学（Forward Kinematics）核心问题：已知每个关节转多少度，求末端执行器（如机械手、焊枪）在哪里、朝向如何。通俗理解：就像你控制自己的手臂，你知道肩关节、肘关节、腕关节…

2026/6/10 8:35:27 阅读更多

AI行为动作识别与检测在服装领域的应用与价值

1. 引言：当AI“看懂”人体动作在服装设计、生产、销售和穿着体验的全链条中，人体动作一直是一个核心变量。传统上，设计师依赖静态模特、经验判断和有限的动态测试来评估服装的合身度、舒适度和美观性。然而，随着人工智能&#xf…

2026/6/10 8:34:47 阅读更多

计算机毕业设计之django基于Python的停车场收费系统

随着新世纪无纸化办公方式的普及，自动化信息处理和基于网络的信息交互方式已被广泛应用。现在很多行业基本上都是交由计算机进行管理和测试，网络与计算机已成为整个线上管理体系中的重要组成部分。虽然信息技术广泛应用和数据存取更加方便，但…

2026/6/10 8:34:47 阅读更多

QMCDecode：3步快速解密QQ音乐加密格式的终极Mac工具指南

QMCDecode：3步快速解密QQ音乐加密格式的终极Mac工具指南【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac，qmc0,qmc3转mp3, mflac,mflac0等转flac)，仅支持macOS，可自动识别到QQ音乐下载目录，默认…

2026/6/10 8:34:07 阅读更多

Hanime1Plugin完整使用指南：为Android观影体验带来革命性提升

Hanime1Plugin完整使用指南：为Android观影体验带来革命性提升【免费下载链接】Hanime1Plugin Android插件(https://hanime1.me) (NSFW) 项目地址: https://gitcode.com/gh_mirrors/ha/Hanime1Plugin 还在为Android设备上的观影体验烦恼吗？Hanime…

2026/6/10 8:33:46 阅读更多

3PEAK思瑞浦 TPH2503-TR SOT23-6 运算放大器

特性均增益带宽:250MHz增益带宽积:120MHz 高斜率:180V/微秒偏移电压:最大500V 低噪声:6.5nV/Hz 轨到轨输入和输出高输出电流:>100mA 卓越视频性能: 差分增益:0.02%，差分相位:0.3 0.1dB增益平坦度:25MHz低输入偏置电流:0.3pA 热关断供电范围:2.5V至5.5V工作温…

2026/6/10 8:31:25 阅读更多

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析【免费下载链接】NomNom NomNom is the most complete savegame editor for NMS but also shows additional information around the data youre about to change. You can also easily look up each …

2026/6/10 0:00:34 阅读更多

从导航软件到游戏寻路：用C++手把手实现Dijkstra最短路径算法（附完整代码）

从导航软件到游戏寻路：用C手把手实现Dijkstra最短路径算法每次打开手机地图导航，或是操控游戏角色穿越复杂地形时，背后都藏着一个数学魔法——最短路径算法。Dijkstra算法作为图论中的经典解决方案，从1956年诞生至今，已…

2026/6/10 0:01:14 阅读更多

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱，支持下载视频、番剧等等各类资源项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/6/10 0:02:17 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/10 0:41:57 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/10 0:41:54 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/10 0:32:14 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/9 9:53:26 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…