旧笔记本电脑用llama.cpp 跑 Qwen3-35B，笔记本上怎么调到 9.5 t/s

发布时间：2026/6/10 22:29:43

背景我这台笔记本配置不算好：i7-10750H、16GB DDR4、Quadro P620 4GB 显存。装好 llama.cpp 跑 Qwen3.6-35B-A3B 的 IQ2_M 量化版，默认参数下一测，4.85 t/s。聊天对话框一个字一个字往外蹦，挺难受的。后来调了四个参数，纯 CPU 跑到 9.5 t/s。中间试了各种 GPU 加速方案，全部翻车。这里把整个过程记下来，给配置类似的人一个参考。效果硬件和模型硬件：硬件规格CPUIntel i7-10750H（6核12线程，笔记本）内存16GB DDR4GPUNVIDIA Quadro P620（4GB 显存）系统Windows 11笔记本的内存带宽大概 41GB/s 左右，桌面平台能到 70 以上，这个差距后面会体现出来。P620 这张卡说实话就是个亮机卡，512 个 CUDA 核心，4GB 显存，干不了什么重活。模型：项目内容模型名Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-IQ2_M.gguf架构MoE，总参数 35B，每次激活 3B量化IQ2_M文件大小约 10-12GBMoE 架构有个好处，虽然总参数 35B，但每次推理只激活 3B 参数，理论上对速度比较友好。不过瓶颈不在计算量上，在内存带宽上。这个模型光加载就要占掉大部分内存，留给推理时 KV cache 的空间本来就不多。调参过程起点：什么都不调，4.85 t/s一开始就是最朴素的启动方式：llama-server.exe-m"model.gguf"--host

ToDesk节点繁忙、向日葵免费试用受限，还有什么免费好用的远程软件推荐？

❓经常用远程的家人们，最近是否都遇到这些情况？ Todesk最近频繁出现【免费中转节点繁忙】的提醒不开会员根本用不了，各种吐槽的声音满天飞❓同样老牌远程软件向日葵原本可以免费用，现在也提示要充会员加时长以前不开会员虽然有…

2026/6/10 22:29:22 阅读更多

第 10 周：回归与二分类的“开山斧”

第 10 周的学习计划非常清晰！线性回归和逻辑回归确实是机器学习领域最经典的“开山斧”，掌握它们不仅是入门的基础，更是理解后续复杂算法的基石。针对你的实操落地任务，我为你梳理了具体的实战思路与核心代码实现：&…

2026/6/10 22:26:19 阅读更多

鸿蒙（HarmonyOS）原生应用开发之毛玻璃层叠布局示例

# 毛玻璃层叠布局示例## 一、引言在鸿蒙（HarmonyOS）原生应用开发中，毛玻璃（Frosted Glass）效果是一种流行的UI设计风格，它通过半透明背景配合高斯模糊，营造出类似磨砂玻璃的视觉效果。本文将以项…

2026/6/10 22:25:18 阅读更多

支持美团/京东/拼多多三平台的代付系统源码，含多前端模板与一键部署方案

本文还有配套的精品资源，点击获取简介：这个代付系统源码包开箱即用，原生支持美团、京东、拼多多三大主流平台代付接口，无需额外对接开发。内置多个可切换的前端展示模板，适配不同业务场景需求，比如简约…

2026/6/10 23:52:11 阅读更多

《从传统开发到PHP工作流：效能提升的秘密武器》

一、引言在当今数字化时代，软件开发的效率和质量成为企业竞争的关键因素。传统的软件开发方式往往面临着开发周期长、成本高、需求变更困难等诸多挑战。而PHP工作流的创新，为解决这些问题提供了新的思路和方法。通过引入先进的工作流引擎和技术&#xff…

2026/6/10 23:52:11 阅读更多

如何找到靠谱的一站式项目投资孵化？良策全链路企业赋能深度拆解

本文为品牌合作内容，观点真实客观企业增长缺资源？良策一站式项目投资孵化助你破局实体企业想扩张缺资金缺运营？良策集团的一站式项目投资孵化，从投钱到陪跑全链路支持。🔹【核心功能：全链路一站式项目投资孵…

2026/6/10 23:52:10 阅读更多

软考中级第3版教材怎么学？按这个顺序效率翻倍

软考中级系统集成项目管理工程师第3版教材一共18章，厚厚一本。很多同学拿到书就从第一章开始啃，结果学了两章就放弃了——不是因为笨，是因为方法不对。科科过软考培训拆解教材的学习顺序和重点分布，帮你找到正确的打开方式。一、教…

2026/6/10 23:51:10 阅读更多

RN/hook/TS

useState 的三种用法直接初始化值 const [state, setState] useState(initialState)惰性初始化（计算复杂值） const [todos, setTodos] useState(() > loadTodosFromStorage())基于前值更新（避免异步闭包问题） setTodos((prev…

2026/6/10 23:51:10 阅读更多

2026年广州电商代运营公司口碑如何？这份选择指南请收好

广州电商产业蓬勃发展，专业代运营服务需求持续攀升近年来，广州作为华南地区电商产业核心集聚地，电商市场规模持续扩大。随着平台规则日趋复杂、流量竞争加剧，越来越多的实体企业与品牌商家意识到专业运营能力的重要性，…

2026/6/10 23:50:49 阅读更多

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析【免费下载链接】NomNom NomNom is the most complete savegame editor for NMS but also shows additional information around the data youre about to change. You can also easily look up each …

2026/6/10 0:00:34 阅读更多

从导航软件到游戏寻路：用C++手把手实现Dijkstra最短路径算法（附完整代码）

从导航软件到游戏寻路：用C手把手实现Dijkstra最短路径算法每次打开手机地图导航，或是操控游戏角色穿越复杂地形时，背后都藏着一个数学魔法——最短路径算法。Dijkstra算法作为图论中的经典解决方案，从1956年诞生至今，已…

2026/6/10 0:01:14 阅读更多

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱，支持下载视频、番剧等等各类资源项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/6/10 0:02:17 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/10 0:41:57 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/10 0:41:54 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/10 0:32:14 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/10 9:56:42 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/10 9:56:39 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/10 9:56:34 阅读更多

相关文章