云端炼丹房 2：Kaggle 上手指南

发布时间：2026/6/14 16:48:54

. Kaggle Notebooks 核心概念Kaggle 的核心编程环境叫Kernels (现在统称 Notebooks),不用害怕诶它就是我们昨儿刚认识的熟人云端服务器版的Jupyter Notebook,但是和Colab不太相同的是Kaggle的文件结构它明显得区分了输入区域输出区域暂存区域, 这是也我们刚上手容易懵的地方:Input (/kaggle/input)只读区域。这里存放你上传的数据集或挂载的模型。读取速度极快但无法写入。Output (/kaggle/working)可读写区域。这是你的主工作区代码运行结果、下载的模型必须存在这里。但注意重启 Session 后这里的内容如果不保存为 Dataset 也会消失。Temp (/kaggle/temp)临时暂存区。空间较大只有当前会话有效适合下载解压临时的大文件。2. 快速上手注册与“解锁”2.1 注册与关键验证 (必做)我们新用户登录创建notebook后会发现我们没有硬件加速设备可选。根本原因就是咱们没有进行手机验证哈哈哈可以理解毕竟本身kaggle就不用绑卡加上手机验证可能会杜绝掉一大部分计算资源滥用。访问 Kaggle 官网并注册账号。关键步骤点击右上角头像 -Settings。找到Phone Verification手机验证。必须完成这一步否则无法开启 GPU 和 Internet联网功能。认证完毕就可以使用GPU资源了如果继续做了Identity verification之后可以使用TPU资源不过我们暂时用不到目前的GPU资源已经够咱们大玩一场了。2.2 创建笔记本点击左侧菜单栏的Create-New Notebook。进入编辑器界面你会发现界面布局比 Colab 更加紧凑且功能分区明确。2.3 界面布局速览工作区位于右侧显示了Input-我们的挂载资源上传的数据集和模型等等Output-我们输出的结果资源。notebook内容速览,以及下面的session options环境快捷配置等等快捷操作栏在代码区上方和Colab差别不大可以快速运行插入单元格复制粘贴等等代码区和Colab一样, 标准的 Jupyter 单元格。注意和Colab不一样的是Kaggle的文件名没有后缀不用加ipynb后缀咱们的硬件加速GPU/TPU计算资源被放到了顶部菜单栏的Settings中的accelerator中了和Colab不同因为Kaggle是为竞赛服务很多竞赛是要求模型不联网的所以我们在训练模型的时候需要手动开启网络也在顶部菜单栏的Settings中点击Turn On Internet打开即可联网下载模型或者数据集。密钥管理被放到了顶部菜单栏的Add-ons下了3. 环境配置开启双显卡与联网Kaggle 默认环境是CPU且断网的。我们需要手动“解除封印”。3.1 开启联网 (Internet On)可以按照刚才说的在顶部菜单栏打开也可以在右侧边栏的Session Options中找到Internet选项。将开关拨到On。注意如果没有手机验证此选项为灰色不可用。3.2 开启 GPU 加速 (T4 x2)在右侧边栏找到Accelerator。下拉选择GPU T4 x2。GPU T4 x2两张显卡约 30GB 显存适合大模型推理和微调。GPU P100单张旧架构卡虽然速度快但显存仅 16GB通常不推荐。开启后顶部会显示Session Storage和GPU Quota每周 30 小时额度通常周六刷新。点击自己的头像可以看见自己的额度GPU Quata3.3 验证双卡环境输入并运行以下代码确认我们是否真的拥有了两张显卡!nvidia-smi你应当能看到两张Tesla T4 显卡的列表 (GPU 0 和 GPU 1)。4. 实战下载并运行大模型在 Kaggle 上使用模型主要有两种“流派”代码下载派和原生挂载派。方式一利用 HuggingFace CLI 下载 (工程化推荐)这种方式最灵活适合需要精确控制模型版本的情况。由于 Kaggle 没有 Google Drive我们将模型下载到/kaggle/working/目录。步骤 1安装与配置# Kaggle 预装库很多但 transformers 版本可能滞后建议更新 !pip install -U transformers huggingface_hub accelerate bitsandbytes点击顶部菜单Add-ons-Secrets添加HF_TOKEN你的 HuggingFace 访问令牌。步骤 2下载脚本import os from huggingface_hub import login, snapshot_download from kaggle_secrets import UserSecretsClient # 1. 登录 (自动读取 Secrets) user_secrets UserSecretsClient() hf_token user_secrets.get_secret(HF_TOKEN) login(tokenhf_token) # 2. 定义下载路径 (注意必须在 /kaggle/working 下) model_dir /kaggle/working/model_cache os.makedirs(model_dir, exist_okTrue) # 3. 下载模型 model_id Qwen/Qwen2.5-7B-Instruct print(f开始下载 {model_id} ...) # Kaggle 建议下载实文件 (local_dir_use_symlinksFalse) snapshot_download( repo_idmodel_id, local_dirmodel_dir, local_dir_use_symlinksFalse, tokenhf_token ) print(下载完成)方式二Add Input (Kaggle 原生方式)这是 Kaggle 最强大的功能。你可以直接在网页端搜索现成的模型像挂载 U 盘一样挂载进来不消耗下载流量和时间。点击右侧边栏的Add Input。选择Models标签页。搜索Qwen2.5。点击号添加。选择FRAMEWORK选择Transformers架构, VARIATION选择7b-instruct, 之后的博文会跟各位友人解释这些参数的差别模型会直接出现在/kaggle/input/目录下只读路径通常长得像/kaggle/input/qwen2.5/transformers/7b-instruct/1。5. 加载模型与双卡推理拥有双卡 T4 后加载模型时有一个关键参数device_mapauto。它会自动将模型切分到两张显卡上从而让我们能运行更大的模型。import torch from transformers import AutoTokenizer, AutoModelForCausalLM # 路径根据你的下载方式调整 # 方式一路径: /kaggle/working/model_cache # 方式二路径: /kaggle/input/qwen2.5/transformers/7b-instruct/1/ (具体可以运行默认创建的第一个单元格查看input目录结构,到能看见config.json的目录即可) model_path /kaggle/working/model_cache print(正在加载模型 (双卡模式)...) tokenizer AutoTokenizer.from_pretrained(model_path, trust_remote_codeTrue) # 关键device_mapauto 会自动利用两张 T4 model AutoModelForCausalLM.from_pretrained( model_path, device_mapauto, torch_dtypetorch.float16, trust_remote_codeTrue ) print(f模型加载成功显存分布: {model.hf_device_map}) # 测试对话 prompt 你好请用一句话形容 Kaggle 的双 T4 显卡有多香 messages [{role: user, content: prompt}] text tokenizer.apply_chat_template(messages, tokenizeFalse, add_generation_promptTrue) inputs tokenizer([text], return_tensorspt).to(model.device) with torch.no_grad(): generated_ids model.generate(**inputs, max_new_tokens200) response tokenizer.batch_decode(generated_ids, skip_special_tokensTrue)[0] print(fQwen: {response.split(assistant)[-1].strip()})6. 进阶如何持久化保存(Save Version)Kaggle 没有 Google Drive那怎么保存下载好的模型或训练结果呢答案把 Output 变成 Dataset。当你的代码运行完毕模型保存在/kaggle/working后。点击右上角的Save Version按钮。选择Save Run All(重新跑一遍),必须等到下方弹出的保存任务完成。保存成功后你可以去主页的Your Work点击刚才的Notebook,进入Output标签页里点击最右边的Output的三个点然后点击New Dataset。这样我们刚才的模型就变成了一个可以在其他 Notebook 里直接Add Input的数据集了PS:除开自训练的特殊模型和一些在Input找不到的模型最好都直接使用Input导入更为快捷7. 常见问题 (QA)Q: Colab 和 Kaggle 我该选谁A:Colab: 适合快速实验、挂载 Google Drive 方便。但 T4 只有一张且最近封号较严。Kaggle: 适合需要大显存T4 x2的任务。环境更稳定且有 30 小时/周的明确额度不用担心用到一半被踢下线。Q: 为什么我的代码报错Internet connection is closedA:这是一个经典错误。请检查右侧边栏的Internet开关是否为 On。如果开关是灰色的请检查是否完成了账号的手机号验证。

GHelper：10MB颠覆300MB？华硕笔记本性能调校革新工具深度解析

GHelper：10MB颠覆300MB？华硕笔记本性能调校革新工具深度解析【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops. Control tool for ROG Zephyrus G14, G15, G16, M16, Flow X13, Flow X16, TUF, Strix, Scar and other…

2026/6/15 13:33:36 阅读更多

为什么你的Windows右键菜单总是杂乱无章？这5个技巧让它重获新生

为什么你的Windows右键菜单总是杂乱无章？这5个技巧让它重获新生【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 你是否曾经面对Windows右键菜单中堆积…

2026/6/15 10:04:38 阅读更多

千兆以太网性能优化指南：为什么你的存储网络需要开启Jumbo Frame？

千兆以太网性能优化指南：为什么你的存储网络需要开启Jumbo Frame？ 在企业存储网络中，数据传输效率往往成为制约整体性能的关键瓶颈。想象一下，当你的iSCSI存储阵列在高峰期响应迟缓，或是NAS文件传输耗时远超预期时&…

2026/6/14 7:53:00 阅读更多

构建企业级抖音内容采集系统：高性能架构设计与生产部署方案

构建企业级抖音内容采集系统：高性能架构设计与生产部署方案【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback …

2026/6/15 14:52:04 阅读更多

DLSS Swapper完整指南：一键智能切换游戏DLSS版本，彻底释放显卡性能潜力

DLSS Swapper完整指南：一键智能切换游戏DLSS版本，彻底释放显卡性能潜力【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper DLSS Swapper是一款革命性的游戏优化工具，专为提升游戏性能而…

2026/6/15 14:51:21 阅读更多

Python酒店数据可视化：从Excel到会说话的决策图表

1. 项目概述：用Python把酒店运营数据“画”成会说话的图表你手头有一份酒店过去12个月的Excel表格，里面密密麻麻填着房型、入住率、平均房价、客人来源、预订渠道、停留时长、投诉记录……光是拉滚动条就让人头晕。老板说“看看整体趋势”，你…

2026/6/15 14:51:21 阅读更多

前端工程师的“逃生“地图：收藏这份AI Agent转型完整攻略，升天前抢占下一个超级风口

随着大模型技术成熟，AI Agent成为下一风口，前端开发岗位面临缩减与裁员。本文为前端工程师提供转型AI Agent开发的必要性、可行性分析及完整路径，对比技术栈、分析核心优势，构建知识图谱，助你从打地基到深化落地&#…

2026/6/15 14:49:59 阅读更多

别再死记硬背！用这个真实业务系统案例（分公司管理），5分钟彻底搞懂数据库ER图设计核心

从真实业务场景出发：5分钟掌握数据库ER图设计精髓记得第一次接触ER图时，盯着那些方框和菱形看了半天，完全不明白它们和实际业务有什么关系。直到参与了一个真实的营销系统项目，才恍然大悟——原来ER图中的每个元素都对应着业务中的…

2026/6/15 14:49:59 阅读更多

C语言宽字符编程：wchar.h库详解与国际化文本处理实践

1. 宽字符编程：从单字节到多语言的跨越如果你写过C语言程序，处理过中文、日文或者阿拉伯文，大概率遇到过一堆乱码，或者程序在英文系统上跑得好好的，一到其他语言环境就崩溃。这背后的核心问题，往往出在字符…

2026/6/15 14:49:17 阅读更多

终极便携开发套件：5分钟快速上手w64devkit Windows开发环境

终极便携开发套件：5分钟快速上手w64devkit Windows开发环境【免费下载链接】w64devkit Portable C and C Development Kit for x64 (and x86) Windows 项目地址: https://gitcode.com/gh_mirrors/w6/w64devkit 你是否厌倦了在Windows上配置复杂的C/C开发环境…

2026/6/15 0:00:36 阅读更多

深蓝词库转换：打破20+输入法壁垒的技术架构深度解析

深蓝词库转换：打破20输入法壁垒的技术架构深度解析【免费下载链接】imewlconverter ”深蓝词库转换“ 一款开源免费的输入法词库转换程序项目地址: https://gitcode.com/gh_mirrors/im/imewlconverter 当你在不同平台间切换输入法时，是否曾为无…

2026/6/15 0:02:18 阅读更多

NSK紧凑型精密滚珠丝杠技术手册

型号 W1202FA-3P-C3Z5 属于 the sources 中 NSK 推出的紧凑型 FA 系列（Compact FA Series）高速精密滚珠丝杠。如果您一路追踪了之前的查询记录，这款产品正是您不久前查询的 125 规格（12 mm 粗轴、5 mm 导程、预紧无背隙版&#x…

2026/6/15 0:02:59 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/15 0:09:30 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/15 0:09:27 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/15 0:09:27 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/15 10:37:31 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/15 10:16:08 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/15 10:16:07 阅读更多

相关文章