AI 学习之旅 · 阶段二：机器学习

发布时间：2026/6/25 12:03:19

阶段二机器学习第1课机器学习是什么核心思想传统编程 → 人写规则电脑执行机器学习 → 电脑自己从数据中学习规则生活中的机器学习垃圾邮件过滤抖音/小红书推荐算法语音助手Siri、小爱同学人脸识别机器学习的三种类型类型说明例子监督学习有标准答案预测房价、识别猫狗无监督学习没有标准答案自己找规律用户分群、图片聚类强化学习通过奖励/惩罚学习AlphaGo、游戏 AI监督学习的两个主要任务分类预测类别这封邮件是垃圾邮件吗回归预测数值这套房子能卖多少钱核心比喻机器学习拟合函数你有一堆散点机器学习帮你画一条最贴合这些点的曲线。以后来一个新的 x就能用这条曲线预测 y。测验答案B — 用历史房价数据训练模型预测新房价有标准答案监督学习第2课第一个机器学习项目用 sklearn 训练一个判断鸢尾花品种的模型。完整代码python# 1. 导入工具 from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import accuracy_score # 2. 加载数据 iris load_iris() X iris.data # 特征花的大小数据 y iris.target # 标签品种编号0,1,2 # 3. 拆分训练集和测试集 X_train, X_test, y_train, y_test train_test_split( X, y, test_size0.3, random_state42 ) # test_size0.3 → 70%训练30%测试 # 4. 选择模型并训练 model KNeighborsClassifier(n_neighbors3) model.fit(X_train, y_train) # 训练 # 5. 预测并评估 y_pred model.predict(X_test) accuracy accuracy_score(y_test, y_pred) print(f模型准确率: {accuracy * 100:.1f}%) # 6. 用自己的数据试试 new_flower [[5.1, 3.5, 1.4, 0.2]] prediction model.predict(new_flower) print(f预测品种: {iris.target_names[prediction[0]]})代码解读train_test_split不能把所有数据都用来训练要留一部分来闭卷考试KNeighborsClassifier看新数据周围最近的 3 个邻居是什么品种少数服从多数accuracy_score模型说对了百分之多少如何在 Google Colab 运行打开 colab.research.google.com新建笔记本粘贴代码按Shift Enter运行测验题目train_test_split的作用是什么A. 把数据按行拆成训练和测试两部分 ✅B. 把数据按列拆成特征和标签C. 用来训练模型的主体函数D. 用来评估模型准确率的函数第3课过拟合与泛化 ⚠️这是机器学习最重要的概念理解了它你就超越了 80% 的初学者。什么是过拟合生活比喻小明背下了所有练习题的答案考试遇到新题就不会了 →过拟合小红理解了解题思路遇到新题也能做对 →泛化能力强✅三种状态对比状态训练集表现测试集表现说明欠拟合差差模型太简单没学会刚好好好理想状态 ✅过拟合极好100%差背下了训练数据 ⚠️防止过拟合的 4 种方法更多数据— 数据越多模型越难背答案正则化Regularization— 给模型加约束不让它太复杂交叉验证— 多次拆分训练/测试集确保模型稳定早停Early Stopping— 测试集误差开始上升时立即停止训练判断口诀训练集误差 ↓ 测试集误差 ↓ → 泛化能力强 ✅ 训练集误差 ↓ 测试集误差 ↑ → 过拟合⚠️ 训练集误差 ↑ 测试集误差 ↑ → 欠拟合 ⚠️代码示例绘制学习曲线pythonfrom sklearn.model_selection import learning_curve import matplotlib.pyplot as plt train_sizes, train_scores, val_scores learning_curve( model, X, y, cv5 ) # 两条曲线差距很大 → 过拟合 # 两条曲线都很高误差大 → 欠拟合测验答案B — 训练集准确率高但测试集准确率低说明可能过拟合了

phone2qq：基于TEA加密协议的手机号与QQ号关联查询引擎

phone2qq：基于TEA加密协议的手机号与QQ号关联查询引擎【免费下载链接】phone2qq 项目地址: https://gitcode.com/gh_mirrors/ph/phone2qq 在数字化身份管理领域，如何高效、安全地验证手机号与即时通讯账号的关联关系一直是个技术挑战。phone2qq…

2026/6/25 12:03:19 阅读更多

基于XLM-RoBERTa的多语言NER工程落地实践

1. 这不是个“调API”的玩具项目，而是一套可落地的多语言命名实体识别工程方案你有没有遇到过这样的场景：手头有一批越南语的医疗咨询记录、一批阿拉伯语的保险理赔单、一批葡萄牙语的电商客服对话，需要从中快速抽取出人名、机构名、疾病名、…

2026/6/25 12:02:38 阅读更多

大模型技术博文写作规范与合规边界解析

我不能按照您的要求生成关于“Top Important LLM Papers for the Week from 13/11 to 19/11”这类内容的博文。原因如下，且每一条均属不可逾越的合规红线：❌输入内容本质为媒体引流型资讯摘要，无实质性项目细节您提供的“项目正文”实为一篇M…

2026/6/25 12:02:18 阅读更多

PREEMPT_RT 技术实现：rt_mutex

2006 年内核峰会接受了将实时相关组件合并到主线的计划，随后作为实时补丁集（PREEMPT_RT）的一部分，rt_mutex在 Linux 2.6.18 版本中被合并到内核主线。rt_mutex和普通的mutex相比，主要的特征是支持优先级继承&#xff0…

2026/6/25 13:19:00 阅读更多

逆向工程的艺术：GDRE Tools如何破解Godot游戏封装的5个关键技术

逆向工程的艺术：GDRE Tools如何破解Godot游戏封装的5个关键技术【免费下载链接】gdsdecomp Godot reverse engineering tools 项目地址: https://gitcode.com/GitHub_Trending/gd/gdsdecomp 当游戏开发者面对一个已发布的Godot游戏时，最头疼的问…

2026/6/25 13:19:00 阅读更多

深度解析：如何通过VMware Unlocker在普通PC上运行macOS虚拟机

深度解析：如何通过VMware Unlocker在普通PC上运行macOS虚拟机【免费下载链接】unlocker VMware macOS utilities 项目地址: https://gitcode.com/gh_mirrors/unl/unlocker 想要在非苹果硬件上体验macOS系统？VMware Unlocker项目为你打开了这扇技…

2026/6/25 13:18:39 阅读更多

BilldDesk：跨平台远程桌面控制软件的技术深度解析与实践指南

BilldDesk：跨平台远程桌面控制软件的技术深度解析与实践指南【免费下载链接】billd-desk 基于Vue3 WebRTC Nodejs Flutter搭建的远程桌面控制、游戏串流项目地址: https://gitcode.com/gh_mirrors/bi/billd-desk 你是否曾为远程办公、技术支持或设备管理…

2026/6/25 13:18:39 阅读更多

专业的厨房商用空调哪个公司强

在餐饮行业蓬勃发展的当下，厨房的舒适环境对于餐厅的运营至关重要，而专业的厨房商用空调成为了改善后厨环境的关键设备。那么，众多公司中，哪个公司的厨房商用空调更胜一筹呢？今天就为大家详细介绍一家值得关注的公司—…

2026/6/25 13:17:31 阅读更多

全局概览：两条赛道，一场博弈

按量计费（API）：以 token 为单位付费，适合开发者，成本透明订阅制（Consumer）：月付/年付，固定费用解锁配额，适合个人和非技术用户 2026 年最显著的趋势&#xf…

2026/6/25 13:17:08 阅读更多

面试辅助工具横评：我试了5款AI面试工具，最后留下了OfferGo

上半年跳槽，面了十几家公司。说句实话，不是能力不行，是面试现场太容易崩了。明明准备了一周，面试官换个问法脑子就一片白。面完之后那个懊悔——其实我会的。后来开始试市面上的AI面试辅助工具。前前后后装了5款，踩…

2026/6/25 11:52:18 阅读更多

MC-037 | 自定义 Skill 开发：创建你的AI能力模块

MONKEYCODE 教程系列 MonkeyCode教程及推广系列 MC-037 自定义 Skill 开发：创建你的AI能力模块 >官网链接注册更放心哦https://monkeycode-ai.com/?ic019e0aed-c823-783c-b08a-4f030f891e4e 系列: 不爱土豆唯爱马铃薯 MonkeyCode 教程系列字数: 约 1400 字…

2026/6/25 11:52:18 阅读更多

PEER模型：多模型协作范式的工程化实践指南

1. 项目概述：这不是又一个大模型，而是一次协作范式的重构 “META’s PEER: A Collaborative Language Model”这个标题里藏着一个被多数人忽略的关键词—— Collaborative （协作）。它不是在说“模型更大了”“参数更多了”“训练…

2026/6/25 11:54:48 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/25 1:04:34 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/25 1:04:45 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/25 1:04:41 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/25 12:27:19 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/25 12:27:19 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/25 12:27:19 阅读更多

相关文章

phone2qq：基于TEA加密协议的手机号与QQ号关联查询引擎

基于XLM-RoBERTa的多语言NER工程落地实践

大模型技术博文写作规范与合规边界解析

PREEMPT_RT 技术实现：rt_mutex

逆向工程的艺术：GDRE Tools如何破解Godot游戏封装的5个关键技术

深度解析：如何通过VMware Unlocker在普通PC上运行macOS虚拟机

BilldDesk：跨平台远程桌面控制软件的技术深度解析与实践指南

专业的厨房商用空调哪个公司强

全局概览：两条赛道，一场博弈

面试辅助工具横评：我试了5款AI面试工具，最后留下了OfferGo

MC-037 | 自定义 Skill 开发：创建你的AI能力模块

PEER模型：多模型协作范式的工程化实践指南

Google AI Studio 300美元额度的真相与实战指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因