Python学习第82天：k最近邻算法（kNN）

发布时间：2026/6/14 10:36:53

Python学习100天（从入门到精通系列文章）文章目录Python学习100天（从入门到精通系列文章）前言一、k最近邻算法概述1.1 什么是 kNN 算法1.2 kNN 的两个关键问题二、距离的度量2.1 闵可夫斯基距离2.2 三种常见的闵氏距离三、鸢尾花数据集介绍3.1 数据集背景3.2 加载数据集3.3 划分训练集和测试集四、kNN 分类的实现4.1 基于 NumPy 手写 kNN4.2 基于 scikit-learn 实现五、模型评估5.1 混淆矩阵5.2 核心评估指标5.3 ROC 曲线与 AUC5.4 使用 scikit-learn 输出评估报告六、参数调优6.1 KNeighborsClassifier 的重要参数6.2 网格搜索与交叉验证七、kNN 回归7.1 回归原理7.2 实战：月收入预测网购支出八、常见错误与避坑指南8.1 错误一：k 值选择不当8.2 错误二：未做特征标准化8.3 错误三：忽略类别不平衡参考链接总结前言在上一篇文章中，我们初步认识了机器学习的基本概念和分类。今天，我们将深入探讨机器学习中最经典、最直观的分类算法之一——k最近邻算法（kNN）。kNN 不需要显式的训练过程，它的核心思想只有八个字：“近朱者赤，近墨者黑”。本文将从距离度量、数据集处理、算法实现到模型评估，带你全面掌握 kNN 算法，适合有 Python 基础、正在入门机器学习的读者。一、k最近邻算法概述1.1 什么是 kNN 算法k 最近邻算法（k-Nearest Neighbors，简称 kNN）是一种用于分类和回归的非参数统计方法，由美国统计学家伊芙琳·费克斯和小约瑟夫·霍奇斯于 1951 年提出。kNN 算法的核心原理非常简单：从历史数据中找到k \small{k}k

从Kivy到Flet：一个Python老鸟的安卓GUI开发心路历程与技术选型思考

从Kivy到Flet：一个Python老鸟的安卓GUI开发心路历程与技术选型思考十年前，当我第一次尝试用Python开发安卓应用时，Kivy几乎是唯一的选择。那时候的移动开发领域，Java和Objective-C牢牢占据着原生开发的主导地位，而Pyth…

2026/6/14 10:36:33 阅读更多

PyPI本质解析：包名、导入名与Wheel分发机制

1. 这不是“安装教程”，而是一份 Python 开发者真正需要的 PyPI 实战手札你刚学完print("Hello, World!")，兴冲冲想用pandas读个 Excel，结果在终端敲下pip install pandas后卡在了 “Collecting pandas” 十分钟不动；或…

2026/6/14 10:36:33 阅读更多

互联网大厂 Java 求职者面试实录：从 Spring Boot 到微服务的技术探讨

互联网大厂 Java 求职者面试实录：从 Spring Boot 到微服务的技术探讨在这个互联网快速发展的时代，Java 开发者面临着越来越多的挑战与机遇。本文将通过一场模拟面试，带你深入了解互联网大厂的 Java 求职者在面试中可能遇到的问题及其解决方案…

2026/6/14 10:36:12 阅读更多

大模型具身智能全栈开发笔记日更

工具栈基本操作 ssh 推荐你在cursor vscode codex trae等用ssh，这样的话直接让ai 辅助非常的爽 ssh的小谈-CSDN博客文章浏览阅读313次，点赞3次，收藏6次。ssh连接和文件传输https://blog.csdn.net/qq_62260432/article/details/1485977…

2026/6/14 12:05:48 阅读更多

SD-PPP：如何在Photoshop中免费安装AI绘图插件并快速掌握智能设计工作流

SD-PPP：如何在Photoshop中免费安装AI绘图插件并快速掌握智能设计工作流【免费下载链接】sd-ppp A Photoshop AI plugin 项目地址: https://gitcode.com/gh_mirrors/sd/sd-ppp 还在为AI绘图工具与Photoshop之间的繁琐切换而烦恼吗？SD-PPP这款免费…

2026/6/14 12:04:18 阅读更多

MPC8280 ATM控制器流量控制与缓冲区管理机制深度解析

1. 项目概述与核心价值在嵌入式通信系统开发，尤其是涉及ATM（异步传输模式）网络接口的设计中，如何高效、精确地控制数据流，确保服务质量，同时又能灵活管理有限的内存资源，是决定系统稳定性和性能…

2026/6/14 12:03:57 阅读更多

MPC8260 SCC以太网模式：硬件连接、数据收发与地址过滤详解

1. MPC8260 SCC以太网模式：从硬件连接到软件配置的深度解析在嵌入式网络设备开发领域，尤其是工业控制、通信网关等对可靠性和实时性有严苛要求的场景，飞思卡尔（现恩智浦）的MPC8260 PowerQUICC II处理器是一个经典的选…

2026/6/14 12:03:57 阅读更多

告别PPT画图！用PlotNeuralNet+LaTeX一键生成高颜值神经网络架构图（附完整代码）

科研绘图革命：用PlotNeuralNetLaTeX打造专业级神经网络可视化方案在深度学习领域，论文图表质量往往直接影响研究成果的呈现效果。传统绘图工具如PPT或Visio不仅耗时费力，更难以保证学术图表的标准性和一致性。我曾花费整整三天调整一个复杂Tr…

2026/6/14 12:03:16 阅读更多

MPC8280 PCI桥DMA与I2O消息单元：从硬件原理到驱动实战

1. 项目概述：从硬件手册到实战理解的跨越如果你曾经在嵌入式系统开发中，尤其是在涉及多处理器通信或高速数据搬移的场景下工作过，那么“DMA”和“消息传递”这两个词对你来说一定不陌生。它们就像是系统内部的“高速公路”和“快递系统”&…

2026/6/14 12:02:56 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/14 0:00:09 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/14 0:00:30 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/14 0:01:11 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

2026/6/14 0:00:09 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

2026/6/14 0:00:30 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

2026/6/14 0:01:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/14 10:35:25 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/14 10:02:42 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/14 10:02:42 阅读更多

相关文章

从Kivy到Flet：一个Python老鸟的安卓GUI开发心路历程与技术选型思考

PyPI本质解析：包名、导入名与Wheel分发机制

互联网大厂 Java 求职者面试实录：从 Spring Boot 到微服务的技术探讨

大模型具身智能 全栈开发笔记 日更

SD-PPP：如何在Photoshop中免费安装AI绘图插件并快速掌握智能设计工作流

MPC8280 ATM控制器流量控制与缓冲区管理机制深度解析

MPC8260 SCC以太网模式：硬件连接、数据收发与地址过滤详解

告别PPT画图！用PlotNeuralNet+LaTeX一键生成高颜值神经网络架构图（附完整代码）

MPC8280 PCI桥DMA与I2O消息单元：从硬件原理到驱动实战

音乐文件解锁实战指南：3个场景解决你的播放困境

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

音乐文件解锁实战指南：3个场景解决你的播放困境

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

大模型具身智能全栈开发笔记日更