从吴恩达课程到实战：手把手教你用Python实现一个5层深度神经网络（附完整代码）

发布时间：2026/6/1 16:46:37

从吴恩达课程到实战手把手教你用Python实现一个5层深度神经网络附完整代码深度学习的魅力在于它能够通过层层抽象自动提取特征而不仅仅是依赖人工设计的特征工程。吴恩达教授的课程为我们奠定了坚实的理论基础但真正掌握深度神经网络的精髓还需要将数学公式转化为可运行的代码。本文将带你从零开始构建一个5层深度神经网络重点关注维度匹配、梯度流动和参数优化等实战关键点。1. 环境准备与数据加载在开始构建神经网络之前我们需要确保开发环境配置正确。推荐使用Python 3.8版本并安装以下核心库import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import make_moons from sklearn.model_selection import train_test_split我们使用make_moons生成非线性可分数据集这种数据非常适合验证深度神经网络的表达能力X, y make_moons(n_samples1000, noise0.2, random_state42) X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.3, random_state42)数据预处理是模型成功的关键第一步标准化将特征值缩放到相似范围维度调整确保输入数据形状符合网络要求可视化直观理解数据分布特征# 数据标准化 mean X_train.mean(axis0) std X_train.std(axis0) X_train (X_train - mean) / std X_test (X_test - mean) / std # 调整维度 X_train X_train.T y_train y_train.reshape(1, -1) X_test X_test.T y_test y_test.reshape(1, -1)2. 网络架构设计与初始化我们构建的5层神经网络结构如下层类型单元数量激活函数输入层2-隐藏层164ReLU隐藏层232ReLU隐藏层316ReLU输出层1Sigmoid参数初始化对深度神经网络的训练至关重要。不恰当的初始化可能导致梯度消失或爆炸def initialize_parameters(layer_dims): np.random.seed(42) parameters {} L len(layer_dims) for l in range(1, L): parameters[W str(l)] np.random.randn(layer_dims[l], layer_dims[l-1]) * 0.01 parameters[b str(l)] np.zeros((layer_dims[l], 1)) return parameters layer_dims [2, 64, 32, 16, 1] parameters initialize_parameters(layer_dims)注意权重初始化使用较小的随机值可以避免初始阶段神经元输出饱和而偏置初始化为零是常见做法。3. 前向传播实现与维度核对前向传播需要为每一层实现两个关键操作线性变换Z W·A_prev b非线性激活A g(Z)def relu(Z): return np.maximum(0, Z) def sigmoid(Z): return 1 / (1 np.exp(-Z)) def forward_propagation(X, parameters): caches [] A X L len(parameters) // 2 for l in range(1, L): A_prev A W parameters[W str(l)] b parameters[b str(l)] Z np.dot(W, A_prev) b A relu(Z) caches.append((A_prev, W, b, Z)) # 输出层使用sigmoid激活 W parameters[W str(L)] b parameters[b str(L)] Z np.dot(W, A) b AL sigmoid(Z) caches.append((A, W, b, Z)) return AL, caches维度核对是调试神经网络的关键技能。以下表格展示了各层矩阵的正确维度变量维度公式示例维度W^[l](n^[l], n^[l-1])W1: (64, 2)b^[l](n^[l], 1)b1: (64, 1)Z^[l], A^[l](n^[l], m)A1: (64, 700)4. 损失函数计算与反向传播二元分类问题使用交叉熵损失函数def compute_cost(AL, Y): m Y.shape[1] cost -np.mean(Y * np.log(AL) (1-Y) * np.log(1-AL)) return np.squeeze(cost)反向传播计算梯度是深度神经网络训练的核心。我们需要为每一层计算三个关键梯度dW权重梯度db偏置梯度dA_prev前一层激活梯度def relu_backward(dA, Z): dZ np.array(dA, copyTrue) dZ[Z 0] 0 return dZ def backward_propagation(AL, Y, caches): grads {} L len(caches) m AL.shape[1] Y Y.reshape(AL.shape) # 初始化反向传播 dAL - (np.divide(Y, AL) - np.divide(1 - Y, 1 - AL)) # 输出层梯度 current_cache caches[L-1] A_prev, W, b, Z current_cache dZ AL - Y grads[dW str(L)] np.dot(dZ, A_prev.T) / m grads[db str(L)] np.sum(dZ, axis1, keepdimsTrue) / m grads[dA str(L-1)] np.dot(W.T, dZ) # 隐藏层梯度 for l in reversed(range(L-1)): current_cache caches[l] A_prev, W, b, Z current_cache dA grads[dA str(l1)] dZ relu_backward(dA, Z) grads[dW str(l1)] np.dot(dZ, A_prev.T) / m grads[db str(l1)] np.sum(dZ, axis1, keepdimsTrue) / m grads[dA str(l)] np.dot(W.T, dZ) return grads5. 参数更新与训练循环使用梯度下降算法更新参数def update_parameters(parameters, grads, learning_rate): L len(parameters) // 2 for l in range(1, L1): parameters[W str(l)] - learning_rate * grads[dW str(l)] parameters[b str(l)] - learning_rate * grads[db str(l)] return parameters完整的训练循环整合了前向传播、损失计算、反向传播和参数更新def model(X, Y, layer_dims, learning_rate0.01, num_iterations3000, print_costFalse): costs [] parameters initialize_parameters(layer_dims) for i in range(num_iterations): # 前向传播 AL, caches forward_propagation(X, parameters) # 计算损失 cost compute_cost(AL, Y) # 反向传播 grads backward_propagation(AL, Y, caches) # 参数更新 parameters update_parameters(parameters, grads, learning_rate) # 记录损失 if i % 100 0: costs.append(cost) if print_cost: print(f迭代次数 {i}: 损失 {cost}) # 绘制学习曲线 plt.plot(costs) plt.xlabel(迭代次数(每100次)) plt.ylabel(损失) plt.title(学习率 str(learning_rate)) plt.show() return parameters6. 模型评估与可视化训练完成后我们需要评估模型在测试集上的表现def predict(X, parameters): AL, _ forward_propagation(X, parameters) predictions (AL 0.5).astype(int) return predictions def accuracy(y_true, y_pred): return np.mean(y_true y_pred) * 100 # 训练模型 parameters model(X_train, y_train, layer_dims, learning_rate0.03, num_iterations3000, print_costTrue) # 测试集评估 predictions predict(X_test, parameters) print(f测试集准确率: {accuracy(y_test, predictions):.2f}%)可视化决策边界可以直观理解模型的分类能力def plot_decision_boundary(X, y, parameters): x_min, x_max X[0, :].min() - 1, X[0, :].max() 1 y_min, y_max X[1, :].min() - 1, X[1, :].max() 1 h 0.01 xx, yy np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h)) Z predict(np.c_[xx.ravel(), yy.ravel()].T, parameters) Z Z.reshape(xx.shape) plt.contourf(xx, yy, Z, cmapplt.cm.Spectral, alpha0.8) plt.scatter(X[0, :], X[1, :], cy, cmapplt.cm.Spectral) plt.xlabel(特征1) plt.ylabel(特征2) plt.title(决策边界) plt.show() plot_decision_boundary(X_test, y_test[0], parameters)7. 超参数调优与实战技巧深度神经网络的性能很大程度上取决于超参数的选择。以下是几个关键超参数的经验范围超参数推荐范围调整策略学习率0.0001-0.1指数衰减批量大小32-2562的幂次隐藏层数2-5逐步增加单元数量16-512网格搜索调试深度神经网络时常见的几个问题及解决方案梯度消失使用ReLU激活函数、批归一化、残差连接过拟合添加L2正则化、Dropout层、数据增强训练不稳定梯度裁剪、学习率预热、自适应优化器# 添加L2正则化的损失计算 def compute_cost_with_regularization(AL, Y, parameters, lambd): m Y.shape[1] cross_entropy_cost compute_cost(AL, Y) L len(parameters) // 2 L2_cost 0 for l in range(1, L1): L2_cost np.sum(np.square(parameters[W str(l)])) L2_cost (lambd / (2 * m)) * L2_cost cost cross_entropy_cost L2_cost return np.squeeze(cost)在实际项目中我发现使用学习率衰减策略可以显著提升模型性能def learning_rate_decay(initial_lr, epoch, decay_rate0.1, decay_step100): return initial_lr * (decay_rate ** (epoch // decay_step))

Arduino入门：从LED闪烁项目掌握嵌入式开发核心技能

1. 项目概述：从点亮第一盏灯开始如果你对电子世界充满好奇，想亲手让硬件“活”起来，那么让一个LED灯闪烁，无疑是你的最佳起点。这不仅是嵌入式开发领域的“Hello World”，更是理解微控制器如何与现实世界交互的基石。我…

2026/6/1 16:46:16 阅读更多

如何在Windows电脑上直接安装安卓应用？APK-Installer为你提供专业解决方案

如何在Windows电脑上直接安装安卓应用？APK-Installer为你提供专业解决方案【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否曾经想在Windows电脑上运行…

2026/6/1 16:45:34 阅读更多

3步搞定跨平台歌单迁移：LX Music桌面版智能神器全解析

3步搞定跨平台歌单迁移：LX Music桌面版智能神器全解析【免费下载链接】lx-music-desktop 一个基于 Electron 的音乐软件项目地址: https://gitcode.com/GitHub_Trending/lx/lx-music-desktop 你是否曾因更换音乐平台而痛失精心收藏的歌单？是否在…

2026/6/1 16:45:34 阅读更多

3步革命性方案：用Brigadier智能解决Mac Boot Camp驱动部署难题

3步革命性方案：用Brigadier智能解决Mac Boot Camp驱动部署难题【免费下载链接】brigadier Fetch and install Boot Camp ESDs with ease. 项目地址: https://gitcode.com/gh_mirrors/bri/brigadier 还在为Mac电脑安装Windows系统后繁琐的驱动安装而头疼吗&a…

2026/6/1 17:33:08 阅读更多

3个核心技巧：用QuickCut智能剪辑让你的视频制作效率翻倍

3个核心技巧：用QuickCut智能剪辑让你的视频制作效率翻倍【免费下载链接】QuickCut Your most handy video processing software 项目地址: https://gitcode.com/gh_mirrors/qu/QuickCut 你是否曾经为了剪辑一段简单的视频而花费数小时？面对复杂的…

2026/6/1 17:32:48 阅读更多

计算机内存原理全解析：从DRAM单元到DDR5安装与故障排查

1. 内存：计算机的“工作台”与“瞬时记忆”如果你拆开过台式机或笔记本，一定见过主板上那几块绿色的长条状电路板，那就是内存条，学名随机存取存储器。很多人把它比作计算机的“短期记忆”，这个比喻很形象，但…

2026/6/1 17:32:27 阅读更多

Arduino记忆游戏：从硬件搭建到户外寻宝机关的嵌入式开发实践

1. 项目概述与核心价值如果你和我一样，既是个喜欢鼓捣硬件的极客，又对户外寻宝（Geocaching）这类结合了探索与解谜的活动情有独钟，那么这个项目绝对能让你眼前一亮。它本质上是一个基于Arduino的“西蒙说”&#xff08…

2026/6/1 17:32:27 阅读更多

一键备份QQ空间：GetQzonehistory让你的数字记忆永不丢失

一键备份QQ空间：GetQzonehistory让你的数字记忆永不丢失【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 你是否还记得那些年发过的QQ空间说说？那些深夜的心情记录…

2026/6/1 17:32:27 阅读更多

别让Edge抢戏！Win10下彻底锁定IE浏览器访问特定老网站的保姆级教程

Win10系统下精准锁定IE浏览器访问特定老网站的终极指南当财务部的老王第13次因为网银系统无法登录而拍桌子时，整个办公室都意识到这个问题的严重性——那些只认IE浏览器的老系统正在成为数字化转型路上最顽固的绊脚石。银行系统、税务平台、企业内部ERP，…

2026/6/1 17:31:47 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/1 0:00:11 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/1 0:03:17 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/1 0:06:19 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/1 0:24:01 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/1 2:19:25 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/1 0:23:56 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

2026/6/1 0:00:11 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

2026/6/1 0:03:17 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

2026/6/1 0:06:19 阅读更多

相关文章

Arduino入门：从LED闪烁项目掌握嵌入式开发核心技能

如何在Windows电脑上直接安装安卓应用？APK-Installer为你提供专业解决方案

3步搞定跨平台歌单迁移：LX Music桌面版智能神器全解析

3步革命性方案：用Brigadier智能解决Mac Boot Camp驱动部署难题

3个核心技巧：用QuickCut智能剪辑让你的视频制作效率翻倍

计算机内存原理全解析：从DRAM单元到DDR5安装与故障排查

Arduino记忆游戏：从硬件搭建到户外寻宝机关的嵌入式开发实践

一键备份QQ空间：GetQzonehistory让你的数字记忆永不丢失

别让Edge抢戏！Win10下彻底锁定IE浏览器访问特定老网站的保姆级教程

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因