本周主要学习了深度学习的基础理论包括深度学习的数学本质、激活函数、前向传播与反向传播的原理。重点理解了非线性激活函数对模型表达能力的作用掌握了前向传播的矩阵表示并推导了反向传播的梯度计算过程为后续神经网络训练打下基础。一、回归任务深度学习的基础范式回归是机器学习最基础的监督学习任务目标是从给定数据中学习输入到连续输出的映射关系用于预测连续型数值。课程以宝可梦 CP 值预测为例完整演示了回归模型的构建思路通过假设函数建立输入与输出的关系利用损失函数量化预测值与真实值之间的误差再通过优化算法不断调整模型参数使模型逐步逼近最优拟合状态。线性回归作为最简单的回归模型清晰体现了深度学习 “数据驱动、误差最小化” 的核心逻辑是理解后续复杂模型的重要基础。二、模型误差偏差、方差与噪声模型预测性能的优劣本质上取决于误差的控制能力。课程系统讲解了误差的三个主要来源偏差、方差与数据噪声。偏差源于模型结构过于简单拟合能力不足难以捕捉数据的真实规律易导致欠拟合方差源于模型结构过于复杂过度学习训练数据中的随机波动与噪声导致泛化能力下降易引发过拟合数据噪声则来自数据采集、测量过程中的客观误差属于不可消除的固有成分。一个性能良好的模型需要在偏差与方差之间取得合理平衡从而在训练集与测试集上均保持稳定表现。三、梯度下降参数优化的核心方法梯度下降是深度学习中最基础、最核心的参数优化算法其核心思想是通过迭代更新参数使损失函数逐步收敛至最小值。课程将其形象比喻为 “沿山坡最陡方向下山”计算损失函数对参数的梯度沿梯度反方向调整参数不断缩小预测误差。学习率是梯度下降的关键超参数取值过大易导致参数震荡、无法收敛取值过小则会降低训练效率、延长收敛时间。课程还简要介绍了批量梯度下降、随机梯度下降与小批量梯度下降三种变体其中小批量梯度下降兼顾训练效率与稳定性是当前深度学习实践中的主流选择。四、神经网络基础结构、激活与训练流程初步学习了浅层神经网络的基本概念与训练逻辑。神经网络由输入层、隐藏层和输出层构成通过多层线性变换与非线性激活函数的组合具备拟合复杂非线性关系的能力。激活函数如 Sigmoid的核心作用是引入非线性特性解决线性模型表达能力不足的问题是构建深层网络的关键。神经网络的训练流程主要包括四个环节前向传播、损失计算、反向传播、参数更新。前向传播完成数据的逐层传递与预测输出损失计算量化预测误差反向传播利用链式法则逐层计算梯度参数更新通过梯度下降算法调整权重与偏置迭代直至模型收敛。五、学习总结与后续规划本次学习聚焦深度学习入门核心内容整体以概念理解和流程梳理为主未深入复杂数学推导与代码实现重点掌握了回归、误差、梯度下降及神经网络基础等关键知识点构建了深度学习的基础认知框架。李宏毅老师的课程逻辑清晰、讲解通俗通过大量实例降低了抽象概念的理解难度非常适合入门学习。后续将继续夯实基础逐步加深对核心概念的理解尝试完成简单模型的理论推导与基础实践进一步巩固所学内容为后续学习打下坚实基础。
学习课程学习报告
发布时间:2026/5/25 11:02:56
本周主要学习了深度学习的基础理论包括深度学习的数学本质、激活函数、前向传播与反向传播的原理。重点理解了非线性激活函数对模型表达能力的作用掌握了前向传播的矩阵表示并推导了反向传播的梯度计算过程为后续神经网络训练打下基础。一、回归任务深度学习的基础范式回归是机器学习最基础的监督学习任务目标是从给定数据中学习输入到连续输出的映射关系用于预测连续型数值。课程以宝可梦 CP 值预测为例完整演示了回归模型的构建思路通过假设函数建立输入与输出的关系利用损失函数量化预测值与真实值之间的误差再通过优化算法不断调整模型参数使模型逐步逼近最优拟合状态。线性回归作为最简单的回归模型清晰体现了深度学习 “数据驱动、误差最小化” 的核心逻辑是理解后续复杂模型的重要基础。二、模型误差偏差、方差与噪声模型预测性能的优劣本质上取决于误差的控制能力。课程系统讲解了误差的三个主要来源偏差、方差与数据噪声。偏差源于模型结构过于简单拟合能力不足难以捕捉数据的真实规律易导致欠拟合方差源于模型结构过于复杂过度学习训练数据中的随机波动与噪声导致泛化能力下降易引发过拟合数据噪声则来自数据采集、测量过程中的客观误差属于不可消除的固有成分。一个性能良好的模型需要在偏差与方差之间取得合理平衡从而在训练集与测试集上均保持稳定表现。三、梯度下降参数优化的核心方法梯度下降是深度学习中最基础、最核心的参数优化算法其核心思想是通过迭代更新参数使损失函数逐步收敛至最小值。课程将其形象比喻为 “沿山坡最陡方向下山”计算损失函数对参数的梯度沿梯度反方向调整参数不断缩小预测误差。学习率是梯度下降的关键超参数取值过大易导致参数震荡、无法收敛取值过小则会降低训练效率、延长收敛时间。课程还简要介绍了批量梯度下降、随机梯度下降与小批量梯度下降三种变体其中小批量梯度下降兼顾训练效率与稳定性是当前深度学习实践中的主流选择。四、神经网络基础结构、激活与训练流程初步学习了浅层神经网络的基本概念与训练逻辑。神经网络由输入层、隐藏层和输出层构成通过多层线性变换与非线性激活函数的组合具备拟合复杂非线性关系的能力。激活函数如 Sigmoid的核心作用是引入非线性特性解决线性模型表达能力不足的问题是构建深层网络的关键。神经网络的训练流程主要包括四个环节前向传播、损失计算、反向传播、参数更新。前向传播完成数据的逐层传递与预测输出损失计算量化预测误差反向传播利用链式法则逐层计算梯度参数更新通过梯度下降算法调整权重与偏置迭代直至模型收敛。五、学习总结与后续规划本次学习聚焦深度学习入门核心内容整体以概念理解和流程梳理为主未深入复杂数学推导与代码实现重点掌握了回归、误差、梯度下降及神经网络基础等关键知识点构建了深度学习的基础认知框架。李宏毅老师的课程逻辑清晰、讲解通俗通过大量实例降低了抽象概念的理解难度非常适合入门学习。后续将继续夯实基础逐步加深对核心概念的理解尝试完成简单模型的理论推导与基础实践进一步巩固所学内容为后续学习打下坚实基础。