动手学习深度学习-深度学习知识大纲

使用数据集训练一个模型的过程:

1、构造随机初始化参数的模型

2、获取数据集

3、构造损失和优化器用于调整参数,使模型在数据样本中表现更好

4、重复第2步和第3步

1、机器学习组件

1.1、数据处理(包含一定数学知识)

  • 数据+=样本/数据点/数据实例(独立且同分布)
    • 独立:一个样本的出现不影响其他样本的出现概率。
    • 同分布:所有样本都来自相同的概率分布,即它们具有相似的统计特性。
  • 样本+=特征/协变量属性(机器学习模型会根据这些属性进⾏预测,要预测的是⼀个特殊的属性,它被称为标签(label),或⽬标(target))
    • 假设我们处理的是图像数据,每⼀张单独的照⽚即为⼀个样本,它的特征由每个像素数值的有序列表表示。⽐如,200 × 200彩⾊照⽚由200 × 200 × 3 = 120000个数值组成,其中的“3”对应于每个空间位置的红、绿、蓝通道的强度。
  • 特征向量:将样本的所有特征值组合成一个向量。
  • 维度:特征的个数,或特征向量的长度

1.2、模型(神经网络)

  • 深度学习关注的是功能强⼤的模型,这些模型由神经⽹络(CNN、RNN等)错综复杂的交织在⼀起,且包含层层的数据转换。

1.3、目标函数(loss)

  • 目标函数(损失函数loss/cost):定义模型优劣程度的度量,一般越低越好。
    • 预测数值:平方误差,预测值与实际值之差的平方
    • 分类问题:最小化错误率,即预测与实际情况不符的样本⽐例
  • 损失函数是根据模型参数定义的,并取决于数据集。数据集分为两部分:
    • 训练数据集:拟合模型参数
    • 测试数据集:评估拟合模型

1.4、优化算法(grad)

  • 梯度下降:在每个步骤中检查每个参数,观察对该参数进行少量变动时,训练集损失会朝哪个⽅向移动,然后在减少损失的方向上优化参数。

2、机器学习问题分类

2.1、监督学习(supervised learning)--有目标(标签)

监督学习擅⻓在“给定输⼊特征”的情况下预测标签。即在给定⼀组特定的可⽤数据的情况下,估计未知事物的概率。

  • 预测:能够将任何输⼊特征映射到标签
  • 样本:特征+标签

监督学习的学习过程:

1、从已知⼤量数据样本中随机选取⼀个⼦集,为每个样本获取基本的真实标签。这些输⼊和相应的标签⼀起构成了训练数据集。

2、选择有监督的学习算法,它将训练数据集作为输⼊,并输出⼀个“完成学习模型”。

3、将之前没⻅过的样本特征(测试数据集)放到这个“完成学习模型”中,使⽤模型的输出作为相应标签的预测。

  • 常见监督学习
    • 回归问题:
      • 标签取任意值,且⽬标是⽣成⼀个预测⾮常接近实际标签值的模型。即需要根据输入预测出一个值的问题很可能就是回归问题。
      • 其损失函数常用最小化平方误差函数。
    • 分类问题:
      • 标签取任意值,且⽬标是生成⼀个能够预测样本属于哪个类别(category,正式称为类(class))分类器模型。即需要根据输入预测出类别的问题就是分类问题。
      • 其损失函数常用交叉熵函数。
    • 标记问题:
      • 学习预测不相互排斥的类别的问题称为多标签分类(multi-label classification)。
    • 搜索问题:
      • 在海量搜索结果中找到最需要的那部分后,让搜索结果以“有序的元素⼦集”形式输出。
    • 推荐系统:
      • 对于任何给定的⽤⼾,推荐系统都可以检索得分最⾼的对象集,然后将其推荐给用户。
    • 序列学习:
      • 用于前后有关联的问题。例如,视频、文本、病人死亡风险评估等。

2.2、无监督学习(unsupervised learning)--无目标(标签)

  • 常见无监督学习
    • 聚类问题:无标签的情况下给数据分类。
    • 主成分分析问题:用少量的参数来准确地捕捉数据的线性相关属性。
    • 因果关系与概率图模型问题:描述观察到的许多数据的根本原因。
    • 生成对抗性网络:⼀种合成数据的⽅法

2.3、与环境互动

从环境中为监督学习收集数据的过程为:

2.4、强化学习

  • 强化学习的过程:
    • 智能体(agent)在一系列的时间步骤上与环境交互,在每个特定时间点,智能体从环境接收一些观察,并且必须选择一个动作,然后通过某种机制(有时称为执行器)将其传输回环境,最后智能体从环境中获得奖励。此后新⼀轮循环开始,智能体接收后续观察,并选择后续操作,依此类推。

    • 在任何时间点上,强化学习agent可能知道⼀个好的策略,但可能有许多更好的策略从未尝试过的。强化学习agent必须不断地做出选择:是应该利⽤当前最好的策略,还是探索新的策略空间。
  • 强化学习的目标:
    • 产⽣⼀个好的策略(policy)。策略会控制强化学习agent从环境观察映射到⾏动的功能。
  • 强化学习的作用:
    • 可以解决许多监督学习⽆法解决的问题,且可以将任何监督学习问题转化为强化学习问题。
  • 常见强化学习问题
    • 马尔可夫决策过程:环境可被完全被观察。
    • 上下文赌博机:状态不依赖于之前操作。
    • 多臂赌博机:没有状态,只有一组最初未知回报的可用动作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/120362.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

选择跨网文件交换系统的核心因素有哪些?

在数字化进程加速的今天,企业常面临办公网、生产网、研发网等多网络环境并存的情况。传统的U盘拷贝或FTP传输方式,不仅效率低下,更存在严重的安全与管理隐患——例如明文传输导致的数据泄露、缺乏审计日志引发合规风险,以及面对TB…

中兴通讯联合深兰科技发布“AI问诊助手智能体”全场景解决方案

2025年7月26日,2025世界人工智能大会(WAIC2025)在上海开幕。全球领先的ICT解决方案提供商中兴通讯以“算力普惠 AI向实”为主题参展,围绕AI与产业深度融合,突出智算基础设施、行业大模型、全场景AI应用三大领域的创新,强调通过“连…

【AI大模型】披着羊皮的狼--自动化生成越狱提示的系统(ReNeLLM)

南京大学 & 美团联合团队发表了一篇 NAACL 2024 论文《A Wolf in Sheep’s Clothing: Generalized Nested Jailbreak Prompts can Fool Large Language Models Easily》(披着羊皮的狼)。非常有意思的名字,他们提出了一套名叫 ReNeLLM 的自…

50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | VerifyAccountUi(验证码组件)

&#x1f4c5; 我们继续 50 个小项目挑战&#xff01;—— VerifyAccountUi组件 仓库地址&#xff1a;https://github.com/SunACong/50-vue-projects 项目预览地址&#xff1a;https://50-vue-projects.vercel.app/ 使用 Vue 3 的 <script setup> 语法结合 Tailwind CS…

Solana新手上路:完成第一笔SOL转账

大家好&#xff01;如果大家正对Solana生态系统充满好奇&#xff0c;渴望在代码层面与这个高性能区块链进行第一次“亲密接触”&#xff0c;那么来对地方了。今天&#xff0c;我们将一起完成一件激动人心的事情&#xff1a;通过编写一段简单的JavaScript代码&#xff0c;在Sola…

jangow-01-1.0.1靶机教程攻略

第一步搭建环境 靶机下载地址&#xff1a;https://download.vulnhub.com/jangow/jangow-01-1.0.1.ova 下载好了直接用VM打开 右击虚拟机设置&#xff0c;网络连接改成nat模式 第二步信息收集 开启虚拟机&#xff0c;右击编辑查看一下靶机的网段 用cali的nmap扫一下 nmap 1…

Linux和shell

最快入门的方式是使用苹果系统。此外&#xff0c;累计补充学习&#xff1a;一、目录结构/bin&#xff0c;二进制文件 /boot&#xff0c;启动文件 /dev&#xff0c;设备文件 /home&#xff0c;主目录&#xff0c;一般外接包、安装包放在这里 /lib&#xff0c;库文件 /opt&#x…

机器学习之逻辑回归(Logistic Regression)

一、什么是逻辑回归 逻辑回归也称作logistic回归分析&#xff0c;是一种由线性回归衍生出来的分析模型&#xff0c;属于机器学习中的监督学习。其推导过程与计算方式类似于回归的过程&#xff0c;但实际上主要是用来解决二分类问题&#xff08;也可以解决多分类问题&#x…

mac环境配置rust

rustup 是一个命令行工具&#xff0c;用于管理 Rust 编译器和相关工具链 sh 体验AI代码助手 代码解读复制代码curl --proto ‘https’ --tlsv1.2 -sSf https://sh.rustup.rs | sh使得 Rust 的安装在当前 shell 环境中生效 如果你使用的是 bash, zsh 或其他类似的 shell&#xf…

LPC2132GPIO

LPC2132具有多达47个通用I/O口&#xff08;GPIO&#xff0c;General I/O port&#xff09;&#xff0c;分别为P0[31:0]、P1[31:16]&#xff0c;其中&#xff0c;P0.24未用&#xff0c;P0.31仅为输出口。由于口线与其它功能复用&#xff0c;需要进行相关的管脚连接模块&#xff…

【AlphaFold3】网络架构篇(2)|Input Embedding 对输入进行特征嵌入

博主简介&#xff1a;努力学习的22级计算机科学与技术本科生一枚&#x1f338;博主主页&#xff1a; Yaoyao2024往期回顾&#xff1a;【AlphaFold3】网络架构篇&#xff08;1&#xff09;|概览预测算法每日一言&#x1f33c;: 去留无意&#xff0c;闲看庭前花开花落&#xff1b…

【传奇开心果系列】Flet框架左右两边堆叠图片前移补位轮播组件自定义模板

一、效果展示GIF动图二、使用场景介绍 Flet左右两边堆叠图片前移补位轮播组件 是一个基于 Flet 框架的自定义组件&#xff0c;适用于需要展示多张图片并实现动态轮播效果的应用场景。该组件特别适合用于以下场景&#xff1a; 产品展示&#xff1a;在电商网站或应用中&#xff0…

【Kubernetes 指南】基础入门——Kubernetes 201(三)

三、资源限制- Kubernetes 通过 cgroups 提供容器资源管理的功能&#xff0c;可以限制每个容器的 CPU 和内存使用&#xff0c;比 如对于上一讲创建的 deployment&#xff1b;- 可以通过下面的命令限制 nginx 容器最多只用 50% 的 CPU 和 128MB 的内存&#xff1a;- 这等同于在每…

【目标检测】d-fine模型部署

官网介绍显示&#xff0c;d-fine模型效果很好&#xff0c;例如下图中&#xff0c;非常模糊的人也能被识别出来。官网教程有些细节没写&#xff0c;这里补充一下。1.数据格式 数据长这样&#xff08;图中的unrrelated_pic无用&#xff09;。具体的格式可以由大模型生成。我这里有…

用 AI 解析采购订单,从上传到自动生成 Draft 订单全流程实战

网罗开发&#xff08;小红书、快手、视频号同名&#xff09;大家好&#xff0c;我是 展菲&#xff0c;目前在上市企业从事人工智能项目研发管理工作&#xff0c;平时热衷于分享各种编程领域的软硬技能知识以及前沿技术&#xff0c;包括iOS、前端、Harmony OS、Java、Python等方…

远程仓库地址发生变化

代码写着写着&#xff0c;组长突然说git地址迁移了&#xff0c;让我把自己的代码也迁移过去。以前没遇到过&#xff0c;今天试了试&#xff0c;迁移成功了&#xff0c;值得记录一下。一、场景1首先是最简单的场景&#xff0c;新建的仓库是空的&#xff0c;然后本地代码在master…

【硬件-笔试面试题】硬件/电子工程师,笔试面试题-48,(知识点:BUCK电路的损耗,开关损耗,导通损耗,电感损耗、驱动损耗)

目录 1、题目 2、解答 一、开关损耗&#xff08;Switching Losses&#xff09; &#xff1a;与开关频率成正比&#xff0c;但提高频率&#xff0c;可减小所需电感电容的体积&#xff0c;需平衡 二、导通损耗&#xff08;Conduction Losses&#xff09;&#xff1a;与导通时…

机械零件深凹槽检测方法的探究 - 激光频率梳 3D 轮廓检测

一、引言在机械制造领域&#xff0c;机械零件深凹槽的检测质量直接影响设备的性能与可靠性。以航空发动机止动螺母为例&#xff0c;其矩形凹槽深度公差通常在微米级&#xff0c;传统检测方法面临诸多挑战。平台推表检测法因基准不重合导致误差较大&#xff0c;工作型三坐标测量…

九章数学体系:打破“吃苦悖论”,重构学习真谛

在我们的成长历程中&#xff0c;“你不吃儿时读书之苦&#xff0c;就得吃长大工作之苦”这句话耳熟能详&#xff0c;它俨然成为家长与社会教育孩子的励志金句。然而&#xff0c;神奇的九章数学体系却为我们揭示&#xff0c;这背后实则隐藏着一个值得深度探究的悖论。现在&#…

【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 微博内容IP地图可视化分析实现

大家好&#xff0c;我是java1234_小锋老师&#xff0c;最近写了一套【NLP舆情分析】基于python微博舆情分析可视化系统(flaskpandasecharts)视频教程&#xff0c;持续更新中&#xff0c;计划月底更新完&#xff0c;感谢支持。今天讲解微博内容IP地图可视化分析实现 视频在线地…
推荐文章