Pong是什么

发布时间：2026/6/7 19:40:07

Pong既是电子游戏历史上的开山鼻祖之一也是现代强化学习Reinforcement Learning, RL和计算机视觉CV领域中最经典的基准测试环境Benchmark。无论是想用 C 练手面向对象编程、在 FPGA 上连 VGA 显示器手撕硬件还是刚开始用 PyTorch 训练 Policy Gradient策略梯度智能体Pong 都是绝佳的切入点。以下从游戏核心逻辑和AI 强化学习环境两个维度为你拆解 Pong。1. 极简极智Pong 的核心游戏逻辑从零实现一个 Pong 游戏比如用 C 结合 SDL/SFML 库或者用 Python 的 Pygame其底层架构本质上是一个确定性的2D 刚体碰撞物理引擎。它的核心状态机和运动公式只有以下三部分① 状态表示State整个游戏在二维平面坐标系下运行只需要维护极少量的变量球Ball位置(x,y)(x, y)(x,y)速度向量(vx,vy)(v_x, v_y)(vx,vy)。球拍Paddles左拍ylefty_{left}yleft右拍yrighty_{right}yright以及固定的长宽和xxx轴位置。② 碰撞与反弹公式Collision Reflection球在移动过程中每帧更新x←xvxx \leftarrow x v_xx←xvx,y←yvyy \leftarrow y v_yy←yvy。上下墙壁碰撞当球触及屏幕上边界或下边界时速度在yyy轴反向vy←−vyv_y \leftarrow -v_yvy←−vy球拍碰撞与角度修正当球的xxx坐标与球拍重合且yyy坐标在球拍范围内时vxv_xvx反向。为了让游戏更有可玩性通常会根据球击中球拍的位置来动态改变vyv_yvy即击中球拍边缘时反弹角度更刁钻vy←vyoffset×paddle_speedv_y \leftarrow v_y \text{offset} \times \text{paddle\_speed}vy←vyoffset×paddle_speed③ 胜负判定当球的xxx坐标越过左边界或右边界则对方得分球回到中心重新开球。2. 深度学习中的 Pong从像素到决策在 OpenAI Gym现为 Farama Foundation Gymnasium的 Atari 游戏环境中Pong-v4是用来检验强化学习算法如 DQN, PPO是否入门的标准试金石。AI 是如何玩 Pong 的与人类玩家直接看屏幕类似AI 模型的输入通常是原始的屏幕像素画面输入预处理State Representation原始的 Atari 屏幕是210×160210 \times 160210×160的 RGB 图像。为了减少计算量通常会将其裁剪为84×8484 \times 8484×84并转换为灰度图。关键技巧帧堆叠Frame Stacking。单张静态图片是无法看出球的运动方向和速度的。因此通常会将连续的 4 帧画面压在一起作为网络的输入这样 CNN卷积神经网络就能捕捉到速度和加速度信息。动作空间Action SpacePong 的动作空间极其精简通常只有 3 个有效动作NOOP不动、UP向上移动球拍、DOWN向下移动球拍。奖励机制Reward Signal赢下一球获得1。输掉一球获得-1。其余时间球在空中飞时奖励为0。一场比赛先到 21 分的一方获胜。为什么说它是经典的 BaselinePong 的状态空间比围棋或《星际争霸》简单得多且奖励相对密集相比于那些要走很久迷宫才能拿到奖励的游戏。一个设计良好的DQN深度Q网络或Policy Gradient策略梯度算法通常在消费级显卡上训练几个小时就能实现对内置 AIRule-based AI的 21:0 完美血洗。它是验证“端到端”输入像素直接输出控制指令控制算法是否写错 Bug 的最佳标尺。

专业级免费相机应用：OpenCamera 完全指南 - 解锁Android手机摄影潜能

专业级免费相机应用：OpenCamera 完全指南 - 解锁Android手机摄影潜能【免费下载链接】OpenCamera Open camera project - multi-functional camera application for android. 项目地址: https://gitcode.com/gh_mirrors/op/OpenCamera OpenCamera是一款功能…

2026/6/7 19:40:07 阅读更多

如何高效使用开源歌词提取工具：3步掌握网易云与QQ音乐歌词获取

如何高效使用开源歌词提取工具：3步掌握网易云与QQ音乐歌词获取【免费下载链接】163MusicLyrics 云音乐歌词获取处理工具【网易云、QQ音乐】项目地址: https://gitcode.com/GitHub_Trending/16/163MusicLyrics 还在为找不到准确的音乐歌词而烦恼吗&#xff…

2026/6/7 19:38:25 阅读更多

一个人写了一套店群自动化软件：我把月人力成本从5万压到了7千

一、六个运营，月薪五万，年底一算账，利润全给员工了老方在临沂做快手小店店群，手里有将近300个店铺，主卖日用百货和零食。去年十月，我去他工作室待了一个晚上，看到的场景让我至今难忘。凌晨一…

2026/6/7 19:37:24 阅读更多

低压CPU配高端独显：性能瓶颈与系统平衡深度解析

1. 项目概述：当“低压”心脏遇上“高端”肌肉在挑选笔记本，尤其是那些标榜“高性能”的轻薄本时，一个经典的配置组合常常让人既心动又困惑：一颗专为长续航和低发热设计的“低压”处理器，搭配一块听起来很唬人的“高端”…

2026/6/7 20:47:42 阅读更多

workbuddy ，node.js 每次会在项目目录上安装 node_modules,能不能一次安装多次使用，为什么 npm 不把包装在全局

workbuddy ，node.js 每次会在项目目录上安装 \node_modules ，而不是把他放到node.js的安装目录或者系统的path 中导致 ，类似的功能都要载入安装程序包很慢你的问题核心是：npm 默认把包安装在项目本地 node_modules&#…

2026/6/7 20:47:21 阅读更多

CSDN AI数字营销企业采购必读：团购门槛、账号绑定规则、续费锁价机制（内部渠道限时开放中）

更多请点击： https://intelliparadigm.com 第一章：企业批量开多账号使用 CSDN AI 数字营销有没有团购优惠？ CSDN AI 数字营销平台面向企业用户提供了多账号协同运营能力，支持按组织架构统一管理多个开发者/运营者账号。目前平台…

2026/6/7 20:46:41 阅读更多

抖音批量下载工具完全指南：5分钟掌握无水印视频下载技巧

抖音批量下载工具完全指南：5分钟掌握无水印视频下载技巧【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback sup…

2026/6/7 20:46:41 阅读更多

晶振采购实战指南：从参数到供应链，保障电子项目稳定心跳

1. 项目概述：为什么晶振品质是电子项目的“心跳”？在任何一个电子项目中，无论是你手头那块小小的智能手表，还是产线上复杂的工业控制器，晶振都扮演着那个默默无闻却又至关重要的角色——系统的心跳。它提供的精准时钟信…

2026/6/7 20:46:20 阅读更多

Visdom 0.2.x 可直接运行的完整部署包，含前后端全部文件与预编译缓存

本文还有配套的精品资源，点击获取简介：开箱即用的Visdom可视化服务包，内置server.py服务入口、VERSION版本标识、login.html登录页和index.html主界面，静态资源目录static已完整包含js、css、fonts等前端依赖，还提…

2026/6/7 20:45:39 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/7 0:02:57 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/7 0:02:57 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/7 0:03:38 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

2026/6/7 0:02:57 阅读更多

索引堆及其优化

2026/6/7 0:02:57 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

2026/6/7 0:03:38 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/7 9:41:13 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/7 9:41:15 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/7 9:41:13 阅读更多

相关文章

专业级免费相机应用：OpenCamera 完全指南 - 解锁Android手机摄影潜能

如何高效使用开源歌词提取工具：3步掌握网易云与QQ音乐歌词获取

一个人写了一套店群自动化软件：我把月人力成本从5万压到了7千

低压CPU配高端独显：性能瓶颈与系统平衡深度解析

workbuddy ，node.js 每次会在 项目目录上安装 node_modules,能不能一次安装多次使用，为什么 npm 不把包装在全局

CSDN AI数字营销企业采购必读：团购门槛、账号绑定规则、续费锁价机制（内部渠道限时开放中）

抖音批量下载工具完全指南：5分钟掌握无水印视频下载技巧

晶振采购实战指南：从参数到供应链，保障电子项目稳定心跳

Visdom 0.2.x 可直接运行的完整部署包，含前后端全部文件与预编译缓存

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

workbuddy ，node.js 每次会在项目目录上安装 node_modules,能不能一次安装多次使用，为什么 npm 不把包装在全局