17 - 推导式与生成器

发布时间：2026/5/28 22:31:40

17 - 推导式与生成器推导式是 Python 最优雅的特性之一一行代码顶一个循环。生成器则是处理大数据时的利器——用多少算多少不浪费内存。列表推导式前面已经见过好几次了这里系统讲一下。基本语法[表达式for变量in可迭代对象]# 不用推导式squares[]forxinrange(1,6):squares.append(x**2)# 用推导式squares[x**2forxinrange(1,6)]print(squares)# [1, 4, 9, 16, 25]加条件过滤[表达式for变量in可迭代对象if条件]# 偶数的平方evens[x**2forxinrange(1,11)ifx%20]print(evens)# [4, 16, 36, 64, 100]# 过滤空字符串words[hello,,world,,python]non_empty[wforwinwordsifw]print(non_empty)# [hello, world, python]加 if-else条件表达式# if-else 放在 for 前面[表达式1if条件else表达式2for变量in可迭代对象]# 大于 0 的保留其他的变成 0numbers[-3,-1,0,2,5]result[nifn0else0forninnumbers]print(result)# [0, 0, 0, 2, 5]注意if放在for后面是过滤元素可能减少放在for前面是条件表达式元素数量不变只是值变了。嵌套循环# 展平二维列表matrix[[1,2,3],[4,5,6],[7,8,9]]flat[xforrowinmatrixforxinrow]print(flat)# [1, 2, 3, 4, 5, 6, 7, 8, 9]# 等价于flat[]forrowinmatrix:forxinrow:flat.append(x)嵌套推导式的顺序是外层在前内层在后跟嵌套循环的书写顺序一致。不过说实话超过两层嵌套的推导式就很难读了。别为了炫技写一行几百字符的代码该拆就拆。实际用法# 读取文件的非空行lines[line.strip()forlineinopen(data.txt)ifline.strip()]# 字符串列表转整数numbers[int(s)forsin[1,2,3]]# 提取字典的某些值scores{小明:85,小红:92,小刚:78}high_scores{name:scoreforname,scoreinscores.items()ifscore80}# 生成坐标对coords[(x,y)forxinrange(3)foryinrange(3)]# [(0,0), (0,1), (0,2), (1,0), (1,1), (1,2), (2,0), (2,1), (2,2)]字典推导式跟列表推导式类似只是用花括号和键值对# 创建平方数字典squares{x:x**2forxinrange(1,6)}print(squares)# {1: 1, 2: 4, 3: 9, 4: 16, 5: 25}# 反转字典original{a:1,b:2,c:3}reversed_dict{v:kfork,vinoriginal.items()}print(reversed_dict)# {1: a, 2: b, 3: c}# 过滤scores{小明:85,小红:92,小刚:78}passed{name:scoreforname,scoreinscores.items()ifscore80}print(passed)# {小明: 85, 小红: 92}# 统计字符出现次数texthello worldchar_count{c:text.count(c)forcinset(text)}集合推导式跟列表推导式一样但用花括号结果自动去重# 去重words[hello,world,hello,python]unique_lengths{len(w)forwinwords}print(unique_lengths)# {5, 6}# 取所有不同的首字母first_letters{w[0]forwinwords}print(first_letters)# {h, w, p}生成器表达式生成器表达式跟列表推导式几乎一样区别是用圆括号()而不是方括号[]# 列表推导式 — 立即生成整个列表占内存squares_list[x**2forxinrange(1000000)]# 生成器表达式 — 惰性计算用多少算多少squares_gen(x**2forxinrange(1000000))生成器不会一次性把所有值算出来而是你问它要的时候才算下一个gen(x**2forxinrange(5))print(next(gen))# 0print(next(gen))# 1print(next(gen))# 4print(next(gen))# 9print(next(gen))# 16# print(next(gen)) # StopIteration! 没有更多了通常用 for 循环来消费生成器gen(x**2forxinrange(5))forvalingen:print(val)什么时候用生成器处理大量数据时。比如读一个大文件# 不好——一次把所有行读进内存lines[line.strip()forlineinopen(big_file.txt)]# 好——逐行处理内存只存一行lines(line.strip()forlineinopen(big_file.txt))forlineinlines:process(line)# sum/max/min 等函数可以直接接收生成器totalsum(x**2forxinrange(1000000))# 不需要方括号注意生成器只能用一次。遍历完了就没了gen(xforxinrange(3))print(list(gen))# [0, 1, 2]print(list(gen))# []已经用完了yield 关键字如果你想写一个更复杂的生成器可以用函数加yielddefcountdown(n):倒计时生成器whilen0:yieldn n-1fornumincountdown(5):print(num)# 5 4 3 2 1yield跟return类似都是返回一个值。但yield会暂停函数下次调用时从暂停的地方继续。return是直接结束函数。执行过程defmy_gen():print(开始)yield1print(第二次)yield2print(第三次)yield3print(结束)genmy_gen()print(next(gen))# 输出开始然后 1print(next(gen))# 输出第二次然后 2print(next(gen))# 输出第三次然后 3print(next(gen))# 输出结束然后 StopIteration实际例子deffibonacci():无限斐波那契数列a,b0,1whileTrue:yielda a,bb,ab# 取前 10 个fibfibonacci()for_inrange(10):print(next(fib),end )# 0 1 1 2 3 5 8 13 21 34defread_large_file(filepath):逐行读取大文件withopen(filepath,encodingutf-8)asf:forlineinf:yieldline.strip()forlineinread_large_file(big_data.csv):process(line)defbatch_processor(items,batch_size):分批处理batch[]foriteminitems:batch.append(item)iflen(batch)batch_size:yieldbatch batch[]ifbatch:yieldbatch# 每 3 个一批forbatchinbatch_processor(range(10),3):print(batch)# [0, 1, 2]# [3, 4, 5]# [6, 7, 8]# [9]生成器的 send 方法这个比较高级了解就行。send()可以往生成器里面传值defaccumulator():total0whileTrue:valueyieldtotal totalvalue accaccumulator()next(acc)# 启动生成器必须先调一次 nextprint(acc.send(10))# 10print(acc.send(20))# 30print(acc.send(5))# 35yield不仅返回值还能接收值。这种双向通信的生成器叫协程coroutine是 Python 异步编程的基础之一。不过日常开发中用得不多。迭代器协议生成器之所以能用 for 循环遍历是因为它实现了迭代器协议——有__iter__和__next__方法。你也可以自己实现classCountDown:def__init__(self,start):self.currentstartdef__iter__(self):returnselfdef__next__(self):ifself.current0:raiseStopIteration self.current-1returnself.current1fornuminCountDown(5):print(num)# 5 4 3 2 1大多数时候用yield写生成器就够了不需要自己实现迭代器协议。本章小结列表推导式[表达式 for x in 序列 if 条件]是写循环的优雅方式字典推导式{k: v for ...}和集合推导式{x for ...}语法类似生成器表达式(表达式 for x in 序列)惰性计算省内存yield关键字让函数变成生成器可以逐个产出值生成器只能遍历一次处理大数据、无限序列时优先考虑生成器面试题Q1列表推导式和生成器表达式有什么区别点击查看答案列表推导式[...]生成器表达式(...)内存立即生成全部元素惰性计算按需生成速度创建慢访问快创建快每次访问需计算可重复遍历可以只能遍历一次支持索引可以lst[i]不可以选择数据量小用列表推导式方便索引和重复访问数据量大用生成器表达式省内存。Q2yield和return有什么区别点击查看答案return结束函数执行返回一个值yield暂停函数执行返回一个值。下次next()时从暂停处继续用yield的函数叫生成器函数调用它不会执行函数体而是返回一个生成器对象。deff():yield1yield2genf()# 不执行函数体next(gen)# 执行到第一个 yield返回 1next(gen)# 从第一个 yield 后继续返回 2yield适合产出一系列值return适合返回单个结果。Q3为什么生成器只能遍历一次如何多次遍历点击查看答案生成器是惰性计算的迭代器每次next()推进内部状态到达StopIteration后就耗尽了无法重置。多次遍历的方案重新创建生成器每次需要时调用生成器函数转为列表data list(gen)但会消耗内存用 itertools.teegen1, gen2 itertools.tee(gen, 2)创建多个独立副本Q4如何用生成器处理大文件为什么比列表好点击查看答案defread_lines(filepath):withopen(filepath)asf:forlineinf:yieldline.strip()forlineinread_lines(big_file.txt):process(line)比列表好的原因内存列表一次加载所有行到内存生成器每次只保留一行启动速度列表需要读完整个文件才能开始处理生成器读到第一行就可以开始可以处理无限流生成器不需要全部读完对于 GB 级别的文件列表可能导致内存不足OOM生成器没有这个问题。

搞定Maxwell仿真三大烦人警告：电感不显示、Validation Check黄标、Surface Mesh报错（附解决方案）

搞定Maxwell仿真三大烦人警告：电感不显示、Validation Check黄标、Surface Mesh报错在电磁场仿真领域，Ansys Maxwell作为行业标杆工具，其强大的计算能力背后也隐藏着不少让工程师头疼的"小毛病"。这些警告和异常虽不致命&#xff0…

2026/5/28 22:30:58 阅读更多

别再只用sMRI了！ADNI fMRI数据预处理实战指南（基于Python/Nilearn）

从原始数据到特征矩阵：ADNI fMRI数据预处理全流程解析在神经影像学研究领域，ADNI数据库已经成为阿尔茨海默病研究的黄金标准。但许多研究者下载数据后往往陷入困境——面对一堆.dcm或.nii文件，不知如何转化为可分析的格式。本文将彻底解决这…

2026/5/28 22:30:38 阅读更多

Harness Engineering：Agent长期记忆存储优化

Harness Engineering：Agent长期记忆存储优化作者：15年资深软件架构师/AI Agent领域技术博主本文适合人群：中高级大模型应用开发者、AI Agent架构师、云原生工程实践者关键词：Harness Engineering、Agent长期记忆、RAG优化、向量存储、多模态记忆、大模型落地工程一、核…

2026/5/28 22:30:38 阅读更多

用Arduino与WS2812B自制辉光管风格LED时钟：从电路到编程全解析

1. 项目概述与核心思路我一直对复古电子设备情有独钟，尤其是那种带着橘红色暖光、数字由一层层金属丝网构成的辉光管时钟。不过，真正的辉光管不仅价格不菲，驱动电路也相对复杂，高压部分更是让很多新手望而却步。有没有一种方法&am…

2026/5/28 23:23:00 阅读更多

OPD一人部门是未来趋势吗？

在关于大学生就业和职业发展的讨论中，有一个概念正在被越来越多的人提到：OPD，全称One Person Department，翻译过来是"一人部门"。这个概念出现的时间不长，但它的核心逻辑正在被越来越多的职场人和大学生接受…

2026/5/28 23:23:00 阅读更多

【独家首发】Sora 2地产视频生成黑盒报告（基于372套真实楼盘测试数据）：哪些户型能100%保真还原？哪些必须人工干预？

更多请点击： https://intelliparadigm.com 第一章：Sora 2地产视频生成黑盒测试全景概览 Sora 2作为OpenAI推出的下一代视频生成模型，在地产垂直领域展现出显著的语义理解与空间建模能力。本章聚焦于其在真实地产场景下的黑盒行为观测——即不…

2026/5/28 23:22:39 阅读更多

基于Arduino与加速度计的手势控制机器人设计与实现

1. 项目概述：从传感器到执行器的自然交互在机器人控制领域，摆脱传统的摇杆、按键或遥控器，转而使用更符合人类直觉的手势进行交互，一直是一个极具吸引力的方向。这不仅仅是让操作看起来更“酷”，其核心价值在于降低了人…

2026/5/28 23:21:58 阅读更多

实在Agent权限与审计实测：如何搞定2026最严合规大考？

摘要： 步入2026年，AI Agent（智能体）已从简单的“对话助手”进化为深度嵌入业务流的“数字员工”。然而，随着《智能体规范应用与创新发展实施意见》的正式落地及医药GSP、金融监管等行业合规要求的全面升级，…

2026/5/28 23:20:56 阅读更多

G1机器人新动作开发核心技术解析

针对宇树G1机器人“辅助运动”与“生成新动作”的二次开发，核心在于利用其提供的SDK接口与仿真环境，通过轨迹规划、运动学求解、强化学习或模仿学习等方式，创造并验证新的动作序列。开发流程通常遵循“仿真验证 -> 策略迁移 -> 实机部署”的路径。一、新动作生成技…

2026/5/28 23:20:15 阅读更多

大模型核心加速器：KV Cache 如何将 O(n²) 计算复杂度降至 O(n)？

KV Cache 是大模型自回归生成任务的关键优化技术，通过“空间换时间”策略缓存历史 Key 和 Value 向量，将推理复杂度从 O(n) 降至 O(n)。文章阐述了语义缓存与前缀精确匹配两种核心范式，深入分析了 KV Cache 的技术底层原理、工程化应用及规模…

2026/5/28 0:00:48 阅读更多

物流系统如何打通信息孤岛？哲盟软件系统：一键打通内外部数据壁垒

在数字化转型加速的今天，物流企业面临的最大痛点之一就是信息孤岛——ERP、电商平台、智能硬件、OMS/TMS/WMS等系统各自为政，数据无法自由流转，导致人工操作繁琐、效率低下、出错率高。特别是在跨境物流领域，亚马逊、Shopee、TikT…

2026/5/28 0:02:48 阅读更多

Windows Defender终极恢复指南：5种强力方法解决禁用问题

Windows Defender终极恢复指南：5种强力方法解决禁用问题【免费下载链接】no-defender A slightly more fun way to disable windows defender firewall. (through the WSC api) 项目地址: https://gitcode.com/GitHub_Trending/no/no-defender 当你的Windo…

2026/5/28 0:04:54 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/28 4:33:02 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/28 3:32:24 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/28 3:32:25 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/28 20:29:33 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/28 17:40:02 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/28 13:05:45 阅读更多

相关文章