20 - 协程与异步编程

发布时间：2026/6/26 8:51:04

20 - 协程与异步编程这章讲 Python 的异步编程。说实话对入门来说偏深了但协程在现代 Python 生态里越来越重要FastAPI、httpx、aiohttp 都用至少得知道怎么回事。为什么需要异步假设你要请求 10 个网页。同步方式importrequests urls[fhttps://example.com/page/{i}foriinrange(10)]# 同步一个接一个请求forurlinurls:responserequests.get(url)# 每次都要等网络响应print(response.status_code)每个请求要等 0.5 秒的话10 个就要 5 秒。但实际上 CPU 在等网络的时候是空闲的——它在干等。异步方式可以在等待网络响应的时候去做别的事importasyncioimporthttpx# 异步 HTTP 客户端uv add httpxasyncdeffetch(url):asyncwithhttpx.AsyncClient()asclient:responseawaitclient.get(url)returnresponse.status_codeasyncdefmain():urls[fhttps://example.com/page/{i}foriinrange(10)]tasks[fetch(url)forurlinurls]resultsawaitasyncio.gather(*tasks)print(results)asyncio.run(main())10 个请求同时发出总耗时约 0.5 秒取决于最慢的那个。快了 10 倍。并发 vs 并行这两个概念很多人搞混先搞清楚并发Concurrency多个任务交替执行。一个 CPU 就够了任务之间轮流来。并行Parallelism多个任务同时执行。需要多个 CPU 核心。Python 的 asyncio 做的是并发不是并行。它在一个线程里让多个任务交替运行利用等待 I/O的空隙去做别的事。打个比方并发是一个厨师同时做几道菜这道菜炖着的时候去切那道菜的菜并行是好几个厨师各做一道菜。协程 vs 线程 vs 进程进程线程协程内存各自独立共享内存共享内存切换开销大系统级中极小用户级并发数量几十几百几万甚至几十万GIL 影响无受限不受限但只能在一个核上跑适用场景CPU 密集I/O 密集传统方式I/O 密集现代方式协程的优势轻量。一个线程里可以跑几万个协程内存和切换开销都极小。线程的切换由操作系统决定你不知道什么时候切协程的切换由你的代码控制在await的地方切。后者叫协作式多任务前者叫抢占式多任务。事件循环Event Loop协程的执行靠事件循环驱动。你可以把它理解成一个调度员事件循环 - A 协程在等网络响应好先挂起 A - 让 B 协程跑一会 - B 也在等数据库挂起 B - A 的网络响应回来了恢复 A - ...所有协程都在同一个线程里跑靠事件循环来切换。这就是为什么await那么重要——它是告诉事件循环我现在可以歇一歇你去忙别的的信号。协程基础importasyncio# 用 async def 定义协程函数asyncdefsay_hello():print(Hello)awaitasyncio.sleep(1)# 模拟 I/O 操作print(World)# 调用协程函数不会执行它而是返回一个协程对象corosay_hello()print(coro)# coroutine object say_hello at 0x...# 必须用事件循环来驱动它asyncio.run(coro)关键概念调用async def定义的函数不会立即执行它返回一个协程对象。你需要await它或者交给事件循环运行。这个跟生成器有点像——调用def gen(): yield 1也不会立即执行返回的是生成器对象。不是巧合后面会讲它们的关系。await 到底干了什么await做两件事等待后面的异步操作完成拿到结果交出控制权给事件循环让它去跑别的协程asyncdeffetch_data(url):print(f开始请求{url})responseawaithttpx.AsyncClient().get(url)# 等网络响应同时别人可以跑print(f收到响应{url})returnresponse.status_code如果await后面不是异步操作比如普通的time.sleep()那事件循环就被阻塞了所有协程都得等。这是新手最常犯的错importtimeasyncdefbad_example():time.sleep(5)# 错阻塞了整个事件循环# 应该用 await asyncio.sleep(5)原则异步函数里不要调用阻塞的同步函数。如果你不确定一个函数是不是阻塞的看它有没有async版本。并发执行多个协程方式一gather最常用importasyncioasyncdeftask(name,delay):print(f{name}开始)awaitasyncio.sleep(delay)print(f{name}完成)returnf{name}的结果asyncdefmain():resultsawaitasyncio.gather(task(A,2),task(B,1),task(C,3),)print(results)# [A 的结果, B 的结果, C 的结果]# 总耗时约 3 秒取最长的而不是 2136 秒asyncio.run(main())方式二create_task更灵活asyncdefmain():t1asyncio.create_task(task(A,2))t2asyncio.create_task(task(B,1))# 中间可以做别的事print(做点别的)# 等结果r1awaitt1 r2awaitt2print(r1,r2)create_task立即把协程调度到事件循环不用等await才开始。方式三as_completed谁先完成谁先来asyncdefmain():tasks[task(A,2),task(B,1),task(C,3)]forcoroinasyncio.as_completed(tasks):resultawaitcoroprint(f完成了一个{result})# 输出顺序B → A → C按完成时间适合完成一个处理一个的场景不用等所有任务都结束。超时和取消asyncdefmain():# 超时控制try:resultawaitasyncio.wait_for(task(A,10),timeout3)exceptasyncio.TimeoutError:print(超时了)# 取消任务tasyncio.create_task(task(B,10))awaitasyncio.sleep(1)t.cancel()try:awaittexceptasyncio.CancelledError:print(任务被取消了)超时和取消在实际项目中很重要——网络请求不能无限等用户关闭页面后后台任务应该取消。异步上下文管理器和异步迭代器async with跟普通的with一样但进入和退出可以是异步操作# 异步打开文件uv add aiofilesimportaiofilesasyncdefread_file_async(path):asyncwithaiofiles.open(path,r)asf:contentawaitf.read()returncontent# 异步 HTTP 客户端asyncdeffetch(url):asyncwithhttpx.AsyncClient()asclient:responseawaitclient.get(url)returnresponseasync for异步版的 for 循环每次迭代可以是异步的asyncdefstream_lines(path):asyncwithaiofiles.open(path,r)asf:asyncforlineinf:yieldline.strip()asyncdefmain():asyncforlineinstream_lines(big_file.txt):print(line)async for和async with只能在async def函数里使用。异步队列生产者-消费者模式这是异步编程里最经典的模式importasyncioasyncdefproducer(queue:asyncio.Queue,name:str):生产者往队列里放数据foriinrange(5):itemf{name}-{i}awaitqueue.put(item)print(f[生产者{name}] 放入{item})awaitasyncio.sleep(0.5)asyncdefconsumer(queue:asyncio.Queue,name:str):消费者从队列里取数据whileTrue:itemawaitqueue.get()print(f[消费者{name}] 取出{item})awaitasyncio.sleep(1)# 模拟处理时间queue.task_done()asyncdefmain():queueasyncio.Queue(maxsize10)# 2 个生产者 3 个消费者producers[asyncio.create_task(producer(queue,P1)),asyncio.create_task(producer(queue,P2)),]consumers[asyncio.create_task(consumer(queue,fC{i}))foriinrange(3)]awaitasyncio.gather(*producers)# 等生产者完成awaitqueue.join()# 等队列清空forcinconsumers:c.cancel()# 取消消费者asyncio.run(main())生产者产出数据消费者处理数据队列做缓冲。生产快消费慢的时候队列堆起来生产慢消费快的时候消费者等着。很灵活。异步中的异常处理asyncdefrisky_task():awaitasyncio.sleep(1)raiseValueError(出错了)asyncdefmain():# gather 里某个任务出错默认会直接抛异常try:awaitasyncio.gather(task(A,1),risky_task(),task(C,1),)exceptValueErrorase:print(f捕获到异常{e})# 用 return_exceptionsTrue 让出错的任务返回异常对象而不是抛出resultsawaitasyncio.gather(task(A,1),risky_task(),task(C,1),return_exceptionsTrue)forrinresults:ifisinstance(r,Exception):print(f任务失败{r})else:print(f任务成功{r})return_exceptionsTrue很实用——一个任务挂了不影响其他任务的结果收集。协程和生成器的关系第 17 章学了生成器yield其实协程就是从生成器演化来的# 生成器第 17 章defgen():yield1yield2# 老式协程Python 3.5 之前基于生成器asyncio.coroutinedefold_coro():yieldfromasyncio.sleep(1)# 现代协程Python 3.5用 async/awaitasyncdefnew_coro():awaitasyncio.sleep(1)async/await本质上是给生成器加了专门的语法让异步代码读起来更像同步代码。底层原理还是暂停恢复——跟生成器的yield是一个思路。区别在于生成器yield暂停外部用next()恢复 → 数据生产者协程await暂停事件循环恢复 → 任务调度单元异步生成器async for用的和异步上下文管理器async with用的也是这个思路的延伸。同步代码和异步代码混用有时候你需要在异步代码里调用同步库比如requests或者反过来。异步里调同步run_in_executorimportasyncioimporttimeasyncdefmain():loopasyncio.get_event_loop()# 把阻塞操作扔到线程池里跑不阻塞事件循环resultawaitloop.run_in_executor(None,time.sleep,3)print(完成)asyncio.run(main())run_in_executor本质上是起了一个线程去跑阻塞代码。所以它其实是异步多线程的混合。同步里调异步# 用 asyncio.run() 启动事件循环defsync_main():resultasyncio.run(some_async_function())print(result)注意asyncio.run()只能在没有正在运行的事件循环时调用。如果在 Jupyter Notebook 里已经有事件循环了要用await直接调用或者用nest_asyncio。什么时候用异步场景用什么网络请求爬虫、API 调用✅ 异步数据库查询✅ 异步用 asyncpg、motor 等异步驱动WebSocket✅ 异步文件读写⚠️ 可以用 aiofiles但提升不如网络明显CPU 密集计算❌ 用多进程multiprocessing简单脚本/工具❌ 同步就够了别给自己找麻烦异步编程的代码复杂度比同步高不少——调试更难、错误处理更复杂、不是所有库都有异步版本。小项目或脚本用同步就够了等到确实有性能需求的时候再上异步。一个实际的例子异步爬虫同时抓取多个页面importasyncioimporthttpximporttimeasyncdeffetch(session:httpx.AsyncClient,url:str)-dict:抓取单个页面try:responseawaitsession.get(url,timeout10)return{url:url,status:response.status_code,size:len(response.text),}exceptExceptionase:return{url:url,error:str(e)}asyncdefmain():urls[https://httpbin.org/delay/1,https://httpbin.org/delay/2,https://httpbin.org/delay/0,https://httpbin.org/status/404,https://httpbin.org/status/500,]starttime.time()asyncwithhttpx.AsyncClient()assession:tasks[fetch(session,url)forurlinurls]resultsawaitasyncio.gather(*tasks)elapsedtime.time()-startforrinresults:iferrorinr:print(f ❌{r[url]}—{r[error]})else:print(f ✅{r[url]}—{r[status]}({r[size]}bytes))print(f\n总耗时{elapsed:.2f}秒)# 同步方式大约需要 120... ≈ 3 秒# 异步方式约 2 秒取决于最慢的那个asyncio.run(main())本章小结并发是交替执行并行是同时执行。asyncio 做的是并发协程比线程更轻量一个线程里能跑几万个协程async def定义协程函数await暂停并交出控制权事件循环Event Loop是调度员驱动所有协程运行gather()并发执行多个协程create_task()更灵活as_completed()按完成顺序处理async with/async for是异步版的上下文管理器和迭代器不要在异步函数里调用阻塞的同步代码用run_in_executor扔到线程池协程从生成器演化而来底层都是暂停恢复面试题Q1协程、线程、进程有什么区别Python 的 asyncio 属于哪种点击查看答案进程线程协程内存空间独立共享共享切换开销大系统级中极小用户级并发数量几十几百几万GIL不受影响受 GIL 限制在单线程内不涉及 GILasyncio 的协程是用户态的协作式多任务——所有协程跑在同一个线程里靠事件循环调度切换。切换由代码中的await触发协作式不像线程由操作系统抢占式调度。适合 I/O 密集型网络、数据库不适合 CPU 密集型应该用 multiprocessing。Q2await到底做了什么为什么不能在异步函数里调用time.sleep()点击查看答案await做两件事等待后面的 awaitable 对象完成获取结果挂起当前协程把控制权交还给事件循环让其他协程有机会运行time.sleep()是阻塞调用——它会卡住整个线程包括事件循环导致所有协程都被阻塞。# 错误阻塞事件循环asyncdefbad():time.sleep(5)# 所有协程都得等 5 秒# 正确让出控制权asyncdefgood():awaitasyncio.sleep(5)# 事件循环可以去跑别的协程同理requests.get()、open().read()大文件等同步 I/O 都会阻塞事件循环应该用异步替代httpx、aiofiles或run_in_executor。Q3asyncio.gather()和asyncio.create_task()有什么区别点击查看答案gather()一次性提交多个协程等全部完成后返回结果列表。更简洁适合一起跑、一起收的场景。create_task()立即将协程调度到事件循环返回 Task 对象。可以分别 await、取消、查状态。更灵活。# gather一起跑一起收resultsawaitasyncio.gather(coro1(),coro2(),coro3())# create_task先启动后收集t1asyncio.create_task(coro1())t2asyncio.create_task(coro2())# 中间可以做别的事r1awaitt1 r2awaitt2gather()内部其实就是对每个协程调用ensure_future()类似 create_task所以两者在并发行为上没有本质区别区别在于 API 的灵活度。Q4协程和生成器有什么关系点击查看答案协程是从生成器演化来的。两者核心机制相同暂停恢复。生成器用yield暂停外部用next()恢复 →数据生产者协程用await暂停事件循环恢复 →任务调度单元Python 3.5 之前协程就是加了asyncio.coroutine装饰器的生成器用yield from实现异步。3.5 引入了async/await语法语义更清晰但底层原理一样。异步生成器async for和异步上下文管理器async with也是这个思路的延伸。

OBS-RTSPServer插件：5分钟实现专业级RTSP直播部署方案

OBS-RTSPServer插件：5分钟实现专业级RTSP直播部署方案【免费下载链接】obs-rtspserver RTSP server plugin for obs-studio 项目地址: https://gitcode.com/gh_mirrors/ob/obs-rtspserver 你是否曾面临这样的困境：需要将OBS Studio的专业直播内容…

2026/6/25 16:31:03 阅读更多

【工具教程】手把手教你画第一张架构图

【工具教程】手把手教你画第一张架构图一、前言很多人第一次画架构图时，都是这样的：打开画图软件盯着空白画布发呆随便画几个方框连几根线感觉不太对，但又说不上来最终效果像小学生涂鸦别急，今天我来手把手教你画第一张架构图。二、画图前的准备 2.1 明确画图…

2026/6/21 10:51:15 阅读更多

60.通杀安卓/iOS！高通/MTK/苹果全芯片平台标准化刷机实操教程

摘要本文面向具备基础计算机操作能力的维修工程师与进阶用户，系统阐述主流品牌手机刷机与维修的技术体系。内容涵盖高通、联发科、苹果A系列芯片平台的刷机原理，提供基于Python与ADB的自动化刷机脚本，并针对常见刷机失败场景给出可复现的解决方案。全文严格遵循工程化思维…

2026/6/23 20:48:38 阅读更多

高维空间球体覆盖与堆积：从Vitali引理到算法实践

1. 从覆盖到堆积：一个高维几何的经典难题在三维世界里，我们很容易想象如何用一堆大小相同的乒乓球去填满一个盒子。你会先铺满底层，然后一层层往上堆，虽然球与球之间总会有空隙，但这是一个直观且高效的堆积方式。然而&…

2026/6/26 8:50:25 阅读更多

Ryujinx：在PC上畅玩Nintendo Switch游戏的终极免费模拟器完整指南

Ryujinx：在PC上畅玩Nintendo Switch游戏的终极免费模拟器完整指南【免费下载链接】Ryujinx 用 C# 编写的实验性 Nintendo Switch 模拟器项目地址: https://gitcode.com/GitHub_Trending/ry/Ryujinx 想象一下，你渴望体验最新的Nintendo Switch游…

2026/6/26 8:50:25 阅读更多

RAG系统抗令牌擦除：基于语义感知冗余的检索增强生成优化

1. 项目概述：当RAG遇上“健忘症”最近在折腾一个检索增强生成（RAG）项目时，遇到了一个挺有意思但又让人头疼的问题：模型在生成回答时，偶尔会“忘记”检索到的关键信息。比如，明明从知识库里精准地…

2026/6/26 8:50:25 阅读更多

工业风扇耐用技术分析

工业风扇在现代工业生产、仓储物流、大型场馆等场景中扮演着至关重要的角色。它不仅能够实现空气的有效流通，降低环境温度，还能改善空气质量，提高工作场所的舒适度和生产效率。随着工业的不断发展，市场上工业风扇的品牌和种类日益…

2026/6/26 8:49:44 阅读更多

资源利用率飙升73%？揭秘VMware中大数据组件CPU/内存/存储瓶颈的12个隐形陷阱

更多请点击： https://intelliparadigm.com 第一章：资源利用率飙升73%的典型现象与根因定位全景图当生产环境突发 CPU 或内存利用率在 5 分钟内跃升 73%，往往不是孤立指标异常，而是多层系统耦合失效的外显信号。典型表现包括&…

2026/6/26 8:49:44 阅读更多

自定义 OpenSpec 步骤改进 AI 生成结果

背景 OpenSpec 是一个管理技术提案的系统，核心想法很简单：输入变更描述，自动生成各种文档工件。proposal、design、specs、tasks，这些都能自动生成。听起来挺美好的，不是吗？ 只是在实际使用中&#xff0c…

2026/6/26 8:49:44 阅读更多

Qwen2.5-Turbo百万上下文实战指南：百炼平台长文本处理全解析

1. 项目概述：这不是一次普通模型更新，而是一次上下文能力的质变跃迁“Qwen2.5-Turbo上线阿里云百炼平台，模型上下文长度扩展至百万tokens”——这句话里藏着三个关键信号：Turbo不是简单提速，而是面向生产环境的工程化重…

2026/6/26 0:00:43 阅读更多

Kotlin的@JvmStatic与@JvmField：与Java互操作的注解

Kotlin作为一门现代编程语言，与Java的互操作性一直是其核心优势之一。为了让Kotlin代码能够无缝对接Java，Kotlin提供了多种注解来优化互操作体验，其中JvmStatic和JvmField是两个关键注解。它们分别用于解决静态成员和字段在Java中的访问问题&…

2026/6/26 0:02:05 阅读更多

AI 驱动下 GEO 与 SEO 融合实战指南

摘要：本文深入探讨了从传统SEO到生成式搜索（GEO）的范式转移，为技术内容创作者揭示了新搜索生态下的挑战与机遇。面对大模型直接生成答案的趋势，单纯的关键词排名已不足以保证流量。文章系统性地提出了三大核心策略&…

2026/6/26 0:02:25 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/26 1:06:03 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/26 1:06:07 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/26 1:06:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/25 12:27:19 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/25 12:27:19 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/25 12:27:19 阅读更多

相关文章

OBS-RTSPServer插件：5分钟实现专业级RTSP直播部署方案

【工具教程】手把手教你画第一张架构图

60.通杀安卓/iOS！高通/MTK/苹果全芯片平台标准化刷机实操教程

高维空间球体覆盖与堆积：从Vitali引理到算法实践

Ryujinx：在PC上畅玩Nintendo Switch游戏的终极免费模拟器完整指南

RAG系统抗令牌擦除：基于语义感知冗余的检索增强生成优化

工业风扇耐用技术分析

资源利用率飙升73%？揭秘VMware中大数据组件CPU/内存/存储瓶颈的12个隐形陷阱

自定义 OpenSpec 步骤改进 AI 生成结果

Qwen2.5-Turbo百万上下文实战指南：百炼平台长文本处理全解析

Kotlin的@JvmStatic与@JvmField：与Java互操作的注解

AI 驱动下 GEO 与 SEO 融合实战指南

Google AI Studio 300美元额度的真相与实战指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因