异步编程与并发调用
本节定位
做 LLM 应用时,很多人第一次的性能瓶颈不是模型不够强,而是:
系统大部分时间都在等。
等接口、等检索、等工具、等数据库。
异步编程就是在解决这种“CPU 没在忙,但任务还卡着”的问题。
学习目标
- 理解为什么 LLM 应用天然适合异步并发
- 分清同步调用和异步调用的区别
- 学会
async/await/gather的基本用法 - 理解并发限制和超时控制为什么重要
- 看懂一个更贴近真实场景的异步调用示例
先建立一张地图
异步编程更适合按“哪里在等、能不能并发、哪里要限流”来理解:
所以这节真正想解决的是:
- 为什么 LLM 工程的性能问题常常不是算力,而是等待
- 为什么异步不是魔法提速,而是更聪明地利用等待时间