控制与强化学习 可控性与动态规划:从LQR到强化学习的统一视角 可控性与动态规划:从LQR到强化学习的统一视角本文基于LQR理论脉络,先回答"系统能否被控制",再回答"如何最优地控制",最终建立动态规划与强化学习的统一视角。全文采用四级编号体系,每节只处理一个认知疑点,所有抽象概念均绑定具象锚点。知识图谱