随机控制理论随机最优控制
在随机控制系统中,探讨的核心问题是寻找使性能指标泛函达到最小值的控制策略,这被称为随机最优控制。随机性使得性能指标的评价需要通过统计平均(即数学期望)来表达,E{·}符号表示的是期望值。最优控制通常可以分为开环和反馈两种形式:
开环控制:控制策略仅基于设计时过程特性和随机变量的信息,不依赖于实时测量,这类控制在决定u(t)时不考虑后续的测量更新。
反馈控制:则在决定u(t)时考虑实时测量y(τ),其中τ必须小于或等于t,以满足因果性和物理可行性。反馈控制又细分为被动反馈(或反馈式)和主动反馈(或闭环策略):被动反馈仅利用测量来控制状态变量,而不调整随机变量的统计特性;而主动反馈则兼具控制和估计功能,能够自我修正,以实现全局最优解。
A.A.费尔德包姆首次提出了闭环随机最优控制的独特概念,其中包含了双重最优控制功能。闭环最优控制不仅能利用现有信息达到最佳效果,还是随机自适应最优控制,尽管求解往往困难,通常只能得到定性而非定量的解法。
随机最优控制的两个关键特性是谨慎性和试探性。由于不确定性,控制通常采取保守策略,即谨慎控制,以避免过度影响。而为了更好地估计,系统需要激发多种运动模式,这就需要适度的试探性作用。这种试探的大小需要在增加的误差、直接成本和潜在收益之间做出平衡选择,这是设计随机控制策略时不可忽视的原则。
扩展资料
随机控制理论的一个主要组成部分是随机最优控制,这类随机控制问题的求解有赖于动态规划的概念和方法。