马尔可夫决策规划

打印

拼音Ma,erkefu juece guihua

外文Markovian decision programming

卷名军事作战

对由一系列决策控制的随机动态系统的优化问题进行研究的理论。又称马尔可夫决策过程。此决策规划要求决策者在一系列(离散的或连续的)时刻都要作出决策,且系统的状态转移是随机的,并具有马尔可夫性,即在已知当前(现在)状态的条件下,未来(将来)的演变不依赖于以往(过去)的演变。在每个观察时刻,决策者依据当...

暂无权限,请联系管理员

见本卷书页码:304