排序方式: 共有2条查询结果,搜索用时 0 毫秒
1
1.
张道智 《清华大学学报(自然科学版)》1989,(3)
研究无界报酬折扣半马氏决策规划问题.证明了: 策略π·=(π1·,π2·,…πn·,π·n+1,…)是最优策略,则π1·(∞)及(π1·,π2·,…,πn·)(∞)对同一折扣因子函数也是最优的,对任给的整数n≥1,在一定的条件下,πn·(∞)也是最优的;证明了若最优策略存在,必存在最优平稳策略;证明了ε最优平稳策略的存在性。 相似文献
2.
1