姜峰论文

  • 在概率阈值准则下的马尔可夫策略的两种算法

    在概率阈值准则下的马尔可夫策略的两种算法

    姜峰,郑兆青[1]2004年在《在概率阈值准则下马尔可夫策略的最优化算法》文中研究表明在一种新的概率阈值准则下讨论马尔可夫决策的最优解的算法问题.采用基于增益的过去累积值的方法,求解马尔可夫最优策略.姜峰[2]2002年在《在概率阈值准则下的马尔可夫策略的两种算法》文中提出马尔可夫决策过程(Mark...