未分类 · 2025年11月21日

通过Bellman方程求解马尔科夫决策过程的最佳决策序列,每个状态的值不仅由当前状态决定还要由后面的状态决定。 A.对 B.错

通过Bellman方程求解马尔科夫决策过程的最佳决策序列,每个状态的值不仅由当前状态决定还要由后面的状态决定。 A.对 B.错

正确答案:A