通过Bellman方程求解马尔科夫决策过程的最佳决策序列,每个状态的值不仅由当前状态决定还要由后面的状态决定。 A.对 B.错 通过Bellman方程求解马尔科夫决策过程的最佳决策序列,每个状态的值不仅由当前状态决定还要由后面的状态决定。 A.对 B.错 正确答案:A