模型构成xk~第k次渡河前此岸的商人数 yk~第k次渡河前此岸的随从数 sk=(xk , yk)~的状态 xk, yk=0,1,2,3; k=1,2, S ~ 允许状态集合
S={(x , y) x=0, y=0,1,2,3; x=3, y=0,1,2,3; x=y=1,2}
uk~第k次渡船上的商人数vk~第k次渡船上的随从数 dk=(uk , vk)~决策 sk+1=sk +(-1)k dk
uk, vk=0,1,2;k=1,2,
D={(u , v) u+v=1, 2} ~允许决策集合 ~状态转移律
多步决策 问题
求dk D(k=1,2, n), 使sk S, 并按 转移律由 s1=(3,3)到达 sn+1=(0,0).