1.2-状态和行动
1.2 状态和行动¶
首先需要介绍的概念是状态(state),它描述了智能体相对于环境的状态。在网格世界的例子中,状态相当于智能体的位置。既然是九宫格,当然也会有九种状态。它们被表示为图\(1.3(a)\)中的\(s_1,s_2,...,s_9\),状态的集合被叫做状态空间(state space),用符号表示为\(\mathcal{S}=\{s_{1},\ldots,s_{9}\}。\)
对于每个状态,智能体会采取五个可能的行动(action):向前,向右,向后,向左和静止不动。这五个行动分别被表示为\(a_1,a_2,...,a_5\)(如图1.3(b)中所示)。不同的状态可以有不同的行动空间,表示为\(\mathcal{A}=\{a_{1},\ldots,a_{5}\}\)。例如,在\(s_1\)的状态下采取\(a_1\)或\(a_4\)会导致与边界(boundary)发生碰撞,我们可以设置\(s_1\)的行动空间为\(\mathcal{A}(s_1)=\{a_{2},a_3,a_{5}\}\)。在这本书中,我们考虑最一般的情况: \(\mathcal{A}(s_i)=\mathcal{A}={a_{1},\ldots,a_{5}}\)对于所有\(i\)。
图1.3 状态和行动的图解,这里有九个状态\({s_1,...,s_9}\),每个状态有五个可能的行动\({a_1,a_2,a_3,a_4,a_5}\)。