介绍

本章介绍了强化学习的基本概念。这些概念非常重要,因为它们将在本书中被广泛使用。我们首先通过实例介绍这些概念,然后在马尔可夫决策过程的框架下对它们进行形式化。