电子书《Distributional Reinforcement Learning》分布式强化学习
分布式强化学习是一种新的数学形式,用于思考决策问题。它超越了强化学习和期望值的常见方法,专注于作为代理人选择结果所获得的总奖励或回报——具体来说,是从概率的角度看这个回报的行为。在这本首部全面介绍分布式强化学习的指南中,马克·G·贝尔马尔、威尔·达布尼和马克·罗兰德,他们是这个领域的开创者,介绍了其关键概念,并回顾了其许多应用。他们展示了其解释许多复杂、有趣现象的能力,这些现象源于与环境的互动。
作者们从经典强化学习中提出了一些核心观点,以便将分布主题置于上下文中,并包括了与文本中讨论的主要结果相关的数学证明。他们引导读者通过一系列的算法和数学发展,依次对随机回报进行特征化、计算、估计和决策。在金融(风险管理)、计算神经科学、计算精神病学、心理学、宏观经济学和机器人学等多样化的学科中,实践者们已经在使用分布式强化学习,为其在数学金融、工程和生命科学中的扩展应用铺平了道路。分布式强化学习不仅仅是一种数学方法,它代表了一种新的视角,关于智能代理如何进行预测和决策
地址:
https://direct.mit.edu/books/oa-monograph/5590/Distributional-Reinforcement-Learning