基于规则的学习系统是否被认为是强化学习?
Is a rule-based system that learns considered reinforcement learning?
我正在读一本书,"AI for Game Developers" 作者是 Glenn Seemann 和 David M Bourg,他们在书中使用视频游戏 AI 作为基于规则的学习系统的示例。
从本质上讲,玩家有 3 种可能的动作,并以三连击的方式命中。人工智能旨在预测玩家的第三次击球。系统的规则是所有可能的 3 步组合。每个规则都有一个与之关联的 "weight"。每当系统猜错时,规则的权重就会降低。当系统必须选择一条规则时,它会选择权重最高的规则。
这与基于强化学习的系统有何不同?谢谢!
对,这就是established use期的强化学习。由于 "hot" 部分涉及深度学习应用,因此您可能 运行 反对当今从事积极研究的人。
您的应用程序有一个定义明确的游戏树来搜索;您可以使用与游戏直接对应的数学结构来指挥增援。这是一个机器学习应用程序,以及完善的学习算法。
当前 "hot" 研究正在处理更复杂的游戏情况,在这些情况下,动作与其结果之间的对应关系尚未明确定义。这些视频游戏使用 DL 网络而不是游戏树来努力最终发现将导致更高成功的动作规则。它们稳固地处于 AI 的 DL 部分,这就是为什么你会看到你阅读的内容存在分区的原因。
我正在读一本书,"AI for Game Developers" 作者是 Glenn Seemann 和 David M Bourg,他们在书中使用视频游戏 AI 作为基于规则的学习系统的示例。
从本质上讲,玩家有 3 种可能的动作,并以三连击的方式命中。人工智能旨在预测玩家的第三次击球。系统的规则是所有可能的 3 步组合。每个规则都有一个与之关联的 "weight"。每当系统猜错时,规则的权重就会降低。当系统必须选择一条规则时,它会选择权重最高的规则。
这与基于强化学习的系统有何不同?谢谢!
对,这就是established use期的强化学习。由于 "hot" 部分涉及深度学习应用,因此您可能 运行 反对当今从事积极研究的人。
您的应用程序有一个定义明确的游戏树来搜索;您可以使用与游戏直接对应的数学结构来指挥增援。这是一个机器学习应用程序,以及完善的学习算法。
当前 "hot" 研究正在处理更复杂的游戏情况,在这些情况下,动作与其结果之间的对应关系尚未明确定义。这些视频游戏使用 DL 网络而不是游戏树来努力最终发现将导致更高成功的动作规则。它们稳固地处于 AI 的 DL 部分,这就是为什么你会看到你阅读的内容存在分区的原因。