奖赏塑形引导的高效率强化学习探索策略研究

奖赏塑形引导的高效率强化学习探索策略研究奖赏塑形引导的高效率强化学习探索策略研究摘要:强化学习是一种机器学习的方法,主要通过智能体与环境的交互学习来达到目标。在强化学习中,探索问题一直是一个重要的挑战

腾讯文库奖赏塑形引导的高效率强化学习探索策略研究