基于预算时变的多臂赌博机模型

基于预算时变的多臂赌博机模型基于预算时变的多臂赌博机模型摘要:多臂赌博机问题是一种经典的强化学习问题,在现实生活中有广泛的应用。然而,现有的多臂赌博机模型往往没有考虑到用户的预算限制,而在实际问题中,

腾讯文库基于预算时变的多臂赌博机模型基于预算时变的多臂赌博机模型