agent-Optimal-bidding-policy-using-Policy-Gradient-in-a-Multi-agent-Contextual-Bandit-setting-PROSAGA-码农传奇

项目作者： CSKrishna

项目描述：
We use policy gradient to help agents learn optimal policies in a competitive multi-agent contextual bandit setting

高级语言： Jupyter Notebook

项目主页：

项目地址: git://github.com/CSKrishna/Optimal-bidding-policy-using-Policy-Gradient-in-a-Multi-agent-Contextual-Bandit-setting.git

创建时间： 2018-03-09T02:47:45Z
项目社区：https://github.com/CSKrishna/Optimal-bidding-policy-using-Policy-Gradient-in-a-Multi-agent-Contextual-Bandit-setting
开源协议：
下载