兼顾公平与效率?北大NeurIPS 19论文提出多智能体强化学习方法FEN
机器之心报道
机器之心编辑部
近日,北京大学卢宗青团队提出了一种新的多智能体强化学习方法 Fair-Efficient Network(FEN,「分」),用于多个智能体学习提升系统效率并同时保持公平。这一新方法对任务调度、马太效应和工厂生产等实际情景具有重要意义,该论文已被人工智能顶会 NeurIPS 2019 录用。
提出 fair-efficient reward,用于学习效率与公平。
提出一种 hierarchy 架构,降低学习难度。
提出 FEN 的分布式训练方法。





Job Scheduling 环境中存在 4 个智能体和 1 个资源,智能体占据资源会获得奖励,资源在同一时刻只能被一个智能体占据。
The Matthew Effect 环境中存在 10 个 Pac-men 和若干 ghosts。Pac-man 吃掉 ghost 会获得奖励,并且体积和速度变大,更容易吃其他 ghost,因此强者越强。
Manufacturing Plant 环境中存在 5 个智能体和不同种类的矿石,每个智能体采集不同的矿石来生产不同的零件,最终的产量取决于数目最少的零件。




Sub-policies 能够远离三个 ghosts 来保持公平。
三个 sub-policies 分布互不相同,达到了信息论目标的预期。



关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 追求实实在在 没有水分的增长 7904662
- 2 外交部:对岩崎茂采取反制措施 7807876
- 3 朱雀三号总指挥:最后一脚刹车没踩好 7712831
- 4 “神仙打架”被中国科学家终结 7616303
- 5 小吃街一夜间换上同一个收款码 7522109
- 6 麦当劳涨价了 7426559
- 7 悉尼致16死枪击案枪手系父子 7331849
- 8 “喂,119吗?我是110” 7238641
- 9 《怦然心动》导演与妻子家中遇害 7139033
- 10 护理流感儿童这些错误不能犯 7043555







机器之心
