Publications

Decentralized policy gradient descent ascent for safe multi-agent reinforcement learning