PKU-RL/Literature

Recent MARL

Learning to Interactively Learn and Assist

Learning Transferable Cooperative Behavior in Multi-Agent Teams

Attentional Policies for Cross-Context Multi-Agent Reinforcement Learning

Multi-Agent Common Knowledge Reinforcement Learning

Multi-Agent Generalized Recursive Reasoning

Emergent Coordination Through Competition

Probabilistic Recursive Reasoning for Multi-Agent Reinforcement Learning

Relational Forward Models for Multi-Agent Learning

M^3RL: Mind-aware Multi-agent Management Reinforcement Learning

Learning to Teach in Cooperative Multiagent Reinforcement Learning

Competitive Multi-agent Inverse Reinforcement Learning with Sub-optimal Demonstrations

Structured Control Nets for Deep Reinforcement Learning

Learning to Coordinate with Coordination Graphs in Repeated Single-Stage Multi-Agent Decision Problems

Actor-Attention-Critic for Multi-Agent Reinforcement Learning

Intrinsic Social Motivation via Causal Influence in Multi-Agent RL

Evolving Intrinsic Motivations For Altruistic Behavior

Hierarchical MARL

Learning to Coordinate Manipulation Skills via Skill Behavior Diversification

Learning Hierarchical Teaching in Cooperative Multiagent Reinforcement Learning

Learning Fairness in Multi-Agent Systems

Feudal Multi-Agent Hierarchies for Cooperative Reinforcement Learning

Opponent Modeling

Learning Policy Representations in Multiagent Systems

Modeling Others using Oneself in Multi-Agent Reinforcement Learning

Opponent Modeling in Deep Reinforcement Learning

Machine Theory of Mind

Theory of Minds: Understanding Behavior in Groups Through Inverse Planning

MARL with Global Rewards

LIIR: Learning Individual Intrinsic Reward in Multi-Agent Reinforcement Learning

QTRAN: Learning to Factorize with Transformation for Cooperative Multi-Agent Reinforcement Learning

Counterfactual multi-agent policy gradients

Value-Decomposition Networks For Cooperative Multi-Agent Learning Based On Team Reward

Credit Assignment For Collective Multiagent RL with Global Rewards

QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning

MARL with Emergent Communication

Biases for Emergent Communication in Multi-agent Reinforcement Learning

Multi-Agent Cooperation and the Emergence of (Natural) Language

Emergence of Language with Multi-agent Games: Learning to Communicate with Sequences of Symbols

Emergent Communication Through Negotiation

MARL with Communication

Learning multiagent communication with backpropagation

Learning to communicate with deep multi-agent reinforcement learning

Multiagent Bidirectionally-Coordinated Nets: Emergence of Human-level Coordination in Learning to Play StarCraft Combat Games

Learning attentional communication for multi-agent cooperation

Fully Decentralized Multi-Agent Reinforcement Learning with Networked Agents

TarMAC: Targeted Multi-Agent Communication

Learning to Schedule Communication in Multi-agent Reinforcement Learning

SSoC: Learning Spontaneous and Self-Organizing Communication for Multi-Agent Collaboration

Learning when to Communicate at Scale in Multiagent Cooperative and Competitive Tasks

Learning Structured Communication for Multi-Agent Reinforcement Learning

Learning Multi-Agent Communication Through Structured Attentive Reasoning

Learning Nearly Decomposable Value Functions Via Communication Minimization

Efficient Communication in Multi-Agent Reinforcement Learning via Variance Based Control

Multi-Agent Reinforcement Learning

[MADDPG] Multi-agent actor-critic for mixed cooperative-competitive environments

[MeanField] Mean field multi-agent reinforcement learning

[DGN] Graph Convolutional Reinforcement Learning for Multi-Agent Cooperation

Deep Reinforcement Learning