Wang-Xiaoyang

Lecturer in AI. Interests include reinforcement learning, 6G communications and signal processing.

University of Exeter

Pinned Repositories

alpha-zero-general
A clean implementation based on AlphaZero for any game in any framework + tutorial + Othello/Gobang/TicTacToe/Connect4
Language:Python0 1 00
Bin-Packing-Env
Language:Python00
DIFUSCO
Code for "DIFUSCO: Graph-based Diffusion Solvers for Combinatorial Optimization"
Language:Python00
labsheets
Lab worksheets for the Applied Deep Learning Course.
Language:Jupyter Notebook00
model_ensemble_meta_learning
Language:Python0 1 00
pedsim_ros
ROS packages for PedSim (Pedestrian Simulator) based on social force model
Language:C++0 1 00
planet
Deep Planning Network: Control from pixels by latent planning with learned dynamics
Language:Python00
PPO-Implemnetation
Implementation of PPO for CartPole-v1
Language:Python00
RL-Implementations
Implementations for classic reinforcement learning algorithms, using Gym environment.
Language:Python10
Super-mario-bros-PPO-pytorch
Proximal Policy Optimization (PPO) algorithm for Super Mario Bros
Language:Python1 1 01

Wang-Xiaoyang's Repositories

Wang-Xiaoyang/RL-Implementations
Implementations for classic reinforcement learning algorithms, using Gym environment.
Language:Python10
Wang-Xiaoyang/Super-mario-bros-PPO-pytorch
Proximal Policy Optimization (PPO) algorithm for Super Mario Bros
Language:Python1 1 01
Wang-Xiaoyang/alpha-zero-general
A clean implementation based on AlphaZero for any game in any framework + tutorial + Othello/Gobang/TicTacToe/Connect4
Language:Python0 1 00
Wang-Xiaoyang/Bin-Packing-Env
Language:Python00
Wang-Xiaoyang/DIFUSCO
Code for "DIFUSCO: Graph-based Diffusion Solvers for Combinatorial Optimization"
Language:Python00
Wang-Xiaoyang/labsheets
Lab worksheets for the Applied Deep Learning Course.
Language:Jupyter Notebook00
Wang-Xiaoyang/model_ensemble_meta_learning
Language:Python0 1 00
Wang-Xiaoyang/pedsim_ros
ROS packages for PedSim (Pedestrian Simulator) based on social force model
Language:C++0 1 00
Wang-Xiaoyang/planet
Deep Planning Network: Control from pixels by latent planning with learned dynamics
Language:Python00
Wang-Xiaoyang/PPO-Implemnetation
Implementation of PPO for CartPole-v1
Language:Python00
Wang-Xiaoyang/Python-workshop
00
Wang-Xiaoyang/resource_packing_self_play
Language:Python
Wang-Xiaoyang/social-lstm
Social LSTM implementation in PyTorch
Language:Python
Wang-Xiaoyang/spinningup
An educational resource to help anyone learn deep reinforcement learning.
Language:Python1 0
Wang-Xiaoyang/Test-on-Drone-Dataset
Language:Matlab1 0
Wang-Xiaoyang/UARA
J. Liu, X. Tao and J. Lu, "Mobility-Aware Centralized Reinforcement Learning for Dynamic Resource Allocation in HetNets," accepted by IEEE GLOBECOM 2019.
Wang-Xiaoyang/UESTCthesis
电子科技大学毕设设计论文LaTeX模板
Language:TeX1 0
Wang-Xiaoyang/ug_project_power_adjustment
Language:Python1 0
Wang-Xiaoyang/VAE-CVAE-MNIST
Variational Autoencoder and Conditional Variational Autoencoder on MNIST in PyTorch
Wang-Xiaoyang/Wang-Xiaoyang.github.io
Just a plain, simple and elegant one-page theme for research/academia.
Language:HTML
Wang-Xiaoyang/workshop
demo repo
Wang-Xiaoyang/Workstation-report
Language:Jupyter Notebook

Wang-Xiaoyang

Pinned Repositories

alpha-zero-general

Bin-Packing-Env

DIFUSCO

labsheets

model_ensemble_meta_learning

pedsim_ros

planet

PPO-Implemnetation

RL-Implementations

Super-mario-bros-PPO-pytorch

Wang-Xiaoyang's Repositories

Wang-Xiaoyang/RL-Implementations

Wang-Xiaoyang/Super-mario-bros-PPO-pytorch

Wang-Xiaoyang/alpha-zero-general

Wang-Xiaoyang/Bin-Packing-Env

Wang-Xiaoyang/DIFUSCO

Wang-Xiaoyang/labsheets

Wang-Xiaoyang/model_ensemble_meta_learning

Wang-Xiaoyang/pedsim_ros

Wang-Xiaoyang/planet

Wang-Xiaoyang/PPO-Implemnetation

Wang-Xiaoyang/Python-workshop

Wang-Xiaoyang/resource_packing_self_play

Wang-Xiaoyang/social-lstm

Wang-Xiaoyang/spinningup

Wang-Xiaoyang/Test-on-Drone-Dataset

Wang-Xiaoyang/UARA

Wang-Xiaoyang/UESTCthesis

Wang-Xiaoyang/ug_project_power_adjustment

Wang-Xiaoyang/VAE-CVAE-MNIST

Wang-Xiaoyang/Wang-Xiaoyang.github.io

Wang-Xiaoyang/workshop

Wang-Xiaoyang/Workstation-report