aijunbai

Artificial Intelligence, Decision-Theoretical Planning, Reinforcement Learning, Deep Learning

UC BerkeleySan Francisco Bay Area

Pinned Repositories

bandit
Algorithms for multi-armed bandit (MAB) problems
Language:C++1 2 00
hplanning
Markovian State and Action Abstractions for MDPs via Hierarchical MCTS within a POMDP Formulation
Language:C++11 3 03
keepaway
Concurrent Hierarchical Reinforcement Learning for RoboCup Keepaway
Language:C++6 3 04
markov-game
Stochastic Markov Games
Language:Python12 3 05
pfs
A Particle Filtering over Sets Approach to Multi-Object Tracking
Language:C++15 2 17
quadrotor_openrave
OpenRAVE based Quadrotor/Quadcopter Simulator with Task/Motion Planning
Language:Python2 4 02
reversi
A C/S framework for reversi game with a well developed AI player
Language:C++2 2 00
taxi
Hierarchical Online Planning and Reinforcement Learning on Taxi
Language:C++30 6 111
thompson-sampling
Thompson Sampling based Monte Carlo Tree Search for MDPs and POMDPs
Language:C++14 2 10
uct
UCT with different parallelization implementations
Language:Python3 3 01

aijunbai's Repositories

aijunbai/taxi
Hierarchical Online Planning and Reinforcement Learning on Taxi
Language:C++30 6 111
aijunbai/pfs
A Particle Filtering over Sets Approach to Multi-Object Tracking
Language:C++15 2 17
aijunbai/thompson-sampling
Thompson Sampling based Monte Carlo Tree Search for MDPs and POMDPs
Language:C++14 2 10
aijunbai/markov-game
Stochastic Markov Games
Language:Python12 3 05
aijunbai/hplanning
Markovian State and Action Abstractions for MDPs via Hierarchical MCTS within a POMDP Formulation
Language:C++11 3 03
aijunbai/keepaway
Concurrent Hierarchical Reinforcement Learning for RoboCup Keepaway
Language:C++6 3 04
aijunbai/uct
UCT with different parallelization implementations
Language:Python3 3 01
aijunbai/quadrotor_openrave
OpenRAVE based Quadrotor/Quadcopter Simulator with Task/Motion Planning
Language:Python2 4 02
aijunbai/reversi
A C/S framework for reversi game with a well developed AI player
Language:C++2 2 00
aijunbai/bandit
Algorithms for multi-armed bandit (MAB) problems
Language:C++1 2 00
aijunbai/rcg_player
RCG format log file player
Language:C++1 2 11
aijunbai/aijunbai.github.io
Homepage
Language:Python1 0
aijunbai/bert
TensorFlow code and pre-trained models for BERT
Language:Python2 0
aijunbai/mono-vo
An OpenCV based implementation of Monocular Visual Odometry
Language:C++2 0
aijunbai/notebooks
IPython Notebooks
Language:Jupyter Notebook2 0
aijunbai/pole
Reinforcement Learning algorithms for an inverted pendulum with a cart
Language:C++2 01
aijunbai/programmable-reinforcement-learning
Reinforcement learning algorithms constrained by a partial program
Language:Common Lisp2 0
aijunbai/quadrotor_moveit
Quadrotor/Quadcopter Motion Planning using MoveIt!
Language:Python2 0
aijunbai/skipoominijool
A Compiler Front End for a Subset Language of Java
Language:Java2 0

aijunbai

Pinned Repositories

bandit

hplanning

keepaway

markov-game

pfs

quadrotor_openrave

reversi

taxi

thompson-sampling

uct

aijunbai's Repositories

aijunbai/taxi

aijunbai/pfs

aijunbai/thompson-sampling

aijunbai/markov-game

aijunbai/hplanning

aijunbai/keepaway

aijunbai/uct

aijunbai/quadrotor_openrave

aijunbai/reversi

aijunbai/bandit

aijunbai/rcg_player

aijunbai/aijunbai.github.io

aijunbai/bert

aijunbai/mono-vo

aijunbai/notebooks

aijunbai/pole

aijunbai/programmable-reinforcement-learning

aijunbai/quadrotor_moveit

aijunbai/skipoominijool