olivierjeunen/dual-bandit-kdd-2020

Source code for our paper "Joint Policy-Value Learning for Recommendation" published at KDD 2020.

PythonMIT

Readme
0Issues
22Stargazers
2Watchers

Stargazers

AppServiceProvider
Dhaka, Bangladesh
charleshuangruo
dsflu
esafak
Archipelago AI
fanlinbo
Amazing Seasun
fly51fly
PRIS
geopanag
Amazon
huiwang98
Soochow University
JusticeTorpedo
kiminh
maosengshulei
mindis
Marks and Spencer
mquad
Politecnico di Milano
nimitpattanasri
Upwork
pigooosuke
Tokyo/JP
pm3310
King (Microsoft)
rjagerman
Google
russellkim
HKUST
shashankg7
UvA
sumitsidana
Wolt
sungjinl
travisbrady

Contact site admin: Geeks.