luckeciano

Towards General Artificial Intelligence. Primary focus on Deep Reinforcement Learning. PhD Student at University of Oxford.

University of Oxford

Pinned Repositories

ab-test-RL
Using reinforcement learning for AB test
Language:Python2 0 04
BAL-PM
Deep Bayesian Active Learning for Preference Modeling in Large Language Models (NeurIPS 2024)
Language:Jupyter Notebook4 1 00
bumps
Code for the paper "Bottom-Up Meta-Policy Search", presented at NeurIPS Deep RL Workshop 2019
Language:Python0 1 00
deep-rl-humanoid-motions-masters
Repository for code from the Master's Thesis "Imitation Learning and Meta-Reinforcement Learning for Optimizing Humanoid Robot Motions".
Language:Python5 0 04
deep-rl-undergrad-thesis
A Deep Reinforcement Learning Method for Humanoid Kick Motion - Bachelor's Thesis
Language:TeX2 1 01
humanoid-run-ppo
Code for the paper "Learning Humanoid Robot Running Skills through Proximal Policy Optimization"
Language:C++3 1 01
kaggle-eef-house-prediction
Code from some models used in First Place's solution of Kaggle Data Science Challenge for EEF for ITA/Unifesp SJC students.
Language:Python1 1 01
ml-room
Implementations of machine learning algorithms from scratch.
Language:Python3 0 01
neural-networks-generate-lyrics
LSTM-based model for generate music lyrics
Language:Python3 2 00
transformers-metarl
Transformers are Meta-Reinforcement Learners - International Conference on Machine Learning (ICML) 2022
Language:Python59 4 76

luckeciano's Repositories

luckeciano/transformers-metarl
Transformers are Meta-Reinforcement Learners - International Conference on Machine Learning (ICML) 2022
Language:Python59 4 76
luckeciano/deep-rl-humanoid-motions-masters
Repository for code from the Master's Thesis "Imitation Learning and Meta-Reinforcement Learning for Optimizing Humanoid Robot Motions".
Language:Python5 0 04
luckeciano/BAL-PM
Deep Bayesian Active Learning for Preference Modeling in Large Language Models (NeurIPS 2024)
Language:Jupyter Notebook4 1 00
luckeciano/humanoid-run-ppo
Code for the paper "Learning Humanoid Robot Running Skills through Proximal Policy Optimization"
Language:C++3 1 01
luckeciano/ml-room
Implementations of machine learning algorithms from scratch.
Language:Python3 0 01
luckeciano/neural-networks-generate-lyrics
LSTM-based model for generate music lyrics
Language:Python3 2 00
luckeciano/ab-test-RL
Using reinforcement learning for AB test
Language:Python2 0 04
luckeciano/deep-rl-undergrad-thesis
A Deep Reinforcement Learning Method for Humanoid Kick Motion - Bachelor's Thesis
Language:TeX2 1 01
luckeciano/kaggle-eef-house-prediction
Code from some models used in First Place's solution of Kaggle Data Science Challenge for EEF for ITA/Unifesp SJC students.
Language:Python1 1 01
luckeciano/bumps
Code for the paper "Bottom-Up Meta-Policy Search", presented at NeurIPS Deep RL Workshop 2019
Language:Python0 1 00
luckeciano/distributed-tensorflow
training neural networks using distributed tensorflow
Language:Python0 1 01
luckeciano/automata-to-regular-expression
Automata to Regular Expression Converter - Programming Assignment of "Automata Theory" course.
Language:C++1 0
luckeciano/baselines
OpenAI Baselines: high-quality implementations of reinforcement learning algorithms
Language:Python0 0
luckeciano/competitive-programming
My Solutions to UVA exercises from Competitive Programming 3 (Book).
Language:C++0 0
luckeciano/cv
My CV
Language:Python0 0
luckeciano/deep-rl-humanoid-kick
Repository for Research Work "A Deep Reinforcement Learning Method for Humanoid Kick"
Language:Python0 0
luckeciano/discrete-structures-for-computing
Exercises for "Discrete Structures for Computing" course.
Language:C++1 01
luckeciano/hackerrank
Solutions to HackerRank's exercises
Language:C++0 0
luckeciano/ita-artificial-intelligence-PSO
Implementation of Particle Swarm Optimization for N-queens problem
Language:C++1 0
luckeciano/kaggle-tensorflow-speech-recognition-challenge
Kaggle Tensorflow Speech Recognition Challenge
Language:Jupyter Notebook1 01
luckeciano/luckeciano.github.io
Language:TeX1 0
luckeciano/minesweeper-ruby
A simple implementation of minesweeper in Ruby
Language:CSS1 0
luckeciano/neural-architecture-search-mlp
A distributed MLP neural architecture search for TORQUE-based clusters
Language:Python0 01
luckeciano/osim-rl
Reinforcement learning environments with musculoskeletal models
Language:Python
luckeciano/python-data-structures
Basic Python Data Structures.
0 0
luckeciano/ray
A fast and simple framework for building and running distributed applications. Ray is packaged with RLlib, a scalable reinforcement learning library, and Tune, a scalable hyperparameter tuning library.
Language:Python0 0
luckeciano/Research-Agile-Methods
1600 hours of research in agile for safety critical systems and agile at scale
1 0
luckeciano/rl-room
Implementation of RL algorithms from scratch.
Language:Python1 0
luckeciano/software-engineering-assignments-ita
Programming Assignments and Tests from "Software Engineering" course - ITA.
0 0
luckeciano/TD-VCL
Temporal-Difference Variational Continual Learning
Language:Python1