imperialite

Working on NLP/NLG for Education. Doctoral Researcher at UKRI CDT in Accountable, Responsible, and Transparent AI at the University of Bath, UK.

University of BathUnited Kingdom

Pinned Repositories

ara-close-lang
Code for Automatic Readability Assessment for Closely Related Philippine Languages (ACL2023)
Language:Jupyter Notebook0 1 00
BasahaCorpus-HierarchicalCrosslingualARA
This repository contains the code and data for BasahaCorpus paper accepted for EMNLP 2023 (Main).
Language:Python1 1 00
BERT-Embeddings-For-ARA
Language:Jupyter Notebook2 2 00
cebuano-readability
Language:Jupyter Notebook1 3 00
cmcl2022-unified-eye-tracking-ipa
Language:Jupyter Notebook1 2 00
filipino-linguistic-extractors
This repository contains Python scripts for extracting linguistic features from Filipino texts.
Language:Python1 2 01
FilWordNetExtractor
This project contains a Python notebook for extracting sense from the FilWordNet by Borra et. al.
Language:Jupyter Notebook8 5 10
nlp-research-primer-ph
This repository contains the main primer file for kickstarting NLP research intended for a Filipino student's use. The primer contains short discussions on basic NLP processes, example published NLP papers by Filipino students and researchers, open-source codes and repositories, and links to online tools.
4 2 01
Philippine-Languages-Online-Corpora
This repository contains the Philippine Languages Online Corpora (PLOC)
7 5 02
uniform-complexity-textgen
Language:Jupyter Notebook2 2 00

imperialite's Repositories

imperialite/Philippine-Languages-Online-Corpora
This repository contains the Philippine Languages Online Corpora (PLOC)
7 5 02
imperialite/uniform-complexity-textgen
Language:Jupyter Notebook2 2 00
imperialite/BasahaCorpus-HierarchicalCrosslingualARA
This repository contains the code and data for BasahaCorpus paper accepted for EMNLP 2023 (Main).
Language:Python1 1 00
imperialite/cebuano-readability
Language:Jupyter Notebook1 3 00
imperialite/cmcl2022-unified-eye-tracking-ipa
Language:Jupyter Notebook1 2 00
imperialite/filipino-tiktok-hatespeech
A dataset containing hate speech in text form transcribed from Filipino Tiktok videos related to politics.
1 1 0
imperialite/getting-started-with-the-twitter-api-v2-for-academic-research
A course on getting started with the Twitter API v2 for academic research
Language:Python1 1 0
imperialite/readability-standard-alignment
Code and data repository for Readability Standard Alignment paper by Joseph Imperial and Harish Tayyar Madabushi at GEM 2023.
Language:Python1 1 0
imperialite/ara-close-lang
Code for Automatic Readability Assessment for Closely Related Philippine Languages (ACL2023)
Language:Jupyter Notebook0 1 00
imperialite/ACL2023-Retrieval-LM.github.io
https://acl2023-retrieval-lm.github.io/
Language:JavaScript0 0
imperialite/BIG-bench
Beyond the Imitation Game collaborative benchmark for measuring and extrapolating the capabilities of language models
Language:Python0 0
imperialite/CEFR-SP
Repository for CEFR-SP corpus and sentence level assessment
Language:Python0 0
imperialite/definition-complexity
Language:Jupyter Notebook0 0
imperialite/drawio-diagrams
1 0
imperialite/egyptians-in-ai
A website dedicated to showcasing the profiles of prominent Egyptian researchers in the field of AI.
Language:HTML0 0
imperialite/evaluation
Code and Data for Evaluation WG
Language:Python1 0
imperialite/gpt-2-simple
Python package to easily retrain OpenAI's GPT-2 text-generating model on new texts
Language:Python1 0
imperialite/imperialite
My personal repository
1 0
imperialite/llama
Inference code for LLaMA models
Language:Python0 0
imperialite/mteb
MTEB: Massive Text Embedding Benchmark
Language:Python0 0
imperialite/nerfies.github.io
Language:JavaScript0 0
imperialite/reinforcement-learning
Minimal and Clean Reinforcement Learning Examples
Language:Python1 0
imperialite/Scweet
A simple and unlimited twitter scraper : scape tweets, likes, retweets, following, followers, user info, images...
Language:Python1 0
imperialite/seacrowd-datahub
A collaborative project to collect datasets in SEA languages, SEA regions, or SEA cultures.
imperialite/sgnlp
Machine learning models from Singapore's NLP research community
Language:Python0 0
imperialite/specialex
imperialite/standardize
This repository contains the code, data, and website assets for the Standardize paper.
Language:JavaScript1 0
imperialite/standardize-ctg
Code for Standardize: Aligning Language Models with Expert-Defined Standards for Content Generation (EMNLP 2024)
Language:Jupyter Notebook1 0
imperialite/StoryPlot-RewardShaping
Code from the IJCAI 2019 paper "Controllable Neural Story Plot Generation via Reward Shaping"
Language:Python1 0
imperialite/TSAR-2022-Shared-Task
TSAR2022 Shared Task on Lexical Simplification - Datasets and Evaluation scripts
Language:Python0 0