SivilTaram

Research Scientist at Sea AI Lab

Research Scientist @ Sea AI LabSingapore

Pinned Repositories

bigcode-evaluation-harness
A framework for the evaluation of autoregressive code generation language models.
Language:Python847 12 147223
octopack
🐙 OctoPack: Instruction Tuning Code Large Language Models
Language:Jupyter Notebook440 11 2027
lorahub
[COLM 2024] LoraHub: Efficient Cross-Task Generalization via Dynamic LoRA Composition
Language:Python604 11 2236
regmix
🧬 RegMix: Data Mixture as Regression for Language Model Pre-training
Language:Jupyter Notebook93 5 104
sailor-llm
[EMNLP-2024] ⚓️ Sailor: Open Language Models for South-East Asia
Language:Python120 8 39
scaling-with-vocab
[NeurIPS-2024] 📈 Scaling Laws with Vocabulary: Larger Models Deserve Larger Vocabularies https://arxiv.org/abs/2407.13623
Language:Python71 3 14
BUAAOS-guide-book
北航小操作系统实验指导书
Language:TeX56 17 2221
code-html-to-markdown
A lightweight script for processing HTML page to markdown format with support for code blocks
Language:HTML78 2 03
Graph-Neural-Network-Note
A blog for understanding graph neural network
411 19 441
Persona-Dialogue-Generation
The code of ACL 2020 paper "You Impress Me: Dialogue Generation via Mutual Persona Perception"
Language:Python308 8 3445

SivilTaram's Repositories

SivilTaram/Persona-Dialogue-Generation
The code of ACL 2020 paper "You Impress Me: Dialogue Generation via Mutual Persona Perception"
Language:Python308 8 3445
SivilTaram/code-html-to-markdown
A lightweight script for processing HTML page to markdown format with support for code blocks
Language:HTML78 2 03
SivilTaram/Calculator
阿超的四则运算生成器 v1.0
Language:Java10 2 1582
SivilTaram/Awesome-Prompt-Engineering
This repository contains a hand-curated resources for Prompt Engineering with a focus on Generative Pre-trained Transformer (GPT), ChatGPT, PaLM etc
Language:Python1 1 0
SivilTaram/LM-reasoning
This repository contains a collection of papers and resources on Reasoning in Large Language Models.
1 1 0
SivilTaram/santacoder-finetuning-commit
Fine-tune SantaCoder for Code/Text Generation.
Language:Python1 1 01
SivilTaram/SivilTaram.github.io
Language:HTML1 3 0
SivilTaram/axolotl
Go ahead and axolotl questions
SivilTaram/bigcode-evaluation-harness
A framework for the evaluation of autoregressive code generation language models.
Language:Python1 01
SivilTaram/bytepiece
更纯粹、更高压缩率的Tokenizer
Language:Python0 0
SivilTaram/catwalk
This project studies the performance and robustness of language models and task-adaptation methods.
Language:Python1 0
SivilTaram/commits
Language:Java1 0
SivilTaram/dclm
DataComp for Language Models
Language:HTML0 0
SivilTaram/extract-expert
Extract a single expert from an MoE model of Mixtral architecture, using slerp
Language:Python0 0
SivilTaram/GPT-classification-example
OpenAI gpt classification fine-tuning example.
Language:Python2 0
SivilTaram/guidance
A guidance language for controlling large language models.
Language:Jupyter Notebook1 0
SivilTaram/infinigen
Infinite Photorealistic Worlds using Procedural Generation
Language:Python1 0
SivilTaram/InstructionWild
1 0
SivilTaram/Megatron-LLM
distributed trainer for LLMs
Language:Python1 0
SivilTaram/mergekit
Tools for merging pretrained large language models.
Language:Python1 0
SivilTaram/oat
🌾 OAT: Online AlignmenT for LLMs
Language:Python
SivilTaram/OpenAgents
OpenAgents: An Open Platform for Language Agents in the Wild
Language:Python1 0
SivilTaram/peft
🤗 PEFT: State-of-the-art Parameter-Efficient Fine-Tuning.
Language:Python1 01
SivilTaram/primeqa
The prime repository for state-of-the-art Multilingual Question Answering research and development.
Language:Python1 0
SivilTaram/sailcraft
Data Toolkit for Sailor Language Models
Language:Python0 0
SivilTaram/SivilTaram.github.io.v1
personal online resume
Language:JavaScript2 02
SivilTaram/surya
Accurate line-level text detection and recognition (OCR) in any language
Language:Python1 0
SivilTaram/TinyLlama
The TinyLlama project is an open endeavor to pretrain a 1.1B Llama model on 3 trillion tokens.
Language:Python1 0
SivilTaram/Triton-Puzzles
Puzzles for learning Triton
Language:Jupyter Notebook1 01
SivilTaram/vllm
A high-throughput and memory-efficient inference and serving engine for LLMs