Pinned Repositories
chatbot
Русскоязычный генеративный чатбот с профилем и фактами
GrammarEngine
Грамматический Словарь Русского Языка (+ английский, японский, etc)
LM-finetune
Код для файнтюна LM (rugpt, LLaMa, FRED T5) средствами transformers + deepspeed + LoRa
LM-pretrain
Char-level language model pretraining code and scripts
MNIST_Boosting
Comparison of XGBoost, LightGBM and CatBoost on MNIST classification problem
NLP_Datasets
My NLP datasets for Russian language
rulemma
Лемматизатор для русскоязычных текстов
rusyllab
Simple Python package for breaking Russian words into syllables
StressModel
Neural model for prediction of stress position in Russian words
verslibre
Using transformers to generate Russian poetry
Koziev's Repositories
Koziev/NLP_Datasets
My NLP datasets for Russian language
Koziev/chatbot
Русскоязычный генеративный чатбот с профилем и фактами
Koziev/GrammarEngine
Грамматический Словарь Русского Языка (+ английский, японский, etc)
Koziev/rulemma
Лемматизатор для русскоязычных текстов
Koziev/verslibre
Using transformers to generate Russian poetry
Koziev/rusyllab
Simple Python package for breaking Russian words into syllables
Koziev/rupostagger
Part-of-Speech Tagger for Russian language
Koziev/rutokenizer
Russian text segmenter and tokenizer
Koziev/LM-finetune
Код для файнтюна LM (rugpt, LLaMa, FRED T5) средствами transformers + deepspeed + LoRa
Koziev/pushkin
Генеративные текстовые модели
Koziev/StressModel
Neural model for prediction of stress position in Russian words
Koziev/paraphraser
Поэтический перефразировщик
Koziev/ruword2tags
Морфологический анализатор слов для русского языка
Koziev/vector2text
Generate Russian text using GPT model given LaBSE text embedding vector
Koziev/LM-pretrain
Char-level language model pretraining code and scripts
Koziev/transcriber
Model to convert text to phonetic transcription and vice versa
Koziev/mamba
Koziev/rupostagger2
Простая нейросетевая модель для частеречной разметки
Koziev/word_embedders
Character-level autoencoder models for words
Koziev/character-tokenizer
A character tokenizer for HuggingFace Transformers
Koziev/math
Conversational data generator
Koziev/paraphrase_reranker
Paraphrase detection and reranking model
Koziev/ruchunker
NP chunker for Russian language
Koziev/sent_embedders
Experiments with sentence embedding models
Koziev/AGRR-2019
Код моделей для задачи AGRR-2019
Koziev/kmeans_pytorch
kmeans using PyTorch
Koziev/masked_np_language_model
Эксперименты с генеративной языковой моделью (ruGPT) для восстановления именных групп
Koziev/OpenCV
Koziev/RuLeanALBERT
RuLeanALBERT is a pretrained masked language model for the Russian language that uses a memory-efficient architecture.
Koziev/rulm
Language modeling for Russian