Pinned Repositories
CloudSync
Amazon s3 as a sync folder
ERNIE
An Implementation of ERNIE For Language Understanding (including Pre-training models and Fine-tuning tools)
IT4931_data_management_and_processing_lab_materials
Dữ liệu lớn yêu cầu cần có các cơ chế, kỹ thuật xử lý dữ liệu ở quy mô lớn và hiệu quả. Học phần này nhằm cung cấp cho người học các kiến thức về công nghệ lưu trữ dữ liệu lớn, các hệ quản trị cơ sở dữ liệu NoSQL, NewSQL, các nguyên lý xử lý dữ liệu song song, phân tán, theo khối, theo luồng, xử lý sự kiện phức tạp, quản lý luồng công việc. Bên cạnh đó, người học được làm quen và vận dụng các công nghệ xử lý dữ liệu lớn trên nền tảng Hadoop - Map Reduce, và Spark. Sau khi kết thúc học phần này người học có khả năng hiểu, lựa chọn, cài đặt, và vận hành các giải pháp lưu trữ và xử lý dữ liệu phù hợp dựa trên các kiến thức học được cho các bài toán ứng dụng cụ thể liên quan tới dữ liệu lớn.
NLP-Models-Tensorflow
Gathers machine learning and Tensorflow deep learning models for NLP problems
Preprocessing-for-deep-learning
This is the notebook associated with the blog post:
pyvi
Python Vietnamese Core NLP Toolkit
SQL_performance_explained
tensorflow_for_applied_machine_learning
This repo contains materials for the course that I teach at OTH university: Tensorflow for applied machine learning
vi_spacy
Vietnamese language model for spacy.io
vivi_spacy
A Vietnamese model for spaCy.io
trungtv's Repositories
trungtv/pyvi
Python Vietnamese Core NLP Toolkit
trungtv/vi_spacy
Vietnamese language model for spacy.io
trungtv/a-PyTorch-Tutorial-to-Image-Captioning
Show, Attend, and Tell | a PyTorch Tutorial to Image Captioning
trungtv/Awesome-Weak-Supervision
A curated list of programmatic weak supervision papers and resources
trungtv/BERTopic
Leveraging BERT and c-TF-IDF to create easily interpretable topics.
trungtv/charts
The User-Community Airflow Helm Chart is the standard way to deploy Apache Airflow on Kubernetes with Helm. Originally created in 2018, it has since helped thousands of companies create production-ready deployments of Airflow on Kubernetes.
trungtv/chatgpt-plugin-library
trungtv/CKAD-exercises
A set of exercises to prepare for Certified Kubernetes Application Developer exam by Cloud Native Computing Foundation
trungtv/COVID-19-Named-Entity-Recognition-for-Vietnamese
A Pytorch replication of the paper COVID-19 Named Entity Recognition for Vietnamese.
trungtv/deep-learning-v2-pytorch
Projects and exercises for the latest Deep Learning ND program https://www.udacity.com/course/deep-learning-nanodegree--nd101
trungtv/DocumentLayoutAnalysis
Document Layout Analysis resources repos for development with PdfPig.
trungtv/faust
Python Stream Processing. A Faust fork
trungtv/flake8-badbear
trungtv/gorilla
Gorilla: An API store for LLMs
trungtv/GPT4VN
Ai cũng có thể tự tạo chatbot bằng huấn luyện chỉ dẫn, với 12G GPU (RTX 3060 chẳng hạn) và khoảng vài chục MB dữ liệu
trungtv/great_expectations
Always know what to expect from your data.
trungtv/jax-influence
trungtv/KeyphraseVectorizers
Set of vectorizers that extract keyphrases with part-of-speech patterns from a collection of text documents and convert them into a document-keyphrase matrix.
trungtv/label-studio
Label Studio is a multi-type data labeling and annotation tool with standardized output format
trungtv/LearningApacheSpark
LearningApacheSpark
trungtv/nnabla-examples
Neural Network Libraries https://nnabla.org/ - Examples
trungtv/pandas_exercises
Practice your pandas skills!
trungtv/ParlAI
A framework for training and evaluating AI models on a variety of openly available dialogue datasets.
trungtv/pawls
Software that makes labeling PDFs easy.
trungtv/petals
🌸 Run 100B+ language models at home, BitTorrent-style. Fine-tuning and inference up to 10x faster than offloading
trungtv/pytorch_influence_functions
This is a PyTorch reimplementation of Influence Functions from the ICML2017 best paper: Understanding Black-box Predictions via Influence Functions by Pang Wei Koh and Percy Liang.
trungtv/stanford_alpaca
Code and documentation to train Stanford's Alpaca models, and generate the data.
trungtv/style-aware-discriminator
CVPR 2022 - Official PyTorch implementation of "A Style-aware Discriminator for Controllable Image Translation"
trungtv/trungtv.github.io
trungtv/UCPhrase-exp
This project provides an unsupervised framework for mining and tagging quality phrases on text corpora with pretrained language models (KDD'21).