lolisun

lolisun's Stars

iamadamdev/bypass-paywalls-chrome
Bypass Paywalls web browser extension for Chrome and Firefox.
Language:JavaScript48.4k 688 9983.5k
fxsjy/jieba
结巴中文分词
Language:Python33.3k 1.3k 8536.7k
vllm-project/vllm
A high-throughput and memory-efficient inference and serving engine for LLMs
Language:Python29.4k 243 5.1k4.4k
microsoft/unilm
Large-scale Self-supervised Pre-training Across Tasks, Languages, and Modalities
Language:Python20.1k 308 1.4k2.5k
HumanSignal/label-studio
Label Studio is a multi-type data labeling and annotation tool with standardized output format
Language:JavaScript19k 177 2.3k2.4k
HumanAIGC/AnimateAnyone
Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation
14.5k 671 92972
fishaudio/fish-speech
Brand new TTS solution
Language:Python13.7k 92 3931k
cumulo-autumn/StreamDiffusion
StreamDiffusion: A Pipeline-Level Solution for Real-Time Interactive Generation
Language:Python9.7k 78 118691
fishaudio/Bert-VITS2
vits2 backbone with multilingual-bert
Language:Python8k 50 01.1k
01-ai/Yi
A series of large language models trained from scratch by developers @01-ai
Language:Jupyter Notebook7.7k 106 290475
HVision-NKU/StoryDiffusion
Accepted as [NeurIPS 2024] Spotlight Presentation Paper
Language:Jupyter Notebook5.9k 86 145593
arcee-ai/mergekit
Tools for merging pretrained large language models.
Language:Python4.8k 52 310434
tickstep/aliyunpan
阿里云盘命令行客户端，支持JavaScript插件，支持同步备份功能。
Language:Go4.2k 35 446355
argilla-io/argilla
Argilla is a collaboration tool for AI engineers and domain experts to build high-quality datasets
Language:Python3.9k 30 2.2k372
InternLM/xtuner
An efficient, flexible and full-featured toolkit for fine-tuning LLM (InternLM2, Llama3, Phi3, Qwen, Mistral, ...)
Language:Python3.9k 34 530305
adbar/trafilatura
Python & Command-line tool to gather text and metadata on the Web: Crawling, scraping, extraction, output as CSV, JSON, HTML, MD, TXT, XML
Language:Python3.6k 31 374256
MooreThreads/Moore-AnimateAnyone
Character Animation (AnimateAnyone, Face Reenactment)
Language:Python3.2k 38 152245
modelscope/data-juicer
A one-stop data processing system to make data higher-quality, juicier, and more digestible for (multimodal) LLMs! 🍎 🍋 🌽 ➡️ ➡️🍸 🍹 🍷为大模型提供更高质量、更丰富、更易”消化“的数据！
Language:Python2.8k 19 188172
ekzhu/datasketch
MinHash, LSH, LSH Forest, Weighted MinHash, HyperLogLog, HyperLogLog++, LSH Ensemble and HNSW
Language:Python2.5k 48 165293
eyurtsev/kor
LLM(😽)
Language:Python1.6k 15 8089
MaaXYZ/MaaFramework
基于图像识别的自动化黑盒测试框架 | An automation black-box testing framework based on image recognition
Language:C++1.4k 13 193172
foxofice/sub_share
字幕共享计划
Language:C#1.3k 17 22133
openai/Video-Pre-Training
Video PreTraining (VPT): Learning to Act by Watching Unlabeled Online Videos
Language:Python1.3k 27 33142
vastxie/Happy-ChatGPT
ChatGPT 国粹版，和 GPT 一起学习地道的**话吧
Language:TypeScript825 5 10103
AI-Hobbyist/Genshin_Datasets
Genshin Datasets For SVC/SVS/TTS
592 9 1537
yangdongchao/AcademiCodec
AcademiCodec: An Open Source Audio Codec Model for Academic Research
Language:Python587 31 4081
X-PLUG/CValues
面向中文大模型价值观的评估与对齐研究
Language:Python472 1 720
wenet-e2e/WeTextProcessing
Text Normalization & Inverse Text Normalization
Language:Python470 10 11468
facebookresearch/AudioDec
An Open-source Streaming High-fidelity Neural Audio Codec
Language:Python430 29 3120
Re-Align/URIAL
Language:Python292 2 718