ssssmark

A data-science undergraduate in Tongji University,Shanghai

同济大学shanghai

ssssmark's Stars

SkyworkAI/MoH
MoH: Multi-Head Attention as Mixture-of-Head Attention
Language:Python714
DefTruth/Awesome-LLM-Inference
📖A curated list of Awesome LLM Inference Paper with codes, TensorRT-LLM, vLLM, streaming-llm, AWQ, SmoothQuant, WINT8/4, Continuous Batching, FlashAttention, PagedAttention etc.
2.7k182
xgqdut2016/cuda_code
easy cuda code
Language:Cuda2318
HeKun-NVIDIA/CUDA-Programming-Guide-in-Chinese
This is a Chinese translation of the CUDA programming guide
1.2k194
siboehm/SGEMM_CUDA
Fast CUDA matrix multiplication from scratch
Language:Cuda45461
CalvinXKY/BasicCUDA
A tutorial for CUDA&PyTorch
Language:C++11524
FasterDecoding/TEAL
Language:Python862
thunlp/MoEfication
Language:Python10710
jzhang38/TinyLlama
The TinyLlama project is an open endeavor to pretrain a 1.1B Llama model on 3 trillion tokens.
Language:Python7.8k455
gangweiX/Stoch-predict-with-Tranformer-LSTM
stock predict with MLP,CNN,RNN,LSTM,Transformer and Transformer-LSTM
Language:Python17030
THUDM/CogVLM2
GPT4V-level open-source multi-modal model based on Llama3-8B
Language:Python2.1k139
CS-BAOYAN/CSYuTuiMian2024
2024年计算机保研预推免通知
74749
modelscope/ms-swift
Use PEFT or Full-parameter to finetune 350+ LLMs or 100+ MLLMs. (LLM: Qwen2.5, Llama3.2, GLM4, Internlm2.5, Yi1.5, Mistral, Baichuan2, DeepSeek, Gemma2, ...; MLLM: Qwen2-VL, Qwen2-Audio, Llama3.2-Vision, Llava, InternVL2, MiniCPM-V-2.6, GLM4v, Xcomposer2.5, Yi-VL, DeepSeek-VL, Phi3.5-Vision, ...)
Language:Python3.9k342
ssbuild/qwen_vl_finetuning
Language:Python11
Lordog/dive-into-llms
《动手学大模型Dive into LLMs》系列编程实践教程
3.6k307
InternLM/lmdeploy
LMDeploy is a toolkit for compressing, deploying, and serving LLMs.
Language:Python4.5k403
datawhalechina/daily-interview
Datawhale成员整理的面经，内容包括机器学习，CV，NLP，推荐，开发等，欢迎大家star
Language:HTML2.6k426
CyC2018/CS-Notes
:books: 技术面试必备基础知识、Leetcode、计算机操作系统、计算机网络、系统设计
176k51k
tnfe/tntweb-admin
react admin management system template
Language:CSS3917
modelscope/agentscope
Start building LLM-empowered multi-agent applications in an easier way.
Language:Python5k309
yuweihao/MambaOut
MambaOut: Do We Really Need Mamba for Vision?
Language:Python2k34
zuiidea/antd-admin
An excellent front-end solution for enterprise applications built upon Ant Design and UmiJS
Language:JavaScript9.6k2.5k
InternLM/InternLM
Official release of InternLM2.5 base and chat models. 1M context support
Language:Python6.3k444
TongjiFinLab/CFGPT
Chinese Financial Assistant with Large Language Model
Language:Python415
AccumulateMore/CV
✔（已完结）最全面的深度学习笔记【土堆 Pytorch】【李沐动手学深度学习】【吴恩达深度学习】
Language:Jupyter Notebook5.9k773
redotvideo/mamba-chat
Mamba-Chat: A chat LLM based on the state-space model architecture 🐍
Language:Python90470
wdndev/llm_interview_note
主要记录大语言大模型（LLMs）算法（应用）工程师相关的知识及面试题
Language:HTML3.2k377
Harhao/react-admin-system
基于React开发后台管理系统模板(Ant Design)
Language:JavaScript1611
Oxen-AI/mamba-dive
This is the code that went into our practical dive using mamba as information extraction
Language:Python497
state-spaces/mamba
Mamba SSM architecture
Language:Python12.9k1.1k

ssssmark

ssssmark's Stars

SkyworkAI/MoH

DefTruth/Awesome-LLM-Inference

xgqdut2016/cuda_code

HeKun-NVIDIA/CUDA-Programming-Guide-in-Chinese

siboehm/SGEMM_CUDA

CalvinXKY/BasicCUDA

FasterDecoding/TEAL

thunlp/MoEfication

jzhang38/TinyLlama

gangweiX/Stoch-predict-with-Tranformer-LSTM

THUDM/CogVLM2

CS-BAOYAN/CSYuTuiMian2024

modelscope/ms-swift

ssbuild/qwen_vl_finetuning

Lordog/dive-into-llms

InternLM/lmdeploy

datawhalechina/daily-interview

CyC2018/CS-Notes

tnfe/tntweb-admin

modelscope/agentscope

yuweihao/MambaOut

zuiidea/antd-admin

InternLM/InternLM

TongjiFinLab/CFGPT

AccumulateMore/CV

redotvideo/mamba-chat

wdndev/llm_interview_note

Harhao/react-admin-system

Oxen-AI/mamba-dive

state-spaces/mamba