LLM-Travel

Introduction

欢迎来到 "LLM-travel" 仓库！探索大语言模型（LLM）的奥秘 🚀。致力于深入理解、探讨以及实现与大模型相关的各种技术、原理和应用。

搭乘 "LLM-travel" 列车，一起探索大语言模型的奇妙世界！

Date	Title(知乎链接)	Code	Note
2023-10-14	LLM之Trainer	无	LLM大模型之Trainer以及训练参数
2023-10-14	LLM之数据处理二	无	LLM大模型之大规模数据处理工具篇Hadoop-Spark集群安装
2023-10-10	LLM之开源数据整理	LLM_Pretrain_Datasets	开源的可用于LLM Pretrain数据集
2023-10-10	LLM之数据处理一	无	LLM大模型之大规模数据处理工具篇Hadoop-Spark集群介绍
2023-09-30	LLM之显存占用	memory_precision.ipynb	不同精度下显存占用与相互转换实践
2023-09-29	LLM之精度问题详解	precision.ipynb	精度问题（FP16，FP32，BF16）详解与实践
2023-09-24	LLM之Embedding初始化	embedding_init.ipynb	扩充词表后Embedding和LM_head层的初始化
2023-09-23	LLM之扩充词表	sentencepiece.ipynb	基于SentencePiece扩充LLaMa中文词表实践
2023-09-16	LLM之Generate参数详解	generate_parameter.ipynb	Generate/Inference（生成/推理）中参数与解码策略原理及其代码实现
2023-09-09	LLM之Tokenization分词方法	tokenization.ipynb	WordPiece，Byte-Pair Encoding (BPE)，Byte-level BPE(BBPE)原理及其代码实现