1587causalai/llm_interview_note

大模型面试题及答案，大模型八股文

HTML

LLMs Interview 八股文

简介

本仓库为大模型面试相关概念，由本人参考网络资源整理，欢迎阅读，如果对你有用，麻烦点一下 start，谢谢！

在线阅读

本仓库相关文章已放在个人博客中，欢迎阅读：

在线阅读链接：LLMs Interview Note

注意：

相关答案为自己撰写，若有不合理地方，请指出修正，谢谢！

欢迎关注微信公众号，会不定期更新LLM内容，以及一些面试经验：

目录

01.大语言模型简介

大模型发展历程

语言模型

常见大模型

LLM基础题目

02.大语言模型基础

Transformer模型

大语言模型结构

03.语言模型训练数据集

04.分布式训练

基础知识

DeepSpeed

DeepSpeed介绍

软硬件

显存问题

分布式相关题目

05.有监督微调

理论

微调实战

LLaMa2微调

有监督微调相关题目

微调
预训练

06.推理

推理框架

llm推理框架简单总结
vLLM
Text Generation Inference
Faster Transformer
TRT LLM

推理优化技术

LLM推理优化技术

推理相关题目

07.强化学习

强化学习原理

策略梯度（pg）

RLHF

一些题目

08.检索增强rag

RAG

Agent

大模型agent技术

09.大语言模型评估

模型评估

评测

LLM幻觉

10.大语言模型应用

思维链（CoT）

LangChain 框架

98.LLMs相关课程

99.参考资料

更新记录

2024.03.13 ：强化学习题目
2024.03.10 : LLMs相关课程
2024.03.08 ： RAG技术
2024.03.05 ：大模型评估，幻觉
2024.01.26 ：语言模型简介
2023.12.15 ： llama，chatglm 架构
2023.12.02 ：LLM推理优化技术
2023.12.01 ：调整目录
2023.11.30 ：18.Layer-Normalization，21.Attention升级
2023.11.29 ： 19.激活函数，22.幻觉，23.思维链
2023.11.28 ： 17.位置编码
2023.11.27 ： 15.token及模型参数， 16.tokenize分词
2023.11.25 ： 13.分布式训练
2023.11.23 ： 6.推理， 7.预训练， 8.评测，9.强化学习， 11.训练数据集，12.显存问题,14.agent
2023.11.22 ： 5.高效微调
2023.11.10 ： 4.LangChain
2023.11.08 ：建立仓库；1.基础，2.进阶，3.微调