您好，关于训练和推理，有建议的服务器配置吗？

Question

您好，关于训练和推理，有建议的服务器配置吗？

willqq opened this issue a year ago · 6 comments

Answer 1 · 2023-07-21T07:38:23.000Z

推理的话，我本地试着跑了下，在尚未开启任何优化的情况下，差不多 14G 左右显存足够，所以 v100 或者其他的 3090 啥的大于 14G 的卡都行（保险点，整个 16G？ @willqq

Fri Jul 21 15:36:56 2023
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.125.06   Driver Version: 525.125.06   CUDA Version: 12.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  Off  | 00000000:01:00.0 Off |                  Off |
| 31%   45C    P2    69W / 450W |  14341MiB / 24564MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A      1434      G   /usr/lib/xorg/Xorg                167MiB |
|    0   N/A  N/A      1673      G   /usr/bin/gnome-shell               16MiB |
|    0   N/A  N/A      4343      C   python                          14154MiB |
+-----------------------------------------------------------------------------+

Answer 2 · 2023-07-21T14:56:23.000Z

训练时，8张24G显存就可以跑起来，不过我们用的是A100 40G的卡。训练代码可以参考#5

Answer 3 · 2023-07-22T08:12:41.000Z

为项目点赞 @shiyemin 👍

额外补充，我对这个模型做了一个简单的量化尝试，大概5G显存就能跑了，模型下载地址：
https://huggingface.co/soulteary/Chinese-Llama-2-7b-4bit/tree/main

配套的说明 & 博客教程，有需自取
https://github.com/soulteary/docker-llama2-chat

cc @willqq

Answer 4 · 2023-07-22T16:44:59.000Z

基于 @soulteary 提供的代码，LinkSoul也提供了4bit量化的版本，方便大家使用。

Answer 5 · 2023-07-24T03:31:45.000Z

感谢各位的耐心解答

Answer 6 · 2023-07-24T11:11:16.000Z

@willqq 或者也可以用 CPU 推理，参考最新更新的内容