johnsmith0031/alpaca_lora_4bit

PythonMIT

Issues

Support for moe model？
#156 opened 5 months ago by laoda513
2
Why lora support is only for simple lora with only q_proj and v_proj ？
#155 opened 6 months ago by XpracticeYSKM
1
trying to get this working with text-generation-webui
#154 opened 10 months ago by caterpillarpants
9
Error attempting to finetune llama2-70b
#139 opened a year ago by tensiondriven
5
AttributeError: 'dict' object has no attribute 'to_dict'
#153 opened a year ago by kkaarrss
1
Finetuning CodeLLaMA34B - RuntimeError: The size of tensor a (1024) must match the size of tensor b (8192)
#152 opened a year ago by juanps90
3
docker.io/nvidia/cuda:11.7.0-devel-ubuntu22.04 not available anymore
#151 opened a year ago by kkaarrss
1
3 errors detected in the compilation of "src/alpaca_lora_4bit/quant_cuda/quant_cuda_kernel.cu"
#150 opened a year ago by kkaarrss
2
monkeypatch problem
#97 opened a year ago by yfliao
8
ValueError: Target module Autograd4bitQuantLinear() is not supported.
#148 opened a year ago by jordankzf
7
Target module Autograd4bitQuantLinear() is not supported
#96 opened a year ago by richardburleigh
5
OOM on inference while i can finetune with more tokens
#146 opened a year ago by nepeee
2
module 'alpaca_lora_4bit.quant_cuda' has no attribute 'vecquant4recons_v2'
#147 opened a year ago by kevkid
4
Unable to Build Wheels
#144 opened a year ago by VegaStarlake
8
Merging LoRA after finetune
#145 opened a year ago by gameveloster
1
Targeting all layers and biases
#141 opened a year ago by grimulkan
2
Checkpoint saving broken with the latest version of huggingface
#135 opened a year ago by nepeee
8
Feature request: Stop when loss reaches X
#142 opened a year ago by tensiondriven
1
Is alpaca_lora_4bit@winglian-setup_pip missing finetune.py?
#143 opened a year ago by tensiondriven
1
High perplexity while lower loss after LoRA finetuning (how?)
#140 opened a year ago by alex4321
5
LoRA Output Identical to Base Model
#137 opened a year ago by LegendBegins
4
Flash Attention 2
#138 opened a year ago by Jeduh
1
How to use inference.py after finetune.py?
#136 opened a year ago by athenawisdoms
2
TypeError: object of type 'NoneType' has no len()
#130 opened a year ago by athenawisdoms
1
Gibberish results for non-disabled "faster_mode" using "vicuna-7B-GPTQ-4bit-128g" model
#127 opened a year ago by alex4321
4
July
#132 opened a year ago by Jeduh
4
Crashes during finetuning
#131 opened a year ago by gameveloster
2
Update docs for > 2048 token models (SuperHOT)?
#129 opened a year ago by tensiondriven
12
Differences between QLoRA and this repo
#113 opened a year ago by qwopqwop200
3
Inf or NaN in probabilities. Windows 10, vicuna-7b-gptq-4bit-128g
#124 opened a year ago by alex4321
35
this repo support 2bit finetuning the llama model？ Is there any case to show how to run the scripts?
#122 opened a year ago by zlh1992
1
[question] weights in the replaced quantized modules
#121 opened a year ago by vince62s
0
how to change into 8 bit
#120 opened a year ago by leexinyu1204
1
Problem with inference
#119 opened a year ago by leexinyu1204
7
fine tune with 2 GPU
#118 opened a year ago by shawei3000
2
Version of GPTQ
#104 opened a year ago by juanps90
3
how to infer with finetuned model?
#117 opened a year ago by balaji-skoruz
4
ImportError: cannot import name '_get_submodules' from 'peft.utils'
#114 opened a year ago by saber258
10
Consider using new QLoRA
#107 opened a year ago by juanps90
3
Implementing Landmark Attention
#116 opened a year ago by juanps90
0
Finetuning 2-bit Quantized Models
#115 opened a year ago by kuleshov
7
Code reference request
#112 opened a year ago by PanQiWei
1
Problem loading safetensor file format
#110 opened a year ago by ortegaalfredo
3
what is the difference between v1 model and v2 model?
#111 opened a year ago by zlh1992
1
Other datasets
#106 opened a year ago by Ph0rk0z
2
ValueError: Autograd4bitQuantLinear() does not have a parameter or a buffer named qzeros.
#105 opened a year ago by ra-MANUJ-an
2
error with monkeypatch and model gpt-j and lora
#103 opened a year ago by ReDXeoL
0
TypeError: '<' not supported between instances of 'tuple' and 'float' while trying to generate completion through the v2 13bit LLAMA
#101 opened a year ago by alex4321
6
Which script were used for 4bit quantization?
#100 opened a year ago by alex4321
2
run_server.sh: ValueError: Autograd4bitQuantLinear() does not have a parameter or a buffer named g_idx.
#98 opened a year ago by yfliao
1