cafaxo/Llama2.jl

Julia package for inference and training of Llama-style language models

JuliaMIT

Issues

Pointer to supported gguf models?
#36 opened 5 months ago by pitsianis
1
Support chat templates
#17 opened a year ago by cafaxo
1
ERROR: UndefVarError: `load_gguf_model` not defined
#34 opened 6 months ago by bjenkinsgit
1
Reproduce temp=0 llama.cpp results with some consistency.
#28 opened 6 months ago by Sixzero
5
Make the quantization code less insane
#14 opened 6 months ago by cafaxo
2
A GPU version of inference code
#7 opened a year ago by BangBOOM
3
Hope support more model formats
#24 opened 9 months ago by zsz00
0
Support saving weights to a standard format
#32 opened 10 months ago by trholding
1
How to find and download a suitable GGMLV3 model?
#27 opened 9 months ago by RainerHeintzmann
1
Training code
#4 opened 9 months ago by cafaxo
3
interrupt output
#33 opened 10 months ago by lazarusA
0
Support weight decay for Adam optimizer
#29 opened a year ago by fabian-sp
0
ERROR: git repository not found at `https://github.com/cafaxo/Llama2.jl`
#26 opened a year ago by prp-e
3
LoRA and finetuning
#22 opened a year ago by Thodoris1999
2
Create vocabulary from text
#20 opened a year ago by cafaxo
0
Speed up tokenizer
#19 opened a year ago by cafaxo
0
amazing speed!
#12 opened a year ago by yi
3
More high-level operations
#11 opened a year ago by pitsianis
3
ggml model ERROR: TaskFailedException nested task error: bitcast: target type not a leaf primitive type
#16 opened a year ago by pitsianis
4
Test perplexity
#13 opened a year ago by cafaxo
0
Quantization support
#10 opened a year ago by cafaxo
5
adding prompting
#3 opened a year ago by BangBOOM
1
Readme
#5 opened a year ago by cafaxo
0
Adapt to new tokenizer.bin format
#1 opened a year ago by cafaxo
0