liltom-eth/llama2-webui

Run any Llama 2 locally with gradio UI on GPU or CPU from anywhere (Linux/Windows/Mac). Use `llama2-wrapper` as your local llama2 backend for Generative Agents/Apps.

Jupyter NotebookMIT

Issues

Change .env after using pip to install
#88 opened 4 months ago by NytePlus
0
Gradio Memory Leak Issue
#85 opened 9 months ago by ruizcrp
0
Very slow generation
#83 opened 10 months ago by jaslatendresse
1
why i7 8700 is faster than i7 9700
#84 opened 10 months ago by AndreaChiChengdu
0
The temperature parameter does not seem to work
#74 opened a year ago by ibutenko
2
GPU CUDA not found And HFValidationError
#82 opened 10 months ago by HorrorBest
0
safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooLarge
#80 opened 10 months ago by HougeLangley
5
[FEATURE] Is there any way to expose this as Rest API instead of Default UI
#27 opened a year ago by ajasingh
5
dom.js:238 Uncaught (in promise) DOMException
#77 opened a year ago by kisseternity
0
How to add llama_index in llama-webui
#75 opened a year ago by Kashif-Inam
0
GGML deprecated - support GGUF models?
#72 opened a year ago by agilebean
3
Unable to load 70B llama2 on cpu (llama cpp)
#66 opened a year ago by Dougie777
1
Cant seem to run it on GPU
#50 opened a year ago by rishabh-gurbani
5
Error in text generation, major error
#36 opened a year ago by Lyn4ever29
1
Is there a plan to support Windows?
#31 opened a year ago by tony2u
1
ERROR. How to fix ?
#67 opened a year ago by oaefou
4
How to run on GPU? Runs on CPU only
#68 opened a year ago by oaefou
1
chat too slow!
#69 opened a year ago by Hyingerrr
1
AssertionError self.model is not None
#70 opened a year ago by ebdavison
6
model is not None
#71 opened a year ago by quanpinjie
8
[FEATURE] docker support
#20 opened a year ago by liltom-eth
2
ERROR: Failed building wheel for llama-cpp-python
#37 opened a year ago by qinshuaibo
2
OSError: [Errno 30] Read-only file system
#59 opened a year ago by realAbitbol
1
[Feature Request] Support InternLM
#62 opened a year ago by vansinhu
0
Ignores new query and responds with crossed out details (from previous question).
#54 opened a year ago by THREELabs
2
cannot run Llama-2-70b-hf
#53 opened a year ago by takitsuba
3
When I was running app. py, I encountered some errors
#48 opened a year ago by Nerva05251228
2
User Chinese-Llama-2-7b.ggmlv3.q4_1.bin Model UnicodeDecodeError: 'utf-8'
#12 opened a year ago by xyz-dev
4
[FEATURE] support for ctransformers
#47 opened a year ago by touchtop
1
[FEATURE] add `--iter` argument for benchmark
#33 opened a year ago by liltom-eth
2
[FEATURE] export conversation as json
#35 opened a year ago by roflmao
2
[Question]: Nice job, we build a webui to use llama2
#25 opened a year ago by csunny
1
[FEATURE] command line app: `cli.py`
#26 opened a year ago by liltom-eth
0
[FEATURE] host a CPU UI in huggingface.
#23 opened a year ago by liltom-eth
0
[FEATURE] benchmarking script for `tokens / sec`
#14 opened a year ago by liltom-eth
1
CUDA not found
#1 opened a year ago by jlb1504
6
loading ggmlv3.q4 and q4_K_M
#3 opened a year ago by step21
6
bitsandbytes can not run on windows10
#4 opened a year ago by MrBean818
6
huggingface_hub.utils._validators.HFValidationError on CPU
#11 opened a year ago by blackhawkee
7
Test log | Welcome to communicate
#9 opened a year ago by XksA-me
6
FileNotFoundError: No such file or directory: "/mnt/Llama-2-13b-chat-hf/model-00001-of-00003.safetensors"
#7 opened a year ago by XksA-me
3
Why can llama understand Chinese so much and can't reply directly in Chinese?
#17 opened a year ago by XksA-me
4
[FEATURE] support llama2.c
#16 opened a year ago by liltom-eth
0
[FEATURE] Chinese Llama2
#15 opened a year ago by liltom-eth
1
[FEATURE] all in one install script
#13 opened a year ago by liltom-eth
0
Enable share on gradio?
#2 opened a year ago by jlb1504
2