merterbak
/

Qwen3-8B-GGUF

Text Generation

Model card Files Files and versions

Qwen3-8B

Qwen-3B model available in multiple GGUF quantization formats, also stored on Xet for fast and efficient access. Available in following quantization levels:

Quantization Level	Bit Precision	Quantization Type
Q2_K	2-bit	K-means clustering
Q3_K_S	3-bit	Small k-means clustering
Q3_K_M	3-bit	Medium k-means clustering
Q3_K_L	3-bit	Large k-means clustering
Q4_0	4-bit	Standard quantization
Q4_1	4-bit	Standard quantization
Q4_K_S	4-bit	Small k-means clustering
Q4_K_M	4-bit	Medium k-means clustering
Q5_0	5-bit	Standard quantization
Q5_1	5-bit	Standard quantization
Q5_K_S	5-bit	Small k-means clustering
Q5_K_M	5-bit	Medium k-means clustering
Q6_K	6-bit	K-means clustering
Q8_0	8-bit	Standard quantization

Downloads last month: 102

GGUF

Model size

8.19B params

Architecture

qwen3

Hardware compatibility

Log In to view the estimation

2-bit

3-bit

4-bit

5-bit

6-bit

8-bit

Inference Providers NEW

Text Generation

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for merterbak/Qwen3-8B-GGUF

Base model

Qwen/Qwen3-8B-Base

Finetuned

Quantized

(52)

this model