RedHatAI
/

Qwen3-4B-quantized.w4a16

compressed-tensors

Model card Files Files and versions Community

Qwen3-4B-quantized.w4a16 / recipe.yaml

alexmarques's picture

Upload folder using huggingface_hub

68a3daf verified 3 days ago

history blame contribute delete

352 Bytes

	quant_stage:
	quant_modifiers:
	GPTQModifier:
	ignore: [lm_head]
	sequential_targets: [Qwen3DecoderLayer]
	dampening_frac: 0.01
	config_groups:
	group0:
	targets: [Linear]
	weights: {num_bits: 4, type: int, strategy: group, group_size: 128, symmetric: true,
	actorder: weight, observer: mse}