radm
/

Qwen2.5-32B-simpo-LoRA

Generated from Trainer

Model card Files Files and versions Community

Qwen2.5-32B-simpo-LoRA / training_rewards_accuracies.png

radm's picture

first model version

e8a12f2 6 months ago

history contribute delete

64.4 kB