shubhamprshr
/

Qwen2.5-3B-Instruct_math_sgrpo_gaussian_0.25_0.75_True_1200

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-3B-Instruct_math_sgrpo_gaussian_0.25_0.75_True_1200

Commit History

End of training

6f475ce
verified

shubhamprshr commited on 8 days ago

Model save

a82be96
verified

shubhamprshr commited on 8 days ago

Training in progress, step 1200

4151209
verified

shubhamprshr commited on 8 days ago

initial commit

63daeed
verified

shubhamprshr commited on 10 days ago