shubhamprshr
/

Qwen2.5-3B-Instruct_math_sgrpo_balanced_0.5_0.5_True_1200

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-3B-Instruct_math_sgrpo_balanced_0.5_0.5_True_1200

Commit History

End of training

cdc8d3f
verified

shubhamprshr commited on 4 days ago

Model save

b71cd69
verified

shubhamprshr commited on 4 days ago

Training in progress, step 1200

bada89c
verified

shubhamprshr commited on 4 days ago

End of training

b0dcd03
verified

shubhamprshr commited on 11 days ago

Model save

9c07d81
verified

shubhamprshr commited on 11 days ago

Training in progress, step 1200

33d137c
verified

shubhamprshr commited on 11 days ago

initial commit

8519ede
verified

shubhamprshr commited on 12 days ago