shubhamprshr
/

Llama-3.2-3B-Instruct_blocksworld1246_sgrpo_classic_0.5_0.5_True_300

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Llama-3.2-3B-Instruct_blocksworld1246_sgrpo_classic_0.5_0.5_True_300

Commit History

End of training

363e705
verified

shubhamprshr commited on 10 days ago

Model save

b14f172
verified

shubhamprshr commited on 10 days ago

Training in progress, step 1200

f38b355
verified

shubhamprshr commited on 10 days ago

Training in progress, step 900

a3157a6
verified

shubhamprshr commited on 10 days ago

Training in progress, step 600

0f8dfc5
verified

shubhamprshr commited on 10 days ago

Training in progress, step 300

c3e7cbc
verified

shubhamprshr commited on 10 days ago

initial commit

c85f307
verified

shubhamprshr commited on 10 days ago