shubhamprshr
/

Llama-3.2-3B-Instruct_blocksworld1246_sgrpo_classic_0.5_0.5_True_300

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Llama-3.2-3B-Instruct_blocksworld1246_sgrpo_classic_0.5_0.5_True_300 / main.log

Commit History

Training in progress, step 1200

f38b355
verified

shubhamprshr commited on 14 days ago

Training in progress, step 900

a3157a6
verified

shubhamprshr commited on 14 days ago

Training in progress, step 600

0f8dfc5
verified

shubhamprshr commited on 14 days ago

Training in progress, step 300

c3e7cbc
verified

shubhamprshr commited on 14 days ago