citrinegui
/

Llama-3.2-3B-Instruct_countdown2345_grpo_classic_0.5_0.5_True_1600

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Llama-3.2-3B-Instruct_countdown2345_grpo_classic_0.5_0.5_True_1600 / main.log

citrinegui's picture

Training in progress, step 1600

7f4b6c3 verified 10 days ago

322 kB

File too large to display, you can check the raw version instead.