citrinegui
/

Llama-3.2-3B-Instruct_countdown2345_grpo_classic_0.5_0.5_True_1600

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Llama-3.2-3B-Instruct_countdown2345_grpo_classic_0.5_0.5_True_1600 / .hydra

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

citrinegui's picture

Training in progress, step 1600

7f4b6c3 verified 7 days ago