longlian
/

Qwen2-0.5B-GRPO-peft-demo

Generated from Trainer

Model card Files Files and versions

Qwen2-0.5B-GRPO-peft-demo / training_args.bin

Commit History

Training in progress, step 10

5d99cbd
verified

longlian commited on Feb 14

Training in progress, step 10

45f9918
verified

longlian commited on Feb 14

Training in progress, step 10

f91f181
verified

longlian commited on Feb 14