longlian
/

Qwen2-0.5B-GRPO-peft-demo

Generated from Trainer

Model card Files Files and versions

Qwen2-0.5B-GRPO-peft-demo / tokenizer.json

Commit History

Training in progress, step 10

f91f181
verified

longlian commited on Feb 14