fangwu97
/

Qwen2.5-0.5B-Instruct-GRPO-test

Generated from Trainer

Model card Files Files and versions Community

Qwen2.5-0.5B-Instruct-GRPO-test / merges.txt

Commit History

Training in progress, step 10

db341c8
verified

fangwu97 commited on Apr 10