laolaorkk
/

Qwen2.5-1.5B-R1-GRPO-debug

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-1.5B-R1-GRPO-debug

Commit History

Model save

ec36b72
verified

laolaorkk commited on Feb 5

Model save

08b051f
verified

laolaorkk commited on Feb 4

Model save

0a1e3c4
verified

laolaorkk commited on Feb 4

Model save

9a49607
verified

laolaorkk commited on Feb 4

initial commit

aeac4e4
verified

laolaorkk commited on Feb 3