XiaoY1
/

Qwen2-7B-Instruct-DPO-math-beta0.5

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Qwen2-7B-Instruct-DPO-math-beta0.5 / merges.txt

Commit History

Upload merges.txt with huggingface_hub

9ce7686
verified

XiaoY1 commited on Sep 9, 2024