XiaoY1
/

Qwen2-7B-Instruct-DPO-math-beta0.5

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Qwen2-7B-Instruct-DPO-math-beta0.5 / merges.txt

XiaoY1's picture

Upload merges.txt with huggingface_hub

9ce7686 verified 8 months ago

history contribute delete

1.67 MB

File too large to display, you can check the raw version instead.