yyqoni
/

rlhflow-llama-3-sft-8b-v2-token-ppo-60k

Text Generation

text-generation-inference

Model card Files Files and versions Community

rlhflow-llama-3-sft-8b-v2-token-ppo-60k

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

yyqoni's picture

Update README.md

9a24586 verified 4 months ago