ajagota71
/

pythia-410m-detox-irl-rlhf-seed-42

Reinforcement Learning

text-generation

text-generation-inference

Model card Files Files and versions Community

pythia-410m-detox-irl-rlhf-seed-42

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

ajagota71's picture

Final model after RLHF training

e701e6e verified 5 days ago