estnafinema0
/

smolLM-variation-ppo

Text Generation

Proximal Policy Optimization

text-generation-inference

Model card Files Files and versions Community

smolLM-variation-ppo

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

estnafinema0's picture

Update README.md

8b64bc1 verified about 1 month ago