Likhith003
/

dpo-llmjudge-lora-adapter

Text Generation

preference-optimization

instruction-tuning

text-generation-inference

Model card Files Files and versions Community

dpo-llmjudge-lora-adapter

Commit History

Update README.md

dda2169
verified

Likhith003 commited on 18 days ago

Upload README.md with huggingface_hub

1b55dd9
verified

Likhith003 commited on 18 days ago

Upload folder using huggingface_hub

ff81aac
verified

Likhith003 commited on 18 days ago

initial commit

cfde71e
verified

Likhith003 commited on 18 days ago