qgallouedec
/

pythia-1b-tldr-online-dpo

Model card Files Files and versions Metrics Training metrics Community

pythia-1b-tldr-online-dpo

1 contributor

History: 2 commits

qgallouedec's picture

qgallouedec HF staff

Training in progress, step 500

6f1e11a verified 8 days ago