Prompt-completion datasets - a trl-lib Collection

trl-lib 's Collections

Preference datasets

Stepwise supervision datasets

Prompt-completion datasets

Prompt-only datasets

Unpaired preference datasets

Comparing DPO with IPO and KTO

Prompt-completion datasets

updated 7 days ago

trl-lib/tldr

Viewer • Updated 7 days ago • 130k • 620