Edit Models filters

Inference status

Misc

Inference Endpoints

AutoTrain Compatible

text-generation-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Misc with no match

text-embeddings-inference

Models

4,321

Full-text search

Active filters: dpo

mradermacher/Mistral-Nemo-Instruct-MCAI-SFT-DPO-revision-only-GGUF

Updated about 1 month ago • 208 • 1

mradermacher/Mistral-Nemo-Instruct-MCAI-SFT-DPO-revision-only-i1-GGUF

Updated about 1 month ago • 440 • 1

bartowski/Human-Like-Qwen2.5-7B-Instruct-GGUF

Text Generation • Updated Oct 7, 2024 • 190 • 2

VAGOsolutions/SauerkrautLM-v2-14b-DPO

Updated Nov 7, 2024 • 313 • 18

andito/SmolLM2-1.7B-Instruct-F16-GGUF

Updated Oct 31, 2024 • 95 • 1

HuggingFaceTB/SmolVLM-Instruct-DPO

Image-Text-to-Text • Updated Nov 26, 2024 • 395 • 16

sapienzanlp/Minerva-7B-instruct-v1.0

Text Generation • Updated Dec 5, 2024 • 2.81k • 14

sapienzanlp/Minerva-7B-instruct-v1.0-GGUF

Text Generation • Updated Dec 7, 2024 • 141 • 3

mradermacher/SauerkrautLM-v2-14b-DPO-GGUF

Updated Dec 10, 2024 • 101 • 1

mradermacher/SauerkrautLM-v2-14b-DPO-i1-GGUF

Updated Dec 10, 2024 • 262 • 1

XueyingJia/Qwen2-1.5B-instruct-dpo

Updated Dec 13, 2024 • 1

mradermacher/Llama-3-8B-Instruct-DPO-v0.3-GGUF

Updated Dec 13, 2024 • 51 • 1

mradermacher/Llama-3-8B-Instruct-DPO-v0.3-i1-GGUF

Updated Dec 13, 2024 • 109 • 1

mradermacher/janus-dpo-7b-GGUF

Updated Dec 13, 2024 • 157 • 1

mradermacher/janus-dpo-7b-i1-GGUF

Updated Dec 13, 2024 • 315 • 1

mradermacher/distilabeled-Marcoro14-7B-slerp-full-GGUF

Updated 28 days ago • 155 • 1

phunguyen01/II-Tulu-8B-DPO-Exp

Text Generation • Updated 28 days ago • 34 • 1

mradermacher/II-Tulu-8B-DPO-GGUF

Updated 25 days ago • 212 • 1

mradermacher/II-Tulu-8B-DPO-i1-GGUF

Updated 25 days ago • 406 • 1

mradermacher/distilabeled-Marcoro14-7B-slerp-full-i1-GGUF

Updated 28 days ago • 237 • 1

mgat1/SmolLM2-FT-DPO

Text Generation • Updated 27 days ago • 10 • 1

mradermacher/Llama-3.1-8B-sft-SPIN-self-GGUF

Updated 23 days ago • 340 • 1

mradermacher/llama-3-8b-DPO-GGUF

Updated 19 days ago • 369 • 1

mradermacher/Llama-3-8B-Instruct-64k-GGUF

Updated 16 days ago • 296 • 1

mradermacher/Llama-3-8B-Instruct-64k-i1-GGUF

Updated 16 days ago • 625 • 1

mradermacher/ContY-v0.2-8B-GGUF

Updated 12 days ago • 376 • 1

AIR-hl/Llama-3.2-3B-DPO

Text Generation • Updated 10 days ago • 79 • 2

li-muyang/zephyr-7b-dpo-full

Text Generation • Updated 9 days ago • 75 • 1

mradermacher/Llama-3.2-3B-DPO-GGUF

Updated 9 days ago • 308 • 1

mradermacher/lambda-qwen2.5-14b-dpo-test-GGUF

Updated 4 days ago • 326 • 1