Edit Models filters

Inference status

Misc

Inference Endpoints

AutoTrain Compatible

text-generation-inference

dataset:PKU-Alignment/PKU-SafeRLHF

4-bit precision

8-bit precision

Misc with no match

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

23

Full-text search

Active filters: PKU-Alignment/PKU-SafeRLHF

NCSOFT/Llama-3-OffsetBias-RM-8B

Text Classification • Updated 14 days ago • 2.05k • 17

NCSOFT/Llama-3-OffsetBias-8B

Text2Text Generation • Updated Jul 23 • 419 • 11

PKU-Alignment/beaver-7b-v1.0

Reinforcement Learning • Updated May 9 • 27 • 9

PKU-Alignment/beaver-7b-v1.0-reward

Reinforcement Learning • Updated Apr 20 • 175 • 16

PKU-Alignment/beaver-7b-v1.0-cost

Reinforcement Learning • Updated Apr 20 • 389 • 8

chargoddard/servile-harpsichord-cdpo

Text Generation • Updated Dec 10, 2023 • 700

chargoddard/piano-medley-7b

Text Generation • Updated Jan 4 • 705 • 6

LLM360/AmberSafe

Text Generation • Updated Feb 7 • 112 • 5

MaziyarPanahi/piano-medley-7b-Mistral-7B-Instruct-v0.1

Text Generation • Updated Jan 17 • 27

MaziyarPanahi/piano-medley-7b-Mistral-7B-Instruct-v0.1-GGUF

Text Generation • Updated Jan 27 • 126

PKU-Alignment/beaver-7b-v2.0

Reinforcement Learning • Updated May 9 • 7

PKU-Alignment/beaver-7b-v2.0-reward

Reinforcement Learning • Updated Apr 20 • 13

PKU-Alignment/beaver-7b-v2.0-cost

Reinforcement Learning • Updated Apr 20 • 7

PKU-Alignment/beaver-7b-v3.0

Reinforcement Learning • Updated May 9 • 179

PKU-Alignment/beaver-7b-v3.0-reward

Reinforcement Learning • Updated Apr 20 • 132

PKU-Alignment/beaver-7b-v3.0-cost

Reinforcement Learning • Updated Apr 20 • 16

PKU-Alignment/beaver-7b-unified-reward

Reinforcement Learning • Updated Apr 20 • 236

PKU-Alignment/beaver-7b-unified-cost

Reinforcement Learning • Updated Apr 20 • 469 • 1

wxzhang/dpo-selective-alpaca

Text Generation • Updated Apr 23 • 4

xiaodongguaAIGC/xdg-llama-3-8B

Text Generation • Updated Jun 24 • 31 • 2

mradermacher/piano-medley-7b-GGUF

Updated Jun 4 • 22

mradermacher/piano-medley-7b-i1-GGUF

Updated Aug 2 • 55

mradermacher/Llama-3-OffsetBias-8B-GGUF

Text2Text Generation • Updated Jul 22 • 80 • 1