DeepSeek-R1

DeepSeek-R1

Online

Das Team stellt seine Modelle der ersten Generation für logisches Denken vor, DeepSeek - R1 - Zero und DeepSeek - R1. DeepSeek - R1 - Zero, das durch groß angelegtes RL ohne SFT trainiert wurde, zeigt bemerkenswerte Fähigkeiten im logischen Denken, hat aber auch Probleme wie endlose Wiederholungen. DeepSeek - R1, das Kaltstart-Daten vor RL einbezieht, löst diese Probleme und erreicht eine Leistung, die mit OpenAI - o1 vergleichbar ist. Das Team hat diese Modelle und sechs destillierte Versionen quelloffen gemacht, wobei DeepSeek - R1 - Distill - Qwen - 32B in Benchmarks besser abschneidet als OpenAI - o1 - mini.

Zuletzt aktualisiert: 2025/5/29

Kommentare

Kommentar schreiben

Teile deine Gedanken. Felder mit * sind Pflichtfelder.

Ihre E-Mail-Adresse wird nicht öffentlich angezeigt

Kommentare

0

Bewertung

9

Beschriftungen

open source

Schnelle Aktion

一键轻松打造你的专属AI应用
Vidnoz Flex: Maximize the Power of Videos
搭建您的专属大模型主页