DeepSeek-R1

DeepSeek-R1

En ligne

L'équipe présente ses premiers modèles de raisonnement de première génération, DeepSeek - R1 - Zero et DeepSeek - R1. DeepSeek - R1 - Zero, formé via un apprentissage par renforcement à grande échelle sans SFT, montre une capacité de raisonnement remarquable mais présente également des problèmes comme des répétitions sans fin. DeepSeek - R1, qui intègre des données de démarrage à froid avant l'apprentissage par renforcement, résout ces problèmes et atteint des performances comparables à celles d'OpenAI - o1. L'équipe a rendu ces modèles open source ainsi que six autres modèles distillés, avec DeepSeek - R1 - Distill - Qwen - 32B surpassant OpenAI - o1 - mini dans les benchmarks.

Dernière mise à jour: 2025/5/29

Sites connexes

OpenRouter est une interface unifiée qui donne accès à une large gamme de modèles de langage à grande taille (LLMs) auprès de divers fournisseurs, notamment des modèles propriétaires et open-source. Elle propose des prix plus avantageux, une meilleure fiabilité et n'exige aucun abonnement.

Alibaba publie le grand modèle Qwen3, 235 milliards de paramètres supportant 119 langues, pionnier du raisonnement hybride 'Pensée Rapide/Pensée Profonde', surpassant Gemini 2.5 Pro en capacités mathématiques/code, déployable avec quatre GPU

OpenAI a développé une nouvelle série de modèles d'IA conçus pour passer plus de temps à réfléchir avant de répondre. Voici les dernières nouvelles sur la recherche o1, les produits et autres mises à jour.

Gemini Pro 1.5

Gemini Pro 1.5 est un modèle d'IA multimodal lancé par Google, prenant en charge le traitement de contextes ultra-longs, doté de capacités de compréhension d'images et de textes, de génération de code et de raisonnement complexe, adapté à divers scénarios tels que la création de contenu, l'assistance au développement et l'analyse de données.

Commentaires

Laisser un commentaire

Partagez vos pensées sur cette page. Tous les champs marqués d'un * sont obligatoires.

Commentaires

0

Note du site

9

Action rapide

Visiter le site

Lables

open source

一键轻松打造你的专属AI应用

Vidnoz Flex: Maximize the Power of Videos

搭建您的专属大模型主页