DeepSeek (Tiefes Suchen), gegründet im Jahr 2023, konzentriert sich auf die Erforschung weltweit führender grundlegender Modelle und Technologien der allgemeinen künstlichen Intelligenz und stellt sich den Herausforderungen an der Spitze der KI. Basierend auf selbst entwickelten Trainingsframeworks, selbst aufgebauten Rechenclustern und Ressourcen wie Zehntausenden von Rechenkarten hat das Team von DeepSeek innerhalb von nur einem halben Jahr mehrere Modelle mit Milliarden von Parametern veröffentlicht und quelloffen gemacht, wie das DeepSeek-LLM allgemeine große Sprachmodell, das DeepSeek-Coder Code-Modell, und hat im Januar 2024 als erstes in China ein MoE-Modell (DeepSeek-MoE) quelloffen gemacht. Die großen Modelle haben in öffentlichen Bewertungsrankings und in der Generalisierungsleistung außerhalb von Trainingsdaten herausragende Leistungen gezeigt, die über denen vergleichbarer Modelle liegen. Mit DeepSeek AI zu kommunizieren und APIs zu nutzen, ist einfach.