DeepSeek-R1

DeepSeek-R1

온라인

팀은 첫 번째 세대 추론 모델인 DeepSeek-R1-Zero와 DeepSeek-R1을 소개합니다. SFT 없이 대규모 RL을 통해 훈련된 DeepSeek-R1-Zero는 놀라운 추론 능력을 보이지만 끝없는 반복과 같은 문제도 있습니다. RL 전에 콜드 스타트 데이터를 통합한 DeepSeek-R1은 이러한 문제를 해결하고 OpenAI-o1과 동등한 성능을 달성합니다. 팀은 이러한 모델과 6개의 증류된 모델을 오픈 소스로 공개했으며, DeepSeek-R1-Distill-Qwen-32B는 벤치마크에서 OpenAI-o1-mini를 능가하는 성능을 보입니다.

최종 업데이트: 2025/5/29

관련 사이트

ChatDLM

ChatDLM은 자동회귀와는 다르며, Diffusion(확산) 기반의 언어 모델로, MoE 구조를 통해 속도와 품질을 동시에 확보했습니다.

지푸AI가 선보인 AutoGLM 명상은 GUI 조작과 명상 능력을 결합한 첫 데스크탑 에이전트 프로그램으로, 자체 개발한 기반 모델 GLM-4-Air-0414와 GLM-Z1-Rumination을 통해 깊은 사고와 실시간 실행을 가능하게 합니다. 이 도구는 브라우저 내에서 자율적으로 검색/분석/검증/요약의 완전한 작업 흐름을 완료할 수 있으며, 소수 여행 가이드 제작 및 전문 연구 보고서 생성과 같은 복잡한 작업 처리도 지원합니다. 동적 도구 호출과 자가 진화 강화 학습 특성을 갖추고 있으며 완전 무료로, 현재 Beta 테스트 단계에 있습니다.

딥시크(DeepSeek)는 2023년에 설립되어 세계적인 수준의 범용 인공지능 기반 모델과 기술 연구에 집중하며, 인공지능의 최전선에 도전하고 있습니다. 자체 개발한 훈련 프레임워크, 자체 구축한 지능형 컴퓨팅 클러스터 및 수만 개의 컴퓨팅 카드 등과 같은 리소스를 바탕으로, 딥시크 팀은 불과 반년 만에 수백억 개의 파라미터를 가진 대형 모델인 DeepSeek-LLM 범용 대형 언어 모델과 DeepSeek-Coder 코드 대형 모델을 발표하고 오픈소스로 공개했습니다. 또한 2024년 1월에는 국내 최초의 MoE 대형 모델(DeepSeek-MoE)을 오픈소스로 공개하며, 각 대형 모델은 공개 평가 및 실제 샘플 외의 일반화 효과에서 동급 모델을 뛰어넘는 뛰어난 성능을 보였습니다. DeepSeek AI와 대화하며, 쉽게 API에 접속할 수 있습니다.

mistral-community/pixtral-12b-240910 · Hugging Face

Pixtral-12B는 Mistral AI가 개발한 강력한 모델 체크포인트로, 고급 이미지 및 텍스트 처리 작업을 위해 설계되었습니다. 이 모델은 텍스트 데이터와 함께 이미지와 URL의 통합을 지원하여 다양한 애플리케이션에서의 기능을 강화합니다. 이 모델은 Hugging Face에서 다운로드할 수 있으며 개발자들이 프로젝트에 구현할 수 있는 사용자 친화적인 인터페이스를 제공합니다.

댓글

댓글 작성

의견을 공유해주세요. * 표시가 있는 항목은 필수입니다.

댓글

0

평점

9

빠른 액션

웹사이트 방문

라벨

open source

一键轻松打造你的专属AI应用

搭建您的专属大模型主页