開発者と技術者向けのAIツール
Claude 4はAnthropicによる先進的なAIモデルのスイートで、Claude Opus 4とClaude Sonnet 4を含みます。これらのモデルは、コーディング、複雑な推論、エージェントワークフローにおいて大きな飛躍を遂げています。
WanAIは、先進的な人工知能と大規模モデルを活用してアートワークを生成するAI駆動のクリエイティブ描画ツールです。ユーザーはプロンプトを入力したり、さまざまなスタイルから選択したりすることで、ユニークな絵画やイラストを作成できます。このプラットフォームは、アマチュアとプロのアーティストの両方に対応しており、直感的なインターフェースと幅広いカスタマイズオプションを提供しています。WanAIを使えば、ユーザーは新たな創造の可能性を探求し、アーティスティックなワークフローを効率化できます。
Gemini Pro 1.5はGoogleが提供するマルチモーダルAIモデルで、超長文コンテキスト処理をサポートし、画像とテキストの理解、コード生成、複雑な推論能力を持ち、コンテンツ作成、開発支援、データ分析などさまざまなシナリオに適用可能です。
智譜AIが発表したAutoGLMは、GUI操作と深い思考能力を組み合わせた初めてのデスクトップエージェントプログラムで、独自開発の基盤モデルGLM-4-Air-0414とGLM-Z1-Ruminationによって深い思考とリアルタイム実行を実現しています。このツールは、ブラウザ内で検索/分析/検証/要約の完全なワークフローを自律的に完了することができ、ニッチな旅行ガイドの作成や専門的な研究報告の生成などの複雑なタスク処理をサポートし、動的なツール呼び出しと自己進化的強化学習特性を備えており、完全に無料で、現在Betaテスト段階にあります。
ChatDLMは自己回帰型とは異なり、Diffusion(拡散)に基づく言語モデルで、MoEアーキテクチャを採用し、速度と品質を両立しています。
深層探求(DeepSeek)は2023年に設立され、世界をリードする汎用人工知能の基盤モデルと技術の研究に焦点を当て、人工知能の最先端の難題に挑戦しています。自社開発のトレーニングフレームワーク、自社構築のインテリジェントコンピューティングクラスタ、および万単位の計算リソースなどを基に、DeepSeekチームはわずか半年で複数の百億パラメータを持つ大規模モデルをリリースし、オープンソース化しました。例えば、DeepSeek-LLM汎用大規模言語モデル、DeepSeek-Coderコード大規模モデルなどがあり、2024年1月には国内初のMoE大規模モデル(DeepSeek-MoE)をいち早くオープンソース化しました。これらの大規模モデルは公開評価ランキングおよび実サンプル外の汎化効果において、同クラスのモデルを超える優れたパフォーマンスを示しています。DeepSeek AIとの対話により、APIへの簡単なアクセスが可能です。
微調整、蒸留、どこにでも展開可能なオープンソースAIモデル。最新モデルは8B、70B、405Bのバリエーションで利用可能です。
AlibabaがQwen3大規模モデルをリリース、2350億のパラメータが119言語をサポート、『高速思考/深層思考』ハイブリッド推論を先駆け、数学/コード能力でGemini 2.5 Proを凌駕、4つのGPUで展開可能
Claude 3.7:Anthropicの最新AIマイルストーン、ハイブリッド推論能力が未来をリード
Playgroundは、OpenAIが提供するオンラインインタラクティブツールで、GPT-3.5、GPT-4、GPT-4oなどの言語モデルの能力をテストし探索するためのものです。特に開発者、コンテンツクリエイター、プロダクトマネージャー、そしてコードを書かずにAIモデルと対話したい人々に最適です。
チームは初代推論モデル、DeepSeek-R1-ZeroとDeepSeek-R1を紹介します。DeepSeek-R1-Zeroは、SFTなしで大規模なRLを介して訓練され、顕著な推論能力を示しますが、終わりのない繰り返しなどの問題もあります。RL前にコールドスタートデータを組み込んだDeepSeek-R1は、これらの問題を解決し、OpenAI-o1と同等の性能を達成します。チームはこれらのモデルと6つの蒸留モデルをオープンソース化し、DeepSeek-R1-Distill-Qwen-32BはベンチマークでOpenAI-o1-miniを上回りました。
本日、私たちはClaude 3モデルファミリーを発表します。これは、幅広い認知タスクにおいて新たな業界基準を設定するものです。このファミリーには、能力の昇順で、最先端の3つのモデルが含まれています:Claude 3 Haiku、Claude 3 Sonnet、そしてClaude 3 Opusです。
推論を使用して大量のオンライン情報を統合し、多段階の研究タスクを完了するエージェント。本日Proユーザーに利用可能、PlusとTeamは次回。
私たちは、音声、視覚、テキストをリアルタイムで推論できる新しいフラッグシップモデル、GPT-4 Omniを発表します。
Anthropic社のAIアシスタント、Claudeと会話しましょう
OpenAIは、応答前にさらに多くの時間をかけて考えるように設計された新しいシリーズのAIモデルを開発しました。ここでは、o1の研究、製品、その他の最新情報をご紹介します。
どこでも微調整、蒸留、展開可能なオープンソースAIモデル。最新モデルは8B、70B、405Bのバリアントで利用可能です。
新しいタブで開く
Pixtral-12Bは、Mistral AIによって開発された強力なモデルチェックポイントで、高度な画像およびテキスト処理タスクのために設計されています。テキストデータとともに画像やURLの統合をサポートし、さまざまなアプリケーションでの能力を強化しています。このモデルはHugging Faceでダウンロード可能で、開発者がプロジェクトに実装するためのユーザーフレンドリーなインターフェースを提供します。
OpenRouterは、プロプライエタリモデルやオープンソースモデルを含む、さまざまなプロバイダーからの大規模言語モデル(LLM)へのアクセスを提供する統一インターフェースです。より良い価格、改善された稼働時間を提供し、サブスクリプションは必要ありません。
Gemini 2.5はGoogleの最新の思考AIモデルシリーズで、Flash(高速、コスト効率が良い)とPro(高度な推論)のバリアントがあります。マルチモーダル入力、ネイティブオーディオ、長いコンテキスト、Deep Thinkモードをサポートし、コーディング、数学、推論において常にベンチマークをリードしています。
Gemini 2.0 私たちがこれまでに開発した中で最も能力の高いAIモデルで、エージェント時代に向けて構築されました。
FLUX.1 Kontextは、ブラックフォレストラボ(BFL)によってリリースされた高度な生成AIモデルで、画像生成と編集に焦点を当てています。従来のテキストから画像へのモデルとは異なり、FLUX.1 Kontextはコンテキストを意識した画像処理をサポートし、ユーザーがテキストと画像を同時に入力することで、より柔軟で正確な画像の作成と編集を実現します。