Elon Musk's Grok 3 vs ChatGpt vs Deepseek：今日の最高のAIチャットボットはどれですか？

Elon Musk's Xaiがついにリリースされました、その新しいAIモデルは、Openai、Deepseekなどの形で競争を上回ると述べています。しかし、それは配信しますか？

新しい推論機能とより多くのコンピューティングパワーにより、Grok 3は長い道のりを歩んできましたが、AIの専門家はまだその見通しについてフェンスにいます。利用可能なトップAIモデルに対してどのようにスタックするかを調べましょう。

Grok 3はAI推論のブレークスルーですか？

Mariia shalabaeva/unstplas

ムスクは、aでグローク3の家族を明らかにしましたxのライブストリーム、Grok 3 Reasoning（Beta）とGrok 3 Mini Reasoningを紹介します。従来の生成AIモデルとは異なり、理由ベースのAIは問題を「考え」、誤った情報や幻覚の可能性を最小限に抑えることができます。これは、AIの信頼性と精度を向上させる上で重要なマイルストーンです。

Xaiは、Grok 3がキーベンチマークでOpenaiのO1とDeepseek-R1を上回ると主張しています。 Chatbot Arenaのブラインドテストでは、Codename "Chocolate"の下にあるGrok 3は、市場への入場が遅れているにもかかわらず、業界のリーダーに追いついたことを証明しています。

chatgptは退位できますか？

先駆者にアンドレイ・カルパシー、Openaiの創設メンバーであり、元Tesla AIディレクターは、Grok 3をテストし、彼の洞察を共有しました。

彼によると、その深い検索推論機能を備えたGrok 3は、O1-Pro（月額200ドル）などのOpenaiのトップティアモデルと競争力があり、Deepseek-R1をわずかに上回っています。

この進歩にもかかわらず、KarpathyはGrok 3がChatGPTサブスクリプションをキャンセルさせるのに十分であるとは考えていません。

AI教授のイーサン・モリックは、この感情を反映し、「Grok 3が期待に応じて来た」と述べ、AI開発の重要な差別化要因であると計算力と速度が依存していると付け加えました。

Xaiのベンチマーク論争：彼らはGrok 3を覆いましたか？

Grok 3のパフォーマンスチャートはすぐにバイラルになり、主要な競合他社よりも優れています。しかし、OpenaiのRex Asaborはこれらの主張に挑戦し、示された「更新された」チャートを共有しました数学と科学のベンチマークでGrok 3を破ります。

OpenaiのO3はまだ公開されていませんが、この比較はXaiの主張に懐疑論の層を追加します。

すべての公平において、Xaiはテストを実行したときに最近のOpenaiベンチマークスコアを知っていなかったかもしれません。それにもかかわらず、これはAIレースが終わっていることを思い出させるものです。

Grok 3の指数成長：氷山の先端？

疑いのあるものにもかかわらず、Grok 3のクイック開発は否定できません、Mashableは書いています。GoogleとOpenaiは、それぞれ13年と8年の開発の長年のヘッドスタートを楽しんでいましたが、Xaiは2023年に発表されました。それでも、Grok 3はすでに大手AIモデルとして議論に参加しています。

マスクはまた、Grok 3がGrok 2の計算容量の10倍で訓練され、200,000 GPUを使用して訓練されたことを示しました。これは、コンピューティングの量を増やすとAIパフォーマンスが向上するという一般的なルールを再確認します。

ただし、ゲイリーマーカスなどの研究者は、コンピューティングをスケーリングすることで、特定のしきい値を超えてAIインテリジェンスがさらに向上するかどうかは疑問を呈しています。

Grok 3の制限：まだ進行中の作業

Grok 3は長い道のりを歩んできましたが、他のAIモデルと同じ問題の多くをまだ経験しています。

弱いユーモアの能力：多くのAIモデルと同様に、Grok 3は、頻繁にお父さんのジョークに頼ることが多いユーモアを生み出すためのスキルが低いです。
SVG画像生成の課題：AIモデルは、しばしば複雑な視覚要素を配置するのに苦労しています。 Grok 3は、Gemini 1.5 Flashなどの代替案を上回っていますが、それでも空間的な関係の問題に苦しんでいました。
政治的偏見の問題：マスクは、政治的正しさのために批判されてきたAIモデルに対する「目の覚醒」カウンターポイントとしてGrokを組み立てました。しかし、Karpathyは、Grok 3がいくつかの倫理的課題について議論していないことを発見し、Muskの聴衆が望むよりも「過度に敏感」になる可能性があることを発見しました。

マスクは過去に、公開されているトレーニング資料が残っている傾向があるため、以前のGROKモデルが残っていると偏っていると述べています。彼が誓った将来の更新は、グロークを政治的により中立にします。