top of page

Grok 3はChatGPTを超えるのか? 揺らぐAIユーザーの選択

  • 執筆者の写真: NKimetenai
    NKimetenai
  • 2月23日
  • 読了時間: 4分

更新日:2月27日

先日公開されたxAI新モデル”Grok 3”により、ChatGPTユーザーは揺れている。

Grok 3は発表配信でも、OpenAIや他のLLMと比較して、ベンチマークや進化速度で圧倒的な成果を強調した。


一部では、OpenAIのサブスクリプションを解約する動きすら見られる。海外の技術系インフルエンサーの中には、Grok 3がChatGPTより優れていると評価する声が多い。

その要因として、Grok 3のフィルタリングの弱さ、自由な発言が可能な点が挙げられる。

実際、X上では、Grok 3の開発者向け音声モードでFワードを連発する動画が投稿され、ChatGPT音声モードが理性的な議論を促すのに対し、Grok 3は「お前はF×××ing外交官ごっこがしたいのか?」と挑発的な発言をする。また、画像生成のフィルタリングも開放的であり、著名人をモデルとした画像の生成も可能だ。こうした態度が、自由の象徴として一部ユーザーに好感を与えている模様だ。


Grok 3の音声モードとChatGPTを比較したツイート。Grok 3は無フィルターな挑発的発言を行い、ChatGPTは礼儀正しい対話を重視している様子が映し出されている。
動画内で執拗にFワードを連発するGrok 3。クリックで動画へジャンプ。

また、LLM業界は秘匿性が高く、OpenAIは自社モデルの詳細をほとんど公開していない。今月13日に一部仕様がオープンソース化されたが、これは倫理的評価用のプロンプトとモデル仕様の公開にとどまっている。なお、以前のGPT‐2は完全なオープンソースモデルだったが、リリースは2019年2月であり、指数関数的に進化するLLM業界においては透明性が十分とは言えない。

一方、オープンソースLLMとして台頭しているDeepSeekは、モデルの全データを公開し、蒸留モデルを個人のデスクトップでオンデバイスAIとして利用可能にしている。この透明性が、OpenAIのブラックボックス体質への不満を呼んだ。

OpenAIは推論過程や一部オープンソース化を進めたが、大企業特有の秘密主義が依然として残っている。


OpenAI公式サイトのスクリーンショット:「Sharing the latest Model Spec」2025年2月12日公開。モデル仕様の更新内容と、カスタマイズ性や透明性の向上について説明されているページ。
OpenAIの公式サイトの声明

こうした背景の中、Grok 3のフィルタリングの弱さはかえって好感を得ている。

Grok 3はユーザーが感じていた不満を一気に解消したかのように、全機能の推論過程の透明性を高め、無料ユーザーでも深層検索機能などを制限付きで利用できるようにした。

また、Grok 3のリリースに伴い、xAIは前モデルのGrok 2をオープンソース化すると明言しており、既にGrok 1はオープンソース化されている。


Grokシリーズは開発スピードも非常に速い。2023年中期に開発を開始し、同年内にGrok 1をリリース。そこから1年足らずでGrok 2が登場し、Grok 3のリリースまで初期モデルから17ヶ月という短期間で進化した。この速さはDeepSeekの再来を予感させる。

ベンチマークでも、Grok 2はMMLU精度がGPT-4oに迫る水準に達し、Grok 3はすでにAIME‘25の精度でo3-miniを超えたと公式的に発表しており、これが「地球上で最も賢いAI」と自負する根拠だ。


このグラフは、AIME 2025ベンチマークにおける各LLMの推論能力と計算性能を示しています。Grok 3 Reasoning Betaが93ポイントで最も高いスコアを記録し、次いでGrok 3 mini Reasoning(90)、o3mini(87)、o1(79)、Deepseek-R1(75)、Gemini-2 Flash Thinking(54)の順となっています。Grok 3シリーズが特に高い推論性能を示しており、競争力の高さが際立っています。

このベンチマークに関してOpenAI従業員は疑問を呈しており、第三者機関による公式的なベンチマークが待たれるが、ユーザーがGrok 3に乗り換える動機としては十分な根拠になるだろう。


Grok 3の評価に関する疑惑:o3-miniの方が優れているとの指摘  この投稿では、Boris Power氏がGrokチームが評価で不正を行い、誤解を招いている可能性について指摘しています。彼は「o3-miniはGrok 3よりすべての評価で優れている」と主張し、Grok 3の性能は悪くないものの、誇張する必要はないとコメントしています。
「o3-mini は、Grok 3 と比較して、あらゆる評価において優れている。Grokは過剰に売り込む必要はない」と発言

また、マルチモーダルAIとしての性能も大きな魅力だ。音声、画像認識、生成、推論など多機能を統合したGrok 3は、競合他社がモデルを乱立する中で一歩リードしたと言える。

OpenAIはGPTシリーズでマルチモーダルAIを提供しているが、現行のGPT‐4oはGPT‐4の改良版にすぎず、正統な次世代モデルはリリースされていない。

一方、OpenAIの推論モデルであるoシリーズはアップデートが続けられており、深層検索モデルDeep Researchはo3で動作しているとアルトマンが述べている。

こうした中、推論モデルで常に先行してきたOpenAIも、今度はGrok 3が背後から迫っている。


OpenAIにとって、またしても強力なライバルが出現したと言えるだろう。

Grok 3はChatGPTの代替モデルとして魅力的だが、今後数か月以内にリリースされるとされるGPT-4.5や、完全なマルチモーダルモデルであるGPT‐5の登場も予想される。

OpenAIは過去にもDeep ResearchやOperator、推論モデルなど、常に革新的な機能を公開してきた。深層検索モデルや推論モデルが一般に浸透したのは、彼らが先駆者としてリリースしたからだ。Grok 3は先行モデルをなぞっているにすぎない。

ChatGPTユーザーである筆者個人としては、現時点でGrok 3に浮気するのは早いと考えている。

今後、Grok 3のさらなるアップデートと、GPTシリーズの新たな革新がAIの未来を大きく切り拓くことは明白であり、我々はその動向に注視せざるを得ないだろう。



bottom of page