OpenAIが「o3-mini」を発表トークンコストを削減に成功

更新日：2月27日

o1以上の性能を発揮

比較は数学、科学、プログラミング、知識において行われ、全てにおいてo1以上の性能だったことが発表されています。

なかでも「Competition coding（競技プログラミング）」はスコアが高く、o1と大きな差で高スコアを出しています

o3には推論のパフォーマンスを調整する機能があり、”高・中・低”を場合により使い分けることができます。

高推論努力ではほぼo1を上回りましたが、中推論努力以下ではo1と拮抗するスコアもあるようです。

※ソフトウェアエンジニアリング・PhDレベル科学問題では高推論努力でもo1に僅差で上回る

また「major errors（重大な誤答）」はo1-miniと比較して39％減少しており、推論の回答におけるハルシネーションは大幅に減少していると言えます。

ただ、これはo1-miniとの比較であること、知識の検索においては不明な為、依然ハルシネーションには注意しなければなりません。

o3-miniはレイテンシ（応答速度）とリクエスト処理効率の向上に注力されており、これによりトークンのコストを削減できたと発表されています。

GPTはトークン制（文字数でトークンが減る）仕組みですが、これはモデルによって異なります。

o3-miniは推論パフォーマンスを調整できるので、これにより効率的な処理ができるようになり、実質的なAPIの値下げが望めると思われます。

o1はブラウジングと同時に推論はできませんでしたが、o3-miniは可能です。

このため、今までは4oでリサーチした内容を、新しく別のチャットを開いてo1に投げる必要がありましたが、これを実質同時にできることになります。

「DeepSeekに対して、OpenAIはどのようにアプローチするべきか」のリサーチ内容から、推論過程を見ることができた。

注意として、4oのように自動的にブラウジングをしてくれないので、事前に「検索する」ボタンをONにする必要があります。

現状ハルシネーションがまだ危惧されますが、機能としては非常に便利です。

何一つ知識がない状態から、リサーチと結論まで持っていけるので、本当に人間が要らなくなりそうです。

現在リリースされている「o3-mini」と「o3-mini-high」のうち、「o3-mini」は無料ユーザーでも利用可能です。

Proユーザーは無制限、plus・teamユーザーは1日150回利用可能。

無料ユーザーは50回だと思われますが、トークンにより更に制限を受けるでしょう。

APIに関しては、中〜高ティアの（3～5 tier）ユーザーに対して解放されています。

これにはDeepSeekの影響があったと考えられています。

アルトマンがXでポストしたように、「新商品のリリースを急ぐ」とあったこと。

また、DeepSeekのようなAPI料金の激安価格、コスト削減の需要に追いつくため、より効率性の高いo3-miniを先に発表したと考えられます。

また、なぜo2ではなくo3なのかについても、欧州の通信サービスブランド「O2」との商標問題を避けるためだと考えられています。

※アルトマン氏の「うちのチームはネーミングセンスがあんまりないんだよ」という発言をどこかで見たが、未確認

我々が待ち望んでいるGPT-5についてですが、これについて後日記事にまとめる予定です。