top of page

OpenAIが「o3-mini」を発表 トークンコストを削減に成功

  • 執筆者の写真: NKimetenai
    NKimetenai
  • 2月1日
  • 読了時間: 3分

更新日:2月27日

o1以上の性能を発揮

比較は数学、科学、プログラミング、知識において行われ、全てにおいてo1以上の性能だったことが発表されています。

なかでも「Competition coding(競技プログラミング)」はスコアが高く、o1と大きな差で高スコアを出しています


o3-miniのコーディング性能を示すグラフ
highでは大きな差をつけ、lowでもo1に迫るスコア

o3には推論のパフォーマンスを調整する機能があり、”高・中・低”を場合により使い分けることができます。

高推論努力ではほぼo1を上回りましたが、中推論努力以下ではo1と拮抗するスコアもあるようです。

ソフトウェア エンジニアリング・PhDレベル科学問題では高推論努力でもo1に僅差で上回る

o3-miniのエラー率減少を示すグラフ
mediumで比較した際、大きくエラーが減少しているのがわかる

また「major errors(重大な誤答)」はo1-miniと比較して39%減少しており、推論の回答におけるハルシネーションは大幅に減少していると言えます。

ただ、これはo1-miniとの比較であること、知識の検索においては不明な為、依然ハルシネーションには注意しなければなりません。


o3-miniはレイテンシ(応答速度)とリクエスト処理効率の向上に注力されており、これによりトークンのコストを削減できたと発表されています。

GPTはトークン制(文字数でトークンが減る)仕組みですが、これはモデルによって異なります。


o3-miniは推論パフォーマンスを調整できるので、これにより効率的な処理ができるようになり、実質的なAPIの値下げが望めると思われます。




ブラウジングが可能

o1はブラウジングと同時に推論はできませんでしたが、o3-miniは可能です。

このため、今までは4oでリサーチした内容を、新しく別のチャットを開いてo1に投げる必要がありましたが、これを実質同時にできることになります。




「DeepSeekに対して、OpenAIはどのようにアプローチするべきか」のリサーチ内容から、推論過程を見ることができた。


注意として、4oのように自動的にブラウジングをしてくれないので、事前に「検索する」ボタンをONにする必要があります。


現状ハルシネーションがまだ危惧されますが、機能としては非常に便利です。

何一つ知識がない状態から、リサーチと結論まで持っていけるので、本当に人間が要らなくなりそうです



無料ユーザーでも使用可能

現在リリースされている「o3-mini」と「o3-mini-high」のうち、「o3-mini」は無料ユーザーでも利用可能です。


Proユーザーは無制限、plus・teamユーザーは1日150回利用可能。

無料ユーザーは50回だと思われますが、トークンにより更に制限を受けるでしょう。


APIに関しては、中〜高ティアの(3~5 tier)ユーザーに対して解放されています。



なぜo3-miniなのか

これにはDeepSeekの影響があったと考えられています。

アルトマンがXでポストしたように、「新商品のリリースを急ぐ」とあったこと。

また、DeepSeekのようなAPI料金の激安価格、コスト削減の需要に追いつくため、より効率性の高いo3-miniを先に発表したと考えられます。


また、なぜo2ではなくo3なのかについても、欧州の通信サービスブランド「O2」との商標問題を避けるためだと考えられています。

※アルトマン氏の「うちのチームはネーミングセンスがあんまりないんだよ」という発言をどこかで見たが、未確認


我々が待ち望んでいるGPT-5についてですが、これについて後日記事にまとめる予定です。








bottom of page