OpenAIが「o3-mini」を発表 トークンコストを削減に成功
- NKimetenai
- 2月1日
- 読了時間: 3分
更新日:2月27日
o1以上の性能を発揮
比較は数学、科学、プログラミング、知識において行われ、全てにおいてo1以上の性能だったことが発表されています。
なかでも「Competition coding(競技プログラミング)」はスコアが高く、o1と大きな差で高スコアを出しています
o3には推論のパフォーマンスを調整する機能があり、”高・中・低”を場合により使い分けることができます。
高推論努力ではほぼo1を上回りましたが、中推論努力以下ではo1と拮抗するスコアもあるようです。
※ソフトウェア エンジニアリング・PhDレベル科学問題では高推論努力でもo1に僅差で上回る
また「major errors(重大な誤答)」はo1-miniと比較して39%減少しており、推論の回答におけるハルシネーションは大幅に減少していると言えます。
ただ、これはo1-miniとの比較であること、知識の検索においては不明な為、依然ハルシネーションには注意しなければなりません。
o3-miniはレイテンシ(応答速度)とリクエスト処理効率の向上に注力されており、これによりトークンのコストを削減できたと発表されています。
GPTはトークン制(文字数でトークンが減る)仕組みですが、これはモデルによって異なります。
o3-miniは推論パフォーマンスを調整できるので、これにより効率的な処理ができるようになり、実質的なAPIの値下げが望めると思われます。
ブラウジングが可能
o1はブラウジングと同時に推論はできませんでしたが、o3-miniは可能です。
このため、今までは4oでリサーチした内容を、新しく別のチャットを開いてo1に投げる必要がありましたが、これを実質同時にできることになります。
「DeepSeekに対して、OpenAIはどのようにアプローチするべきか」のリサーチ内容から、推論過程を見ることができた。
注意として、4oのように自動的にブラウジングをしてくれないので、事前に「検索する」ボタンをONにする必要があります。
現状ハルシネーションがまだ危惧されますが、機能としては非常に便利です。
何一つ知識がない状態から、リサーチと結論まで持っていけるので、本当に人間が要らなくなりそうです。
無料ユーザーでも使用可能
現在リリースされている「o3-mini」と「o3-mini-high」のうち、「o3-mini」は無料ユーザーでも利用可能です。
Proユーザーは無制限、plus・teamユーザーは1日150回利用可能。
無料ユーザーは50回だと思われますが、トークンにより更に制限を受けるでしょう。
APIに関しては、中〜高ティアの(3~5 tier)ユーザーに対して解放されています。
なぜo3-miniなのか
これにはDeepSeekの影響があったと考えられています。
アルトマンがXでポストしたように、「新商品のリリースを急ぐ」とあったこと。
また、DeepSeekのようなAPI料金の激安価格、コスト削減の需要に追いつくため、より効率性の高いo3-miniを先に発表したと考えられます。
また、なぜo2ではなくo3なのかについても、欧州の通信サービスブランド「O2」との商標問題を避けるためだと考えられています。
※アルトマン氏の「うちのチームはネーミングセンスがあんまりないんだよ」という発言をどこかで見たが、未確認
我々が待ち望んでいるGPT-5についてですが、これについて後日記事にまとめる予定です。