top of page

”Manus AI” がタスク解決能力でOpenAIを圧倒、仮想マシンでネットを自律的に巡回可能

  • 執筆者の写真: NKimetenai
    NKimetenai
  • 3月9日
  • 読了時間: 2分

更新日:3月15日

現在、注目を集めている招待制のタスク自動化AIエージェント ”Manus AI(マナス)” が話題になっている。

このエージェントは、中国出身の起業家ジ・イーチャオ氏(Ji Yichao)が設立したmanus(もしくはPeak Labs)が開発しているもので、タスク解決に特化した高度なAIとして知られる。


Manus AIは、従来の知識問題を評価するベンチマーク(Humanity’s Last ExamやMMLUなど)ではなく、タスク解決能力を評価するベンチマーク「GAIA(General AI Agents)」の精度を公開している。

公式発表によれば、このベンチマークにおいて、Manus AIはOpenAI Deep Researchを最大約12%上回る精度を記録している。そのため、従来の知識型AIとは異なり、実務的で柔軟な対応力が評価されており、SNS上でも好意的な反応が多く見られる。


GAIAベンチマークにおけるManus AI(pass@1)とOpenAI Deep Research(pass@1)、Previous SOTAの精度比較を示した棒グラフ。Manus AIが全ての難易度レベル(Level 1~3)において他のモデルを大きく上回っていることがわかる。特に最も難易度の高いLevel 3では、Manus AIが57.7%、OpenAI Deep Researchが47.6%、Previous SOTAが42.3%と大差をつけている。

特に評価されているのは、タスク遂行中の柔軟性と自己解決能力の高さである。ユーザーは作業途中で指示を変更したり、介入したりすることが可能で、Manus AIはそうした動きにもスムーズに対応する。このため、従来のエージェントのように同じ作業を繰り返しスタックしてしまうリスクが低いとされる。


また、Manus AIは単純なタスク実行だけでなく、プログラミングやデータ分析など高度な推論を必要とする作業もこなせることから、「頼れる優秀なアシスタント」のように活用することも期待されている。ただし、テスターの中には処理速度についての不満も報告されており、現在は注目度の高さゆえにサーバー負荷が高まっている可能性が指摘されている。


紹介動画では、データ分析からグラフ化、さらにはそのデータを活用したウェブサイトの構築・公開までの一連の作業が紹介されている。

さらに重要なのが、Manusが中国系のスタートアップでありながらも、中国当局の検閲対象ではない可能性が高い

創業者のジ・イーチャオ氏は過去に米国で「Peak Labs」を設立しているため、Manusも同様に米国での登記と推測される。ただし、Manusの詳細な登記住所や企業情報については現時点で不明である。


今後、正式リリースに向けて料金体系やアクセスの安定化などが焦点となるだろうが、実用的なAIとしての潜在力は極めて高く、今年後半にはモデルの一部がオープンソース化される計画もあるため、開発者やユーザーコミュニティからのさらなる注目が集まりそうだ。

bottom of page