メインコンテンツへスキップ
中級12分で読める

Sakana AIのFugu(フグ)とは?特徴・料金・ベンチマークをやさしく解説

日本発のSakana AIが公開したFugu(フグ)を徹底解説。複数モデルを束ねるマルチエージェント・オーケストレーションの仕組み、FuguとFugu Ultraの違い、Fable 5やGPT 5.5とのベンチマーク比較、料金プラン、使い方までわかりやすくまとめます。

効率化Sakana AIFuguAIエージェントマルチエージェントAIモデル効率化

🎯 この記事で学べること

  • 1
    Sakana AIのFuguが「何を解決するプロダクトか」を理解できます
  • 2
    マルチエージェント・オーケストレーションの仕組みがわかります
  • 3
    FuguとFugu Ultraの違い・使い分けができるようになります
  • 4
    Fable 5やGPT 5.5とのベンチマーク比較から実力を把握できます
  • 5
    料金プランと使い始める手順をつかめます

読了時間: 約12

「単一モデル」として振る舞うマルチエージェント、Fugu登場

こんにちは!今日は、日本発のAI企業Sakana AI(サカナエーアイ)が2026年6月に公開した新プロダクトFugu(フグ)について解説します。

「Fuguって新しいLLM(大規模言語モデル)なの?」「Fable 5やGPT 5.5と何が違うの?」「料金は?どう使うの?」——そんな疑問にまとめて答えていきます。

ひとことで言うと、Fuguは「世界中の優れたAIモデルを裏側で自動的に使い分け、1つのモデルのように振る舞うマルチエージェント・オーケストレーション基盤」です。利用者は1つのAPIを叩くだけで、Fuguが「自分で解くか」「専門モデルのチームを組んで解くか」を判断してくれます。

Sakana Fuguのロゴ

Sakana AIのFugu(画像引用:Sakana AI公式サイト

本記事は執筆時点(2026年6月)の情報です。モデル構成・料金・ベンチマークなどの仕様は変更されることがあります。最新の正確な情報は必ず公式サイト(fugu-release / fugu)でご確認ください。

Sakana AIのFuguとは?

Fuguは、複数のAIモデルを動的に組み合わせて「最高クラスの性能」を1つのAPIから提供するシステムです。基本情報を整理しましょう。

項目内容
開発元Sakana AI(日本)
種別マルチエージェント・オーケストレーション基盤
提供形態単一のOpenAI互換API
モデル構成Fugu / Fugu Ultra の2種類
公開日2026年6月22日
利用方法サブスクリプション + 従量課金(pay-as-you-go)
コンソールconsole.sakana.ai

ポイントは、Fugu自身が「いつ・どのモデルに・どう仕事を振り分け、結果をどう統合するか」を理解する言語モデルだということです。リクエストの内容に応じて、簡単なタスクは自分で即答し、複雑な多段タスクのときは専門モデルのチームを編成して委任・検証・統合を行います。必要に応じて自分自身や他のLLMを再帰的に呼び出すこともできます。

Sakana Fuguのアーキテクチャ図

Fuguは1つのAPIの背後で、クローズド/オープンの各モデルやSakana AI自身のモデルからなる「LLMプール」をオーケストレーションする(画像引用:Sakana AI公式サイト

FuguとFugu Ultraの違い

Fuguには性格の異なる2つのモデルがあります。どちらも同じAPIから使えます。

比較項目FuguFugu Ultra
重視するもの性能と低レイテンシのバランス回答品質の最大化
向いている用途コーディング、コードレビュー、チャットボット、対話サービスなど日常業務AIリサーチ、論文の再現、サイバーセキュリティ分析、文献・特許調査などの難問
エージェントプール標準的な構成より深い専門エージェント群を編成
レスポンス速いじっくり高品質

使い分けの基本は、日常の実務はFugu、最難関の多段タスクはFugu Ultraと覚えておけばOKです。Fuguでは、コンプライアンス上の理由から「特定のプロバイダーのモデルをプールから除外する」といった指定もできます。

なぜ「オーケストレーション」なのか

「1つの最強モデルを作る」のではなく「複数モデルを束ねる」というアプローチには、Sakana AIらしい狙いがあります。

  • 単一ベンダー依存リスクの回避: 特定企業のモデルが輸出規制やアクセス制限の対象になっても、Fuguはプールを組み替えて自動的に迂回できる
  • エコシステムへの追従: 新しいフロンティアモデルが出れば、約2週間でプールに統合。常に「その時点のベスト」を使える
  • 集合知: 単体モデルの限界を、複数モデルの協調(コーディネーション)で超える

実際に公式は、最近のAI業界における「単一ベンダー依存の深刻なリスク」に言及しています。Fuguは、交換可能なエージェントプールによってこのリスクに対するレジリエンス(回復力)を提供する、という位置づけです。

技術的な裏付け:TrinityとConductor

Fuguは思いつきのプロダクトではなく、Sakana AIの「学習されたモデル・オーケストレーション」研究がベースになっています。中心となるのはICLR 2026で発表された2本の論文です。

  • Trinity(An Evolved LLM Coordinator): 軽量な「進化的コーディネーター」が、複数のLLMに対してThinker(考える役)・Worker(作業役)・Verifier(検証役)といった役割をタスクに応じて割り当て、複数ターンにわたって管理します。
  • Conductor(Learning to Orchestrate Agents in Natural Language): 強化学習で「自然言語によるエージェント間の協調戦略」を発見します。エージェント同士の通信パターンを設計し、多様なLLMの集まりが単体モデルを上回るようにします。

「個々のモデルを賢くする」より「賢い指揮者(コンダクター)が複数のモデルを協調させる」ほうが強い、という発想です。AIエージェントを束ねて使う考え方は、スーパーセット型のAIエージェント運用とも通じる部分があります。

ベンチマーク:Fable 5やGPT 5.5との比較

Fugu Ultraは、エンジニアリング・科学・推論の各ベンチマークで、Fable 5やMythos Previewといった最先端モデルと肩を並べるとされています。公式が公開したベンチマーク表を見てみましょう。

Fuguのベンチマーク比較表

Fugu/Fugu Ultraと、Opus 4.8・Gemini 3.1 Pro・GPT 5.5のベンチマーク比較(画像引用:Sakana AI公式サイト

代表的なスコアを抜き出すと、以下のとおりです(数値は公式ベンチマーク表より)。

ベンチマークFuguFugu UltraOpus 4.8Gemini 3.1 ProGPT 5.5
SWE Bench Pro(実装)59.073.769.254.258.6
LiveCodeBench(コーディング)92.993.287.888.585.3
Humanity's Last Exam(高難度知識)47.250.049.844.441.4
GPQA-D(科学的推論)95.595.592.094.393.6
TerminalBench 2.1(エージェント)80.282.174.670.378.2

特にソフトウェアエンジニアリング(SWE Bench Pro)や高難度の推論(Humanity's Last Exam)で、Fugu Ultraが単体のフロンティアモデルを上回っている点が目を引きます。複数モデルの協調が、単体では届かない領域に手を伸ばしていることがわかります。

ベンチマークはあくまで一指標です。「単体最強モデル」と「オーケストレーション基盤」では設計思想が異なるため、自分のユースケース(コードレビュー、リサーチ、対話など)で実際に試して比較するのが確実です。

料金プラン

Fuguはサブスクリプションと従量課金(pay-as-you-go)の2系統で提供されます。どちらのプランでもFuguとFugu Ultraの両方が使えます。

サブスクリプション

プラン月額想定する使い方
Standard$20軽めの日常利用
Pro$100週次の集中作業(Standardの約10倍の利用量)
Max$200重いワークロード(約30倍の利用量)

従量課金(トークンベース)

対象料金
Fugu内部で使われるモデルの標準レートに準拠
Fugu Ultra(入力 / 出力)$5 / $30(100万トークンあたり)
キャッシュ入力$0.50(100万トークンあたり)
272Kトークン超の長コンテキスト上記より高いレート

2026年7月までに登録した早期サブスクライバーは、2か月目が無料になる特典が案内されています(執筆時点)。最新の条件は公式の料金ページで確認してください。

こんな使い方ができる

公開時点のベータユーザーは、すでに次のような用途でFuguを活用しています。

  • コードレビュー: 競合ツールが約3件の指摘にとどまるところ、Fuguは20件以上の問題を検出したという声
  • 自律的なデータサイエンス研究: 人手をほとんど介さずにリサーチを進行(Fugu Ultraが4時間の自律リサーチで、論文分析・実装・学習・評価まで完遂した例も)
  • セキュリティ評価: 偵察・脆弱性チェック・認証レビュー・レポート作成までをスコープ内で一気通貫
  • 論文の再現・Kaggleコンペ: 研究や競技プログラミングでの活用
  • 特許・文献調査: 数日かかる調査を数時間に短縮し、論文間のつながりを発見

ユーザーからは「Fugu UltraはGPT 5.5より明らかに優秀で、他が見逃すバグを見つける」「長いセッションでもキャラクター(ペルソナ)が驚くほど安定している」といった評価も挙がっています。

使い始める手順

Fuguは導入のハードルが低いのも特徴です。

  1. コンソールに登録: console.sakana.ai からアカウントを作成し、プランを選ぶ
  2. APIキーを取得: そのままAPIキーを発行
  3. エンドポイントを差し替えるだけ: FuguはOpenAI互換APIなので、既存のOpenAI向けコードのエンドポイントとモデル名を変えるだけで動く(SDKの移行は不要)
  4. 必要に応じて設定: コンプライアンス用に特定プロバイダーをプールから除外したり、データ利用をコンソールからオプトアウトしたりできる

ローカルでLLMを動かす選択肢と比べたい方は、ローカルLLM完全ガイドもあわせてどうぞ。クラウドのオーケストレーション基盤とローカル実行は、コスト・プライバシー・性能のトレードオフが異なります。

注意点

導入前に押さえておきたいポイントもあります。

  • 提供地域: 執筆時点では、GDPR対応の都合でEU/EEA地域では利用できません(対応は準備中)
  • モデル統合のタイムラグ: 新しいフロンティアモデルが登場してからプールに統合されるまで、おおむね2週間程度
  • データ利用: コンソールからオプトアウトが可能
  • 仕様変動: 公開直後のプロダクトのため、料金やモデル構成は今後変わる可能性があります

よくある質問

Q.1

Fuguは新しいLLM(単体モデル)ですか?

先生
A.

厳密には少し違います。Fugu自身も「いつ・どのモデルに仕事を振るか」を理解する言語モデルですが、その役割は複数モデルを束ねる指揮者です。1つの巨大な単体モデルというより、複数のLLMを協調させる「マルチエージェント・オーケストレーション基盤」と捉えるのが正確です。

Q.2

FuguとFugu Ultraはどう使い分ければいいですか?

先生
A.

日常的なコーディングやコードレビュー、チャットボットなど、速度と品質のバランスが欲しい場面はFuguが適しています。AIリサーチや論文の再現、セキュリティ分析、特許調査といった「最難関の多段タスク」はFugu Ultraに任せるのがおすすめです。

Q.3

既存のOpenAI向けコードからすぐ乗り換えられますか?

先生
A.

はい。FuguはOpenAI互換のAPIエンドポイントを提供しているため、エンドポイントとモデル名を変更するだけで利用できます。SDKの作り直しは不要です。

Q.4

日本やアメリカでは使えますか?EUは?

先生
A.

グローバルで利用できますが、執筆時点ではEU/EEA地域はGDPR対応の準備中のため利用できません。日本や米国などEU圏外では利用可能です。

Q.5

Fable 5やGPT 5.5と比べて性能はどうですか?

先生
A.

公式ベンチマークでは、Fugu UltraがSWE Bench ProやHumanity's Last Examなどで単体のフロンティアモデルを上回る結果が示されています。ただしベンチマークは一指標なので、自分の用途で実際に試して比較するのが確実です。

Q.6

特定のAIプロバイダーを使いたくない場合は?

先生
A.

Fuguでは、コンプライアンスなどの理由から特定のエージェント(プロバイダーのモデル)をプールから除外する設定が可能です。単一ベンダー依存を避けられる点がFuguの設計思想の核でもあります。

理解度チェック

Q1: Fuguの本質

Sakana AIのFuguを最も正しく説明しているのはどれ?

Q2: 使い分け

4時間に及ぶ自律リサーチや論文の再現など、最難関の多段タスクに向いているのは?

まとめ

今回は、日本発のSakana AIが公開したFugu(フグ)について解説しました!

覚えておきたいポイントをまとめます。

  • Fuguは、複数のAIモデルを動的に束ねて1つのAPIとして提供する「マルチエージェント・オーケストレーション基盤」(2026年6月22日公開)
  • 2種類: 速度と品質のバランス型の「Fugu」と、難問向けに品質を最大化する「Fugu Ultra」
  • 狙いは単一ベンダー依存リスクの回避とエコシステムへの追従。新モデルは約2週間でプールに統合
  • 技術基盤はICLR 2026論文のTrinity(進化的コーディネーター)とConductor(自然言語による協調戦略)
  • ベンチマークでは、Fugu UltraがSWE Bench ProやHumanity's Last Examで単体フロンティアモデルを上回る場面も
  • 料金はサブスク($20〜$200/月)と従量課金。OpenAI互換APIでエンドポイントを差し替えるだけで使える
  • 注意点はEU/EEA未対応(執筆時点)とモデル統合の約2週間のタイムラグ

最先端の単体モデルにも興味がある方はClaude Fable 5 完全ガイドを、複数エージェントを束ねる考え方をさらに知りたい方はスーパーセット型のAIエージェント運用もぜひチェックしてみてください!

おすすめコース

関連記事