Sakana AIのFugu(フグ)とは?特徴・料金・ベンチマークをやさしく解説
日本発のSakana AIが公開したFugu(フグ)を徹底解説。複数モデルを束ねるマルチエージェント・オーケストレーションの仕組み、FuguとFugu Ultraの違い、Fable 5やGPT 5.5とのベンチマーク比較、料金プラン、使い方までわかりやすくまとめます。
🎯 この記事で学べること
- 1Sakana AIのFuguが「何を解決するプロダクトか」を理解できます
- 2マルチエージェント・オーケストレーションの仕組みがわかります
- 3FuguとFugu Ultraの違い・使い分けができるようになります
- 4Fable 5やGPT 5.5とのベンチマーク比較から実力を把握できます
- 5料金プランと使い始める手順をつかめます
読了時間: 約12分
「単一モデル」として振る舞うマルチエージェント、Fugu登場
こんにちは!今日は、日本発のAI企業Sakana AI(サカナエーアイ)が2026年6月に公開した新プロダクトFugu(フグ)について解説します。
「Fuguって新しいLLM(大規模言語モデル)なの?」「Fable 5やGPT 5.5と何が違うの?」「料金は?どう使うの?」——そんな疑問にまとめて答えていきます。
ひとことで言うと、Fuguは「世界中の優れたAIモデルを裏側で自動的に使い分け、1つのモデルのように振る舞うマルチエージェント・オーケストレーション基盤」です。利用者は1つのAPIを叩くだけで、Fuguが「自分で解くか」「専門モデルのチームを組んで解くか」を判断してくれます。

Sakana AIのFugu(画像引用:Sakana AI公式サイト)
本記事は執筆時点(2026年6月)の情報です。モデル構成・料金・ベンチマークなどの仕様は変更されることがあります。最新の正確な情報は必ず公式サイト(fugu-release / fugu)でご確認ください。
Sakana AIのFuguとは?
Fuguは、複数のAIモデルを動的に組み合わせて「最高クラスの性能」を1つのAPIから提供するシステムです。基本情報を整理しましょう。
| 項目 | 内容 |
|---|---|
| 開発元 | Sakana AI(日本) |
| 種別 | マルチエージェント・オーケストレーション基盤 |
| 提供形態 | 単一のOpenAI互換API |
| モデル構成 | Fugu / Fugu Ultra の2種類 |
| 公開日 | 2026年6月22日 |
| 利用方法 | サブスクリプション + 従量課金(pay-as-you-go) |
| コンソール | console.sakana.ai |
ポイントは、Fugu自身が「いつ・どのモデルに・どう仕事を振り分け、結果をどう統合するか」を理解する言語モデルだということです。リクエストの内容に応じて、簡単なタスクは自分で即答し、複雑な多段タスクのときは専門モデルのチームを編成して委任・検証・統合を行います。必要に応じて自分自身や他のLLMを再帰的に呼び出すこともできます。

Fuguは1つのAPIの背後で、クローズド/オープンの各モデルやSakana AI自身のモデルからなる「LLMプール」をオーケストレーションする(画像引用:Sakana AI公式サイト)
FuguとFugu Ultraの違い
Fuguには性格の異なる2つのモデルがあります。どちらも同じAPIから使えます。
| 比較項目 | Fugu | Fugu Ultra |
|---|---|---|
| 重視するもの | 性能と低レイテンシのバランス | 回答品質の最大化 |
| 向いている用途 | コーディング、コードレビュー、チャットボット、対話サービスなど日常業務 | AIリサーチ、論文の再現、サイバーセキュリティ分析、文献・特許調査などの難問 |
| エージェントプール | 標準的な構成 | より深い専門エージェント群を編成 |
| レスポンス | 速い | じっくり高品質 |
使い分けの基本は、日常の実務はFugu、最難関の多段タスクはFugu Ultraと覚えておけばOKです。Fuguでは、コンプライアンス上の理由から「特定のプロバイダーのモデルをプールから除外する」といった指定もできます。
なぜ「オーケストレーション」なのか
「1つの最強モデルを作る」のではなく「複数モデルを束ねる」というアプローチには、Sakana AIらしい狙いがあります。
- 単一ベンダー依存リスクの回避: 特定企業のモデルが輸出規制やアクセス制限の対象になっても、Fuguはプールを組み替えて自動的に迂回できる
- エコシステムへの追従: 新しいフロンティアモデルが出れば、約2週間でプールに統合。常に「その時点のベスト」を使える
- 集合知: 単体モデルの限界を、複数モデルの協調(コーディネーション)で超える
実際に公式は、最近のAI業界における「単一ベンダー依存の深刻なリスク」に言及しています。Fuguは、交換可能なエージェントプールによってこのリスクに対するレジリエンス(回復力)を提供する、という位置づけです。
技術的な裏付け:TrinityとConductor
Fuguは思いつきのプロダクトではなく、Sakana AIの「学習されたモデル・オーケストレーション」研究がベースになっています。中心となるのはICLR 2026で発表された2本の論文です。
- Trinity(An Evolved LLM Coordinator): 軽量な「進化的コーディネーター」が、複数のLLMに対してThinker(考える役)・Worker(作業役)・Verifier(検証役)といった役割をタスクに応じて割り当て、複数ターンにわたって管理します。
- Conductor(Learning to Orchestrate Agents in Natural Language): 強化学習で「自然言語によるエージェント間の協調戦略」を発見します。エージェント同士の通信パターンを設計し、多様なLLMの集まりが単体モデルを上回るようにします。
「個々のモデルを賢くする」より「賢い指揮者(コンダクター)が複数のモデルを協調させる」ほうが強い、という発想です。AIエージェントを束ねて使う考え方は、スーパーセット型のAIエージェント運用とも通じる部分があります。
ベンチマーク:Fable 5やGPT 5.5との比較
Fugu Ultraは、エンジニアリング・科学・推論の各ベンチマークで、Fable 5やMythos Previewといった最先端モデルと肩を並べるとされています。公式が公開したベンチマーク表を見てみましょう。

Fugu/Fugu Ultraと、Opus 4.8・Gemini 3.1 Pro・GPT 5.5のベンチマーク比較(画像引用:Sakana AI公式サイト)
代表的なスコアを抜き出すと、以下のとおりです(数値は公式ベンチマーク表より)。
| ベンチマーク | Fugu | Fugu Ultra | Opus 4.8 | Gemini 3.1 Pro | GPT 5.5 |
|---|---|---|---|---|---|
| SWE Bench Pro(実装) | 59.0 | 73.7 | 69.2 | 54.2 | 58.6 |
| LiveCodeBench(コーディング) | 92.9 | 93.2 | 87.8 | 88.5 | 85.3 |
| Humanity's Last Exam(高難度知識) | 47.2 | 50.0 | 49.8 | 44.4 | 41.4 |
| GPQA-D(科学的推論) | 95.5 | 95.5 | 92.0 | 94.3 | 93.6 |
| TerminalBench 2.1(エージェント) | 80.2 | 82.1 | 74.6 | 70.3 | 78.2 |
特にソフトウェアエンジニアリング(SWE Bench Pro)や高難度の推論(Humanity's Last Exam)で、Fugu Ultraが単体のフロンティアモデルを上回っている点が目を引きます。複数モデルの協調が、単体では届かない領域に手を伸ばしていることがわかります。
ベンチマークはあくまで一指標です。「単体最強モデル」と「オーケストレーション基盤」では設計思想が異なるため、自分のユースケース(コードレビュー、リサーチ、対話など)で実際に試して比較するのが確実です。
料金プラン
Fuguはサブスクリプションと従量課金(pay-as-you-go)の2系統で提供されます。どちらのプランでもFuguとFugu Ultraの両方が使えます。
サブスクリプション
| プラン | 月額 | 想定する使い方 |
|---|---|---|
| Standard | $20 | 軽めの日常利用 |
| Pro | $100 | 週次の集中作業(Standardの約10倍の利用量) |
| Max | $200 | 重いワークロード(約30倍の利用量) |
従量課金(トークンベース)
| 対象 | 料金 |
|---|---|
| Fugu | 内部で使われるモデルの標準レートに準拠 |
| Fugu Ultra(入力 / 出力) | $5 / $30(100万トークンあたり) |
| キャッシュ入力 | $0.50(100万トークンあたり) |
| 272Kトークン超の長コンテキスト | 上記より高いレート |
2026年7月までに登録した早期サブスクライバーは、2か月目が無料になる特典が案内されています(執筆時点)。最新の条件は公式の料金ページで確認してください。
こんな使い方ができる
公開時点のベータユーザーは、すでに次のような用途でFuguを活用しています。
- コードレビュー: 競合ツールが約3件の指摘にとどまるところ、Fuguは20件以上の問題を検出したという声
- 自律的なデータサイエンス研究: 人手をほとんど介さずにリサーチを進行(Fugu Ultraが4時間の自律リサーチで、論文分析・実装・学習・評価まで完遂した例も)
- セキュリティ評価: 偵察・脆弱性チェック・認証レビュー・レポート作成までをスコープ内で一気通貫
- 論文の再現・Kaggleコンペ: 研究や競技プログラミングでの活用
- 特許・文献調査: 数日かかる調査を数時間に短縮し、論文間のつながりを発見
ユーザーからは「Fugu UltraはGPT 5.5より明らかに優秀で、他が見逃すバグを見つける」「長いセッションでもキャラクター(ペルソナ)が驚くほど安定している」といった評価も挙がっています。
使い始める手順
Fuguは導入のハードルが低いのも特徴です。
- ①コンソールに登録: console.sakana.ai からアカウントを作成し、プランを選ぶ
- ②APIキーを取得: そのままAPIキーを発行
- ③エンドポイントを差し替えるだけ: FuguはOpenAI互換APIなので、既存のOpenAI向けコードのエンドポイントとモデル名を変えるだけで動く(SDKの移行は不要)
- ④必要に応じて設定: コンプライアンス用に特定プロバイダーをプールから除外したり、データ利用をコンソールからオプトアウトしたりできる
ローカルでLLMを動かす選択肢と比べたい方は、ローカルLLM完全ガイドもあわせてどうぞ。クラウドのオーケストレーション基盤とローカル実行は、コスト・プライバシー・性能のトレードオフが異なります。
注意点
導入前に押さえておきたいポイントもあります。
- 提供地域: 執筆時点では、GDPR対応の都合でEU/EEA地域では利用できません(対応は準備中)
- モデル統合のタイムラグ: 新しいフロンティアモデルが登場してからプールに統合されるまで、おおむね2週間程度
- データ利用: コンソールからオプトアウトが可能
- 仕様変動: 公開直後のプロダクトのため、料金やモデル構成は今後変わる可能性があります
よくある質問
Fuguは新しいLLM(単体モデル)ですか?

厳密には少し違います。Fugu自身も「いつ・どのモデルに仕事を振るか」を理解する言語モデルですが、その役割は複数モデルを束ねる指揮者です。1つの巨大な単体モデルというより、複数のLLMを協調させる「マルチエージェント・オーケストレーション基盤」と捉えるのが正確です。
FuguとFugu Ultraはどう使い分ければいいですか?

日常的なコーディングやコードレビュー、チャットボットなど、速度と品質のバランスが欲しい場面はFuguが適しています。AIリサーチや論文の再現、セキュリティ分析、特許調査といった「最難関の多段タスク」はFugu Ultraに任せるのがおすすめです。
既存のOpenAI向けコードからすぐ乗り換えられますか?

はい。FuguはOpenAI互換のAPIエンドポイントを提供しているため、エンドポイントとモデル名を変更するだけで利用できます。SDKの作り直しは不要です。
日本やアメリカでは使えますか?EUは?

グローバルで利用できますが、執筆時点ではEU/EEA地域はGDPR対応の準備中のため利用できません。日本や米国などEU圏外では利用可能です。
Fable 5やGPT 5.5と比べて性能はどうですか?

公式ベンチマークでは、Fugu UltraがSWE Bench ProやHumanity's Last Examなどで単体のフロンティアモデルを上回る結果が示されています。ただしベンチマークは一指標なので、自分の用途で実際に試して比較するのが確実です。
特定のAIプロバイダーを使いたくない場合は?

Fuguでは、コンプライアンスなどの理由から特定のエージェント(プロバイダーのモデル)をプールから除外する設定が可能です。単一ベンダー依存を避けられる点がFuguの設計思想の核でもあります。
理解度チェック
Q1: Fuguの本質
Q2: 使い分け
まとめ
今回は、日本発のSakana AIが公開したFugu(フグ)について解説しました!
覚えておきたいポイントをまとめます。
- Fuguは、複数のAIモデルを動的に束ねて1つのAPIとして提供する「マルチエージェント・オーケストレーション基盤」(2026年6月22日公開)
- 2種類: 速度と品質のバランス型の「Fugu」と、難問向けに品質を最大化する「Fugu Ultra」
- 狙いは単一ベンダー依存リスクの回避とエコシステムへの追従。新モデルは約2週間でプールに統合
- 技術基盤はICLR 2026論文のTrinity(進化的コーディネーター)とConductor(自然言語による協調戦略)
- ベンチマークでは、Fugu UltraがSWE Bench ProやHumanity's Last Examで単体フロンティアモデルを上回る場面も
- 料金はサブスク($20〜$200/月)と従量課金。OpenAI互換APIでエンドポイントを差し替えるだけで使える
- 注意点はEU/EEA未対応(執筆時点)とモデル統合の約2週間のタイムラグ
最先端の単体モデルにも興味がある方はClaude Fable 5 完全ガイドを、複数エージェントを束ねる考え方をさらに知りたい方はスーパーセット型のAIエージェント運用もぜひチェックしてみてください!
おすすめコース
関連記事
Claude Fable 5 完全ガイド:使い方・料金・Opus 4.8との違い
Anthropicの最上位モデルClaude Fable 5の使い方・料金・Opus 4.8やSonnet 4.6との違いと使い分けを、API変更点やプロンプトのコツ、よくある質問を交えてわかりやすく解説します。
ローカルLLMとは?始め方・おすすめモデル・必要スペック完全ガイド【2026年版】
ローカルLLMとは何かを初心者にもわかりやすく解説。自分のPCで今日動かす5分クイックスタートから、Ollama・LM Studioの選び方、Qwen・Gemmaなどおすすめモデル、必要スペック(VRAM)の目安、商用ライセンス、活用例まで2026年最新版で網羅します。
Supersetとは?AIエージェントを並列で動かすコードエディタ【使い方・設定・料金】
Claude CodeやCodexなど複数のAIコーディングエージェントを並列で走らせるmacOSアプリ「Superset(superset.sh)」を徹底解説。インストールから使い方、Git worktree分離、設定・カスタマイズ、料金、cmuxやChloeとの違いまで、公式情報をもとに紹介します。


