Sakana AIのFugu（フグ）とは？特徴・料金・ベンチマークをやさしく解説

🎯 この記事で学べること

1
Sakana AIのFuguが「何を解決するプロダクトか」を理解できます
2
マルチエージェント・オーケストレーションの仕組みがわかります
3
FuguとFugu Ultraの違い・使い分けができるようになります
4
Fable 5やGPT 5.5とのベンチマーク比較から実力を把握できます
5
料金プランと使い始める手順をつかめます

読了時間: 約12分

「単一モデル」として振る舞うマルチエージェント、Fugu登場

こんにちは！今日は、日本発のAI企業Sakana AI（サカナエーアイ）が2026年6月に公開した新プロダクトFugu（フグ）について解説します。

「Fuguって新しいLLM（大規模言語モデル）なの？」「Fable 5やGPT 5.5と何が違うの？」「料金は？どう使うの？」——そんな疑問にまとめて答えていきます。

ひとことで言うと、Fuguは「世界中の優れたAIモデルを裏側で自動的に使い分け、1つのモデルのように振る舞うマルチエージェント・オーケストレーション基盤」です。利用者は1つのAPIを叩くだけで、Fuguが「自分で解くか」「専門モデルのチームを組んで解くか」を判断してくれます。

Sakana AIのFugu（画像引用：Sakana AI公式サイト）

本記事は執筆時点（2026年6月）の情報です。モデル構成・料金・ベンチマークなどの仕様は変更されることがあります。最新の正確な情報は必ず公式サイト（fugu-release / fugu）でご確認ください。

Sakana AIのFuguとは？

Fuguは、複数のAIモデルを動的に組み合わせて「最高クラスの性能」を1つのAPIから提供するシステムです。基本情報を整理しましょう。

項目	内容
開発元	Sakana AI（日本）
種別	マルチエージェント・オーケストレーション基盤
提供形態	単一のOpenAI互換API
モデル構成	Fugu / Fugu Ultra の2種類
公開日	2026年6月22日
利用方法	サブスクリプション＋従量課金（pay-as-you-go）
コンソール	console.sakana.ai

ポイントは、Fugu自身が「いつ・どのモデルに・どう仕事を振り分け、結果をどう統合するか」を理解する言語モデルだということです。リクエストの内容に応じて、簡単なタスクは自分で即答し、複雑な多段タスクのときは専門モデルのチームを編成して委任・検証・統合を行います。必要に応じて自分自身や他のLLMを再帰的に呼び出すこともできます。

Sakana Fuguのアーキテクチャ図

Fuguは1つのAPIの背後で、クローズド／オープンの各モデルやSakana AI自身のモデルからなる「LLMプール」をオーケストレーションする（画像引用：Sakana AI公式サイト）

FuguとFugu Ultraの違い

Fuguには性格の異なる2つのモデルがあります。どちらも同じAPIから使えます。

比較項目	Fugu	Fugu Ultra
重視するもの	性能と低レイテンシのバランス	回答品質の最大化
向いている用途	コーディング、コードレビュー、チャットボット、対話サービスなど日常業務	AIリサーチ、論文の再現、サイバーセキュリティ分析、文献・特許調査などの難問
エージェントプール	標準的な構成	より深い専門エージェント群を編成
レスポンス	速い	じっくり高品質

使い分けの基本は、日常の実務はFugu、最難関の多段タスクはFugu Ultraと覚えておけばOKです。Fuguでは、コンプライアンス上の理由から「特定のプロバイダーのモデルをプールから除外する」といった指定もできます。

なぜ「オーケストレーション」なのか

「1つの最強モデルを作る」のではなく「複数モデルを束ねる」というアプローチには、Sakana AIらしい狙いがあります。

単一ベンダー依存リスクの回避: 特定企業のモデルが輸出規制やアクセス制限の対象になっても、Fuguはプールを組み替えて自動的に迂回できる
エコシステムへの追従: 新しいフロンティアモデルが出れば、約2週間でプールに統合。常に「その時点のベスト」を使える
集合知: 単体モデルの限界を、複数モデルの協調（コーディネーション）で超える

実際に公式は、最近のAI業界における「単一ベンダー依存の深刻なリスク」に言及しています。Fuguは、交換可能なエージェントプールによってこのリスクに対するレジリエンス（回復力）を提供する、という位置づけです。

技術的な裏付け：TrinityとConductor

Fuguは思いつきのプロダクトではなく、Sakana AIの「学習されたモデル・オーケストレーション」研究がベースになっています。中心となるのはICLR 2026で発表された2本の論文です。

Trinity（An Evolved LLM Coordinator）: 軽量な「進化的コーディネーター」が、複数のLLMに対してThinker（考える役）・Worker（作業役）・Verifier（検証役）といった役割をタスクに応じて割り当て、複数ターンにわたって管理します。
Conductor（Learning to Orchestrate Agents in Natural Language）: 強化学習で「自然言語によるエージェント間の協調戦略」を発見します。エージェント同士の通信パターンを設計し、多様なLLMの集まりが単体モデルを上回るようにします。

「個々のモデルを賢くする」より「賢い指揮者（コンダクター）が複数のモデルを協調させる」ほうが強い、という発想です。AIエージェントを束ねて使う考え方は、スーパーセット型のAIエージェント運用とも通じる部分があります。

ベンチマーク：Fable 5やGPT 5.5との比較

Fugu Ultraは、エンジニアリング・科学・推論の各ベンチマークで、Fable 5やMythos Previewといった最先端モデルと肩を並べるとされています。公式が公開したベンチマーク表を見てみましょう。

Fuguのベンチマーク比較表

Fugu／Fugu Ultraと、Opus 4.8・Gemini 3.1 Pro・GPT 5.5のベンチマーク比較（画像引用：Sakana AI公式サイト）

代表的なスコアを抜き出すと、以下のとおりです（数値は公式ベンチマーク表より）。

ベンチマーク	Fugu	Fugu Ultra	Opus 4.8	Gemini 3.1 Pro	GPT 5.5
SWE Bench Pro（実装）	59.0	73.7	69.2	54.2	58.6
LiveCodeBench（コーディング）	92.9	93.2	87.8	88.5	85.3
Humanity's Last Exam（高難度知識）	47.2	50.0	49.8	44.4	41.4
GPQA-D（科学的推論）	95.5	95.5	92.0	94.3	93.6
TerminalBench 2.1（エージェント）	80.2	82.1	74.6	70.3	78.2

特にソフトウェアエンジニアリング（SWE Bench Pro）や高難度の推論（Humanity's Last Exam）で、Fugu Ultraが単体のフロンティアモデルを上回っている点が目を引きます。複数モデルの協調が、単体では届かない領域に手を伸ばしていることがわかります。

ベンチマークはあくまで一指標です。「単体最強モデル」と「オーケストレーション基盤」では設計思想が異なるため、自分のユースケース（コードレビュー、リサーチ、対話など）で実際に試して比較するのが確実です。

料金プラン

Fuguはサブスクリプションと従量課金（pay-as-you-go）の2系統で提供されます。どちらのプランでもFuguとFugu Ultraの両方が使えます。

サブスクリプション

プラン	月額	想定する使い方
Standard	$20	軽めの日常利用
Pro	$100	週次の集中作業（Standardの約10倍の利用量）
Max	$200	重いワークロード（約30倍の利用量）

従量課金（トークンベース）

対象	料金
Fugu	内部で使われるモデルの標準レートに準拠
Fugu Ultra（入力 / 出力）	$5 / $30（100万トークンあたり）
キャッシュ入力	$0.50（100万トークンあたり）
272Kトークン超の長コンテキスト	上記より高いレート

2026年7月までに登録した早期サブスクライバーは、2か月目が無料になる特典が案内されています（執筆時点）。最新の条件は公式の料金ページで確認してください。

こんな使い方ができる

公開時点のベータユーザーは、すでに次のような用途でFuguを活用しています。

コードレビュー: 競合ツールが約3件の指摘にとどまるところ、Fuguは20件以上の問題を検出したという声
自律的なデータサイエンス研究: 人手をほとんど介さずにリサーチを進行（Fugu Ultraが4時間の自律リサーチで、論文分析・実装・学習・評価まで完遂した例も）
セキュリティ評価: 偵察・脆弱性チェック・認証レビュー・レポート作成までをスコープ内で一気通貫
論文の再現・Kaggleコンペ: 研究や競技プログラミングでの活用
特許・文献調査: 数日かかる調査を数時間に短縮し、論文間のつながりを発見

ユーザーからは「Fugu UltraはGPT 5.5より明らかに優秀で、他が見逃すバグを見つける」「長いセッションでもキャラクター（ペルソナ）が驚くほど安定している」といった評価も挙がっています。

使い始める手順

Fuguは導入のハードルが低いのも特徴です。

①コンソールに登録: console.sakana.ai からアカウントを作成し、プランを選ぶ
②APIキーを取得: そのままAPIキーを発行
③エンドポイントを差し替えるだけ: FuguはOpenAI互換APIなので、既存のOpenAI向けコードのエンドポイントとモデル名を変えるだけで動く（SDKの移行は不要）
④必要に応じて設定: コンプライアンス用に特定プロバイダーをプールから除外したり、データ利用をコンソールからオプトアウトしたりできる

ローカルでLLMを動かす選択肢と比べたい方は、ローカルLLM完全ガイドもあわせてどうぞ。クラウドのオーケストレーション基盤とローカル実行は、コスト・プライバシー・性能のトレードオフが異なります。

注意点

導入前に押さえておきたいポイントもあります。

提供地域: 執筆時点では、GDPR対応の都合でEU／EEA地域では利用できません（対応は準備中）
モデル統合のタイムラグ: 新しいフロンティアモデルが登場してからプールに統合されるまで、おおむね2週間程度
データ利用: コンソールからオプトアウトが可能
仕様変動: 公開直後のプロダクトのため、料金やモデル構成は今後変わる可能性があります

よくある質問

Q.1

Fuguは新しいLLM（単体モデル）ですか？

厳密には少し違います。Fugu自身も「いつ・どのモデルに仕事を振るか」を理解する言語モデルですが、その役割は複数モデルを束ねる指揮者です。1つの巨大な単体モデルというより、複数のLLMを協調させる「マルチエージェント・オーケストレーション基盤」と捉えるのが正確です。

Q.2

FuguとFugu Ultraはどう使い分ければいいですか？

日常的なコーディングやコードレビュー、チャットボットなど、速度と品質のバランスが欲しい場面はFuguが適しています。AIリサーチや論文の再現、セキュリティ分析、特許調査といった「最難関の多段タスク」はFugu Ultraに任せるのがおすすめです。

Q.3

既存のOpenAI向けコードからすぐ乗り換えられますか？

はい。FuguはOpenAI互換のAPIエンドポイントを提供しているため、エンドポイントとモデル名を変更するだけで利用できます。SDKの作り直しは不要です。

Q.4

日本やアメリカでは使えますか？EUは？

グローバルで利用できますが、執筆時点ではEU／EEA地域はGDPR対応の準備中のため利用できません。日本や米国などEU圏外では利用可能です。

Q.5

Fable 5やGPT 5.5と比べて性能はどうですか？

公式ベンチマークでは、Fugu UltraがSWE Bench ProやHumanity's Last Examなどで単体のフロンティアモデルを上回る結果が示されています。ただしベンチマークは一指標なので、自分の用途で実際に試して比較するのが確実です。

Q.6

特定のAIプロバイダーを使いたくない場合は？

Fuguでは、コンプライアンスなどの理由から特定のエージェント（プロバイダーのモデル）をプールから除外する設定が可能です。単一ベンダー依存を避けられる点がFuguの設計思想の核でもあります。

理解度チェック

Q1: Fuguの本質

Sakana AIのFuguを最も正しく説明しているのはどれ？

Q2: 使い分け

4時間に及ぶ自律リサーチや論文の再現など、最難関の多段タスクに向いているのは？

まとめ

今回は、日本発のSakana AIが公開したFugu（フグ）について解説しました！

覚えておきたいポイントをまとめます。

Fuguは、複数のAIモデルを動的に束ねて1つのAPIとして提供する「マルチエージェント・オーケストレーション基盤」（2026年6月22日公開）
2種類: 速度と品質のバランス型の「Fugu」と、難問向けに品質を最大化する「Fugu Ultra」
狙いは単一ベンダー依存リスクの回避とエコシステムへの追従。新モデルは約2週間でプールに統合
技術基盤はICLR 2026論文のTrinity（進化的コーディネーター）とConductor（自然言語による協調戦略）
ベンチマークでは、Fugu UltraがSWE Bench ProやHumanity's Last Examで単体フロンティアモデルを上回る場面も
料金はサブスク（$20〜$200/月）と従量課金。OpenAI互換APIでエンドポイントを差し替えるだけで使える
注意点はEU／EEA未対応（執筆時点）とモデル統合の約2週間のタイムラグ

最先端の単体モデルにも興味がある方はClaude Fable 5 完全ガイドを、複数エージェントを束ねる考え方をさらに知りたい方はスーパーセット型のAIエージェント運用もぜひチェックしてみてください！

Sakana AIのFugu（フグ）とは？特徴・料金・ベンチマークをやさしく解説

🎯 この記事で学べること

「単一モデル」として振る舞うマルチエージェント、Fugu登場

Sakana AIのFuguとは？

FuguとFugu Ultraの違い

なぜ「オーケストレーション」なのか

技術的な裏付け：TrinityとConductor

ベンチマーク：Fable 5やGPT 5.5との比較

料金プラン

サブスクリプション

従量課金（トークンベース）

こんな使い方ができる

使い始める手順

注意点

よくある質問

理解度チェック

Q1: Fuguの本質

Q2: 使い分け

まとめ

おすすめコース

AIネイティブ入門

ChatGPTをとことん使い倒す

Linux基礎マスターコース

関連記事

Claude Fable 5 完全ガイド：使い方・料金・Opus 4.8との違い

ローカルLLMとは？始め方・おすすめモデル・必要スペック完全ガイド【2026年版】

Supersetとは？AIエージェントを並列で動かすコードエディタ【使い方・設定・料金】