- CognitionがDevin Fusionを発表。複数のAIモデルを動的に切り替えるマルチモデルハーネスで、最大41%のコスト削減を実現
- フロンティアモデルと低コストモデルを「サイドキック方式」で並列運用し、タスクの複雑さに応じて処理を自動委任
- 社内テストではマージされたプルリクエストの88%がDevin Fusionによる処理であり、実用水準に達していることを実証
Devin Fusionとは何か
米Cognitionは2026年6月29日、AIコーディングエージェント「Devin」の新機能「Devin Fusion」を発表しました。同日からDevinのクラウドエージェントでプレビュー版として利用できます。
Devin Fusionは、単一のAIモデルに依存する従来の構成を脱し、複数のモデルをまとめて動かす「マルチモデルハーネス」というアプローチを採用しています。タスクの複雑さや種類に応じて最適なモデルを動的に選択することで、性能とコストのバランスを取ります。
サイドキック方式の仕組み
Devin Fusionの中核となるのが「サイドキック(相棒)方式」です。GPT-5.5やClaude Opus 4.8といったフロンティアモデルをメインエージェントとして動かしながら、低コストなモデルをサイドキックエージェントとして並列で稼働させます。メインエージェントが計画立案と最終判断を担い、比較的単純な作業はサイドキックへ委任します。
さらに「動的ルーティング」機能により、タスクの途中でもモデルの切り替えが可能です。処理の途中で複雑な判断が必要になった瞬間にサイドキックからメインモデルへ戻すといった細かい制御を実現しています。
コスト削減の実績
Cognitionの発表によると、フロンティアモデル単体と比べてDevin Fusionは35%低いコストで同等の性能を維持できます。さらにClaude Fable 5を組み込んだ構成では、41%のコスト削減が確認されています。
削減の根拠はモデルの使い分けにあります。全処理を高価なフロンティアモデルで行う従来の方法に対し、定型的な処理は安価なモデルへ委ねることで、全体のAPIコストを大幅に下げられます。同等の成果物を得るために支払うコストが減る、という構造です。
従来のルーティングとの違い
Cognitionは発表の中で、従来のモデルルーティング手法を「ベンチマークは通過するが、実際にマージしたいと思えるコードを書けない」と批判しています。複数モデルの性能を単純に合算しても実用水準には届かないという課題を指摘したものです。
67モデルを使った実験で明らかになった「共同失敗上限」の法則が示すように、モデルを組み合わせるだけでは性能の上限が存在します。Devin Fusionのサイドキック方式は、役割を明確に分離してエージェント同士が協調するアーキテクチャを採用することで、この課題へのひとつの解答を示しています。
社内テストの結果
Cognitionは社内での検証結果として、マージされたプルリクエストの88%がDevin Fusion処理によるものだったと報告しています。コスト削減効果だけでなく、実際の開発フローへの統合が成立している水準に達していると主張しています。
現在はプレビュー版として提供が開始されており、Devinのクラウドエージェントを使っている開発者から試せます。AIコーディングツールのコスト最適化という共通課題に対し、マルチモデルハーネスという実装アプローチが実用段階に入りつつある動向として注目されます。