- GPT-4.1の軌跡精度(Trajectory Accuracy)は97%で次点の88%を大幅に上回り、金融機関が求める複雑な手順遵守を実証した
- GPT-5.4 mini/nanoにより500msの音声レイテンシを達成し、15以上のガードレールを並列実行してコンプライアンスを多層的に確保している
- 顧客満足度98%・初日解決率50%超を記録し、1年間で収益が10倍以上に拡大。高規制環境でのAIエージェント実用化を示した
Gradient Labsの設立背景
Gradient Labsはロンドンに拠点を置くスタートアップで、英国デジタル銀行Monzoでのべ金融AIとデータ基盤の開発を担ったチームが設立した。銀行業務では、カード紛失や不正取引といった案件の解決に複数チームの連携が必要で、顧客が各部門をたらい回しにされたり、重要な場面での待ち時間が長引きやすい構造的な課題がある。
同社のプラットフォームは「すべての顧客に専任のアカウントマネージャー体験を」という目標のもと、OpenAIのモデルを中核として構築されている。現在はGPT-4.1を主力モデルとしつつ、GPT-5.4 miniおよびnanoへの本番トラフィック移行を積極的に進めている段階だ。共同創業者でChief ScientistのDanai Antoniou氏は「GPT-5.4 mini/nanoで500ミリ秒のレイテンシを確認した。これは自然な音声会話に不可欠な水準」と語っている。
軌跡精度97%の達成方法
銀行の顧客対応は、SOPs(標準作業手順書)と呼ばれる詳細な手順に沿って進行する。たとえばカード盗難の問い合わせでは、本人確認、カード凍結、再発行手続き、追加質問への回答という一連のステップを、話題の割り込みや確認の遅れが発生する中でも正確に踏まなければならない。
Gradient Labsはこの一連の流れの正確さを軌跡精度(Trajectory Accuracy)として定義し、各プロバイダのベンチマーク評価に使用している。最難関の手順での評価で、GPT-4.1は97%の軌跡精度を達成した一方、次点のプロバイダは88%にとどまった。Antoniou氏は「金融サービスにおいて、この9ポイントの差は顧客の問題解決とコンプライアンス違反の境界線だ」と説明する。
評価には2種類のアプローチを組み合わせる。実際の顧客会話を再現してシステムの動作を既定手順と照合する手法と、デプロイ前にエッジケースや稀なシナリオを合成した会話でテストする手法だ。この二段階の検証により、本番環境での予期しない動作を事前に洗い出す設計になっている。
15以上のガードレール並列実行
Gradient Labsが構築したシステムは、中央推論エージェントが複数の専門スキルを統合するハイブリッドアーキテクチャを採用している。推論が必要なステップにはOpenAIのモデルを割り当て、高速処理が求められる確定的なタスクには小規模モデルを使い分けることで、精度と低レイテンシを両立する。

各会話では15以上のガードレールシステムが並列実行される。不適切な金融アドバイスの検出、顧客の脆弱性シグナルの把握、苦情の早期識別、本人確認の迂回試行の検知、機密データへの不正アクセス防止など、コンプライアンス上のリスクを多角的に監視する。OpenAIがエージェント悪用を対象としたSafety Bug Bountyを開始しているように、金融AIエージェントにおけるセキュリティ設計は業界全体の重要課題だ。
金融機関へのデプロイにあたっては、過去のサポートデータを分析して対応カテゴリと発生頻度をマッピングし、リスクの低いワークフローから段階的に自動化範囲を拡大する方式を採る。少量のトラフィックから運用を始め、人手によるレビューが必要な会話を自動でフラグ立てしながら連続的に監視し、安定を確認したうえでカバレッジを広げていく。
初日50%解決と収益10倍成長
実際の展開事例では、初日の時点で紛争処理、本人確認、不正対応といった複雑なワークフローでも解決率が50%を超えている。顧客満足度スコア(CSAT)は最高98%に達し、場合によっては人間の優秀なオペレーターを上回るケースも報告されているという。
こうした成果を背景に、Gradient Labsは過去1年間で収益を10倍以上に伸ばした。当初はインバウンドのサポート対応に特化していたが、現在はアウトバウンド業務やバックオフィスプロセスへも展開範囲を広げている。
今後の方向性として、同社は複数の会話にまたがってコンテキストを保持する仕組みの構築を掲げている。顧客の履歴を参照し、進行中の案件を追跡し、以前の会話から継続した対応が可能なシステムだ。Antoniou氏は「今日使うモデルを選んでいるのではなく、推論モデルの発展方向が自分たちのプロダクトと同じ軌跡を描くプラットフォームの上に構築している」と語り、OpenAIとの長期的な連携への展望を示した。