- エンジニア1人あたりのAIトークン支出が約9か月間で18.6倍に急増し、多くの企業で予算策定の前提が根本から崩れつつある(Jellyfish調査)
- Uberが2026年の年間AI予算を4月時点で使い果たし、Pricelineでは開発ツールの更新費が4〜5倍に急騰
- 業界の関心が「性能追求」から「コスト管理と透明性の確保」へ転換し、標準化団体の設立など対応が本格化
急増するトークン費用の実態
企業がAI開発ツールを本格導入して以来、トークン(AIが処理するテキストの単位)の利用コストが予想を大幅に上回るペースで膨らんでいる。エンジニアリング指標を分析するJellyfishの調査によると、エンジニア1人あたりのトークン消費量は2025年秋から2026年夏にかけての約9か月間で18.6倍に増加した。同様の傾向はFaros AIの調査でも確認されており、トークン支出の急増は特定企業に限らない業界全体の現象となっている。
コスト増加の背景には、AIコーディング支援ツールのエージェント化がある。GitHub Copilot、Cursor、ClaudeなどのツールがAIエージェントとして動作する場面が増え、1回のタスクで複数のAPIコールが連鎖的に実行されるようになった。単純な補完機能であれば1回のリクエストで済むが、エージェント型の使い方では同じタスクに数十から数百回分のトークンが消費される。ツールを使えば使うほど費用が積み上がる従量課金モデルの性質上、利用拡大とコスト増加は切り離せない関係にある。
Uberと大手企業が直面した現実
Uberは2026年の年間AI予算を4月の時点で使い果たした。会計年度が残り8か月ある段階での出来事であり、予算策定時の見込みがいかに実態からかけ離れていたかを示している。同社はその後、利用量の上限設定や部門ごとの割り当て管理に急きょ取り組んだ。
旅行予約サービスのPricelineでは、AIコーディング支援ツール「Cursor」のライセンス更新費が1回の更新で4〜5倍に跳ね上がったと社員が証言している。また、ある企業はClaudeの利用上限を設定し忘れたために500万ドル(約7.5億円)の請求書を受け取り、別の事例ではエンジニア1人が月間4万ドル相当のトークンを消費していたことも明らかになった。MicrosoftもCopilotのライセンスを数か月後に一部取り消しており、大手テクノロジー企業でさえコスト管理に苦慮している実態が浮かぶ。

生産性向上とコストのジレンマ
AIツールの費用対効果については、単純に「コストが高い」とは言い切れない面もある。Faros AIの調査では、トークン利用量が多い上位のエンジニアは他と比べて生産性が約2倍高い一方で、コストは約10倍に達することが分かった。生産性向上の幅に対してコスト増加の幅が大きすぎるという逆転現象が多くの企業で起きている。
AIツールを全面導入したEndavaの事例のように生産性向上を実感する企業は多い。しかし費用対効果の測定基準をどこに置くかが、今後のAI投資判断を左右する重要な問いとなっている。OpenAIの幹部は「以前は性能について質問されたが、今は支出の透明性と効率について尋ねられることが増えた」と語っており、業界全体の関心の変化を端的に示している。
コスト管理の標準化に向けた動き
こうした状況を受け、AI支出の管理・可視化を専門とするサービスが急速に広がっている。Pay-iやPaidなどのスタートアップに加え、経費管理のRampや監視ツールのDatadogも対応機能を次々と追加している。2026年6月にはTokenomics Foundationが設立され、トークン使用量の測定基準やコスト管理の業界標準化に向けた取り組みが始まった。
FinOps財団は「クラウドインフラの利用データは月間数百万行程度だが、トークンのデータは月間数兆行に達する」と警告している。データ量の桁が違うため、従来のクラウドコスト管理ツールをそのまま流用することはできない。各社はチームやプロジェクト単位での月次予算の設定、使用量に応じた段階的なアクセス制限、高精度なモデルが不要なタスクへの安価なモデルの自動割り当てといった対策を取り始めている。
ゴールドマン・サックスは2030年までにトークン使用量が現在の24倍に増加すると予測している。コスト管理の仕組みを早期に整備できるかどうかが、企業のAI活用戦略の持続可能性を左右する重要な要素になりつつある。
