- OpenAIとBroadcomが共同開発したLLM推論特化チップ「Jalapeño」を正式発表。Google TPUやAmazon Trainiumと並ぶ独自シリコン戦略が本格始動しました
- 設計完了までの期間は約9カ月と、従来の半導体開発の3分の1以下に短縮。AI支援設計ツールの活用が工程を大幅に加速させました
- NVIDIAのGPUへの依存低減と推論コスト削減が主な目的。OpenAI・Broadcom・製造パートナーの3社が役割を明確に分担しています
LLM推論専用チップ「Jalapeño」とは
OpenAIとBroadcomは2026年6月、大規模言語モデル(LLM)の推論処理に特化したカスタムチップ「Jalapeño」を共同発表しました。このチップはAIモデルが回答を生成する推論(インファレンス)のみを担う設計で、汎用GPUとは異なる専用アーキテクチャを採用しています。
JalapeñoはGoogleのTPUシリーズやAmazonのTrainium・Inferentiaといったハイパースケーラーの独自シリコン路線に並ぶ存在です。特定ワークロードへの最適化によって汎用GPUより高いコスト効率を実現するこれらのチップと同様に、OpenAIも大規模サービス運用のための専用ハードウェアを本格的に推進し始めました。
3社の役割分担と開発背景
今回の開発は、OpenAI・Broadcom・半導体製造パートナーの3社が明確な役割分担のもとで進めました。OpenAIはモデルの推論要件と性能仕様の定義を担い、BroadcomがそれをもとにASIC(特定用途向け集積回路)の設計を担当。BroadcomはすでにGoogleのTPUシリーズをはじめとする複数のハイパースケーラー向けASIC設計実績を持つ企業であり、推論チップ開発における信頼できるパートナーです。製造工程は先端プロセスを持つファウンドリが受け持つ体制です。
OpenAIがカスタムチップ開発に踏み切った背景には、大規模なGPU調達コストの問題があります。ChatGPTをはじめとするサービスを通じて毎日数十億回規模の推論リクエストをさばく同社にとって、NVIDIA製GPUへの依存は調達コストと特定ベンダーへのロックインリスクという2つの課題を生み出していました。ASMLの次世代EUV装置が示すように先端半導体の製造インフラが整備されてきたことも、独自チップ量産への踏み切りを後押しする要因となっています。
推論専用のカスタムASICは、メモリ帯域幅の配分やトークン生成のパイプライン設計をLLM専用に最適化できます。汎用GPUと比べて不要な演算回路を省いた分だけ電力効率を高められるため、数千台規模で稼働するデータセンターでは総コストの差が顕著になります。
9カ月での設計完了とAI活用
Jalapeñoの設計期間は約9カ月と、従来の半導体開発にかかる2〜3年と比べて大幅に短縮されています。カスタムASICの開発では通常、機能検証・テープアウト・プロトタイプ評価に長い期間を要しますが、今回はAIを活用した設計ツールがこの工程を圧縮しました。
チップのフロアプランニングやタイミング解析、消費電力シミュレーションといった工程にAIモデルを投入することで、従来はエンジニアが数カ月をかけて繰り返していた最適化ループを自動化しました。OpenAIは自社のAI技術を設計フロー自体に組み込むことで、チップ開発の反復サイクルを短縮しています。

「AIでチップを設計する」アプローチはGoogleやAMDも実験段階にありますが、実用規模の量産チップへの適用はまだ珍しい事例です。Jalapeñoの開発成功は、半導体設計へのAI活用の有効性を示す実証事例としても業界の関心を集めています。
NVIDIA依存の低減と業界への影響
推論ワークロードに最適化されたカスタムチップは、汎用GPUと比較して特定タスクでの消費電力あたりの処理性能が高くなる傾向があります。OpenAIの場合、Jalapeñoを大量に導入できれば、NVIDIAのH100・H200シリーズに依存した現行インフラから一部を切り替えることで、推論1回あたりのコストを削減できると見られます。
業界全体でみると、大手AIサービス事業者が独自チップを持つことは半導体市場の構造変化につながります。GoogleがTPUでサービス基盤を整え、Amazonがシリコン垂直統合でクラウドコストを下げたように、OpenAIも同様の内製化路線を歩み始めました。
今後はJalapeñoを用いた推論インフラが拡大するにつれ、OpenAIのAPI提供コストや応答速度にも変化が生じる可能性があります。企業向けサービスの料金競争が激化するなか、自社チップによるコスト構造の改善は、サービス価格の引き下げや新モデルの迅速な展開における優位性として機能すると考えられます。NVIDIAへの依存が分散されることは、AI産業のインフラ多様化という観点からも重要な変化です。