Google DeepMind「AI Co-Clinician」発表 — 三者協働医療モデルとは？

WHO予測による2030年の医療従事者1,000万人不足に対し、Google DeepMindがAI・医師・患者の「Triadic Care（三者医療）」モデルを提唱
140以上の診療スキル指標を用いた評価でAIは68/140の項目で医師と同等以上の性能を達成し、98件中97件でクリティカルエラーゼロを記録
ハーバード・スタンフォード医学部と共同で120回の遠隔診療シミュレーションを実施し、音声・映像対応のリアルタイムAIを多面的に検証

2030年の医療危機と三者協働

世界保健機関（WHO）は、2030年までに全世界で1,000万人を超える医療従事者が不足すると予測しています。この深刻な供給危機への解答として、Google DeepMindは2026年4月30日、AI共同臨床医「AI Co-Clinician」研究イニシアチブを発表しました。

同イニシアチブが提唱するのは「Triadic Care（三者医療）」モデルです。AIが患者を支援しながらも、すべての意思決定は主治医の臨床権限のもとで行われる枠組みで、AIを自律的な判断主体ではなく医療チームの補完的な一員として位置付けることが核心です。「AIが医師を代替する」という議論とは一線を画し、医師の専門知識を増幅することが目的とされています。

臨床医向け機能の評価

臨床医向け機能の評価では、情報の過剰提供と情報欠落それぞれの誤りを測定するNOHARMフレームワークを用いて、実際に近い98件のプライマリケア相談クエリを検証しました。盲検評価において、医師は既存の主要な医療情報システムよりもAI Co-Clinicianの回答を一貫して高く評価しており、98件中97件でクリティカルエラーが発生しなかったことが確認されています。

薬剤知識の評価にはOpenFDA RxQAベンチマークを使用しました。オープンエンド形式（実際の診療に近い問い方）で問われた場合、AI Co-Clinicianは他の最前線AIシステムを上回り、医師の熟練度に近い薬剤推論能力と複雑な治療介入への対応力を示しました。

遠隔診療シミュレーション

患者向け機能の評価はハーバード医学部とスタンフォード医学部と共同で設計されました。20件の合成臨床シナリオ、10名の医師による「患者役」、合計120回の仮想遠隔診療セッションという規模で実施され、実際のプライマリケア医・AI Co-Clinician・GPT-4 Real Timeの3者を比較対象としました。

テキスト応答に限らず、リアルタイムの音声・映像対応も評価の対象となっています。吸入器の使用技術の誤りをAIが即座に指摘・修正するケースや、肩の動きを映像で観察しながら腱板損傷を特定する身体診察ガイダンスなど、テキスト専用システムには難しいマルチモーダルな診療支援能力が検証されました。

140項目の診療スキル評価

診療スキルの評価は7つのドメインにまたがる140以上の指標を用いて実施されました。専門医はAIを全体的に上回り、特に「レッドフラッグ（緊急サインの識別）」と重要な身体診察ガイダンスの提供において明確な優位性が確認されました。

一方でAI Co-Clinicianは、140項目中68項目（約49%）において医師と同等以上の性能を示しました。研究チームは現時点では補助的支援ツールとしての活用が最適と結論付けており、同社がAlphaFoldなどで実証してきた科学研究への包括的なアプローチと一貫した段階的評価の姿勢が見られます。

安全性を担保する二層構造

患者と直接対話する場面の安全性確保には、二層のエージェントアーキテクチャが採用されています。「Planner」モジュールが会話全体を継続的に監視し、「Talker」エージェントが安全な臨床的境界内で応答を生成する仕組みです。加えて、臨床グレードのエビデンスを優先し、情報源の検証と引用チェックを組み込んだ検索機能が設けられています。

研究は米国・インド・オーストラリア・ニュージーランド・シンガポール・UAEの学術・医療機関との連携のもとで段階的に進められており、「疾患の診断・治療・予防、または医療アドバイスの提供を目的としていない」と明示されています。MedPaLMやAMIEといった先行研究を土台に、医療AIの実用化に向けた安全性検証が着実に積み重ねられています。

AI co-clinician: researching the path toward AI-augmented care — Google DeepMind