内科×AIの
世界最先端を一望する
Med-Gemini が USMLE を超え、Abridge と Nuance DAX が外来文書を消し、Aidoc と Viz.ai が放射線科を二段化し、HeartFlow と Cleerly が冠動脈評価を再定義する。本ページは PubMed・FDA承認・実装規模で世界最先端と言える事例だけを地図化したものです。姉妹編の外科版と合わせてご覧ください。
PubMedベース・
内科×AI 注目6テーマ
直近1〜2年で内科×AI領域に大きな影響を与えた研究を、研究デザイン・主要結果・臨床的含意の3点で整理しました。
臨床推論LLM(鑑別診断・症例推論)
GPT-4・Claude・Med-Gemini は USMLE Step 1〜3 で人間平均を超え、NEJM Case Records で熟練医に匹敵する鑑別診断を提示。一方で Goh ら(JAMA 2024)の RCT では「LLM単独 > 医師+LLM」となり、LLMを臨床ワークフローへ統合する人間-AI協調設計が次の課題に。
- 研究デザイン: 多施設RCT、ベンチマーク評価
- 主要結果: LLM単独で診断精度85%超(医師74%)
- 臨床的含意: AIをsecond-opinionに位置付ける必要性
Goh E et al. JAMA Netw Open 2024. Nori H et al. Nature 2024 (Med-Gemini).
環境型AIスクライブ(Ambient Documentation)
Tierney らの The Permanente Journal、Shanafelt の MGB報告などで、Ambient Scribe導入後に医師1人あたり日60〜90分の文書時間削減・燃え尽きスコアの有意改善が確認されている。米国では Abridge・Nuance DAX が大規模医療システムで全外来導入のフェーズに入った。
- 研究デザイン: 多施設前後比較、医師アンケート
- 主要結果: pajama time(自宅での記録時間)大幅削減
- 臨床的含意: 燃え尽き対策として最大の即効インパクト
Tierney AA et al. Perm J 2024. Garcia P et al. JAMA Netw Open 2024.
画像診断AI(FDA最多承認領域)
FDA AI/ML-Enabled Medical Devices リスト(2025)は1,000件超で、その約75%が放射線。Viz.ai LVO(脳卒中CTA)でDoor-to-Puncture時間が有意短縮。HeartFlow FFRct と Cleerly Plaque Analysis で侵襲的冠動脈造影を回避できる症例が増加。
- 研究デザイン: prospective registry、外部検証
- 主要結果: 治療開始時間の短縮、不要侵襲検査の削減
- 臨床的含意: 病院ワークフローへのAI統合
FDA. AI/ML-Enabled Medical Device List 2025. Cleerly: Min JK et al. JACC 2023.
慢性疾患リスク予測(CKD・心不全・糖尿病)
EHR + ウェアラブル + ゲノムを統合した CKD進行予測(Renalytix)、心不全再入院予測(Bayesian Health)、糖尿病合併症予測などが、保険者・大規模医療システムで PMPM ベースに採用される段階。reactive→proactive ケアへの転換点。
- 研究デザイン: 多施設EHR、外部検証、HEDIS連動
- 主要結果: 高リスク患者特定で介入効率2〜3倍
- 臨床的含意: バリューベース・ケアの中核技術
Bayesian Health: Adams R et al. Nat Med 2022. Renalytix: KidneyIntelX (FDA breakthrough).
連続モニタリング・ウェアラブル
Apple Watch AFib通知(Apple Heart Study)、Dexcom CGMによる Time-In-Range概念、Eko AIによる弁膜症スクリーニング、iRhythm Zio。受診→検査→診断 の流れが、常時モニタ→通知→確認に逆転する局面。
- 研究デザイン: prospective cohort、SaMD臨床試験
- 主要結果: 無症候AFib・糖尿病管理改善
- 臨床的含意: 外来モデルの再設計
Perez MV et al. NEJM 2019 (Apple Heart). Eko / Ultromics: FDA cleared 2024–2025.
責任あるAI(hallucination / bias / 規制)
2024年 BMJ TRIPOD-LLM、FDA Predetermined Change Control Plan、CMS の AI使用に関する透明性ルールが揃い、内科LLMは hallucination対策・人種補正除去・公平性監査が事実上の必須要件に。EU AI Actで医療AIは高リスクAIに分類。
- 規格: TRIPOD-LLM、CONSORT-AI v2、SPIRIT-AI
- 規制: FDA PCCP、CMS AI透明性、EU AI Act
- 臨床的含意: hallucinationを前提とした人間-AI協調
Gallifant J et al. Nat Med 2024 (TRIPOD-LLM). Vyas DA et al. NEJM 2020 (race correction).
AI関連 vs
AI非関連トレンド
内科の話題はAIに収束していると誤解されがちですが、GLP-1・腸内細菌・心アミロイドーシスなどAI非関連テーマも同等に重要です。
内科×AI
世界フロンティア9拠点
「査読論文/FDA承認/実装規模」のいずれかで世界最先端と言える事例だけを選定しました。
Google / Med-Gemini & Med-PaLM 2 — 医療LLM基盤モデル
USMLE系ベンチマークで人間専門医水準。マルチモーダル(テキスト・画像・ゲノム・時系列)対応。Mayo Clinic・HCA・Mount Sinaiでパイロット導入。OpenAI GPT-4・Anthropic Claudeも医療チューニングで急速に追随。
Singhal K et al. Nature 2023 (Med-PaLM 2). Nori H et al. Nature 2024 (Med-Gemini).
Abridge / Nuance DAX Copilot — 環境型AIスクライブ
Abridge は Kaiser Permanente、Sutter Health、UPMC など全米最大規模の医療システムで全外来導入を達成(Series E累計$5億超)。Nuance DAX Copilot は Epic と統合され、医師1人あたり日60〜90分の文書時間削減、燃え尽きスコア改善が報告されている。
abridge.com / DAX Copilot / Tierney AA et al. Perm J 2024.
Aidoc / Viz.ai / RapidAI — 画像AIトリアージ
- Aidoc: CT全身(脳出血・PE・気胸・大動脈解離)、世界1,500病院超
- Viz.ai: LVO検出でDoor-to-Puncture時間短縮、初のCMS NTAP取得
- RapidAI: Stroke / PE / Aortic、Stanford発
放射線AIは「読影代替」から「ワークフロー再設計」へ進化。CMS のAIに対する追加支払コードが整備された数少ない領域。
OpenEvidence / Glass Health — 臨床推論支援
OpenEvidence は医師確認制で米国医師の利用が急拡大、引用付き回答の標準を確立。Glass Health は鑑別診断と治療プラン生成に特化したクリニカルAI。Isabel・Ada・Buoy・K Healthなどconsumer向けも併存。OpenEvidence × SIMY 比較も参照。
Apple Watch / Dexcom / Eko — ウェアラブル連続モニタ
- Apple Watch: AFib通知(Apple Heart Study, NEJM 2019)、転倒検出、SpO2
- Dexcom CGM: Time-In-Range概念、米国非糖尿病使用拡大
- Eko: AI聴診器、弁膜症スクリーニング、FDA承認
- iRhythm Zio: 不整脈14日連続記録
受診→検査→診断 が常時モニタ→通知→確認 に逆転していく方向性。
Perez MV et al. NEJM 2019. dexcom.com / ekohealth.com
HeartFlow / Cleerly / Ultromics — 循環器特化AI
HeartFlow FFRct(冠動脈CTから機能評価)、Cleerly Plaque Analysis(プラーク全体評価)、Ultromics EchoGo(心エコーAI)が侵襲的冠動脈造影を回避できる症例増加。Eko聴診器との連携で外来から循環器精査まで連続的にAIが介在。
Stanford CHARM / MIT CSAIL Clinical ML — アカデミア中核
Stanford CHARM (Center for Artificial Intelligence in Medicine) はマルチモーダル医療基盤モデル、MIT CSAIL Clinical ML は EHR・公平性研究、NIH Bridge2AI は基盤データセット整備を主導。学術と FDA・CMS規制の橋渡しを担う。
Hippocratic AI / Suki / DeepScribe — 患者対話AI・スクライブ
Hippocratic AI は安全性特化型LLMで、退院後フォローアップコール・服薬支援などの患者向け対話を担う。Suki・DeepScribe はAmbient Scribeの中堅勢で、独立クリニック向けに展開。Patient-facing AI が外来時間短縮と再入院抑制を担う段階に。
日本で世界水準にある領域
- LPIXEL: EIRL シリーズ(眼底・脳MRI動脈瘤・胸部CT)、PMDA最多承認の国内AI企業。
- Ubie: 症状チェッカーで月間1,500万人超の利用、製薬企業・自治体への展開も。
- AIメディカルサービス(CADDIE): 上部消化管内視鏡AI、世界水準の早期胃癌検出AI。
- サスメド: 不眠症デジタル治療等のSaMD領域。
注: 医療LLM基盤モデル・大規模Ambient Scribeは米国主導で、日本はローカライズ・規制適応・独自データに注力する局面。
臨床自律レベル分類
CAL(Clinical Autonomy Level)
外科のSAL(Surgical Autonomy Level)に対応する内科版自律レベル分類です。本ページの独自提案であり、学会標準ではありません。
純マニュアル診療
情報提示
推奨提示(CDSS)
条件付自律
高度自律(限定領域)
完全自律
★=普及 ◆=萌芽 ▲=研究/限定承認 ─=未到達
現在のフロンティア
L2が主流(CDSS・画像AI・LLM鑑別)。L4の事例は IDx-DR(眼科だが内科外来でも使用される自動診断AI)が唯一の規制承認例で、これを超える領域は法的責任・hallucination が壁。L3の自動処方は限定プロトコル下で実装が広がり始めた段階。
内科AI
VCマーケットマップ 2026
領域 × 代表プレーヤーで投資家視点の俯瞰図を提示します。
Health LLM / Foundation
Google Med-Gemini、Med-PaLM 2、OpenAI GPT-4、Anthropic Claude、Hippocratic AI、OpenEvidence
Clinical Decision Support
Glass Health、Isabel、Ada Health、Buoy Health、K Health、Causaly
Ambient Scribe
Abridge、Nuance DAX、Suki、Augmedix、DeepScribe、Heidi Health。
🇯🇵 SIMY(音声入力AI、医療特化、日本リージョン)
Diagnostic Imaging
Aidoc、Viz.ai、RapidAI、HeartFlow、Cleerly、Annalise.ai、Lunit、Paige、Tempus
Wearables / Remote Monitor
Apple、Dexcom、Whoop、Eko、iRhythm、Biofourmis、Withings
Disease-specific AI
循環器: Ultromics、Eko、Cleerly、HeartFlow
消化器: Medtronic GI Genius、Iterative Health、AIメディカルサービス
腎臓: Renalytix
糖尿病: Tidepool、Beta Bionics
Population Health / Risk
Bayesian Health、Jvion、ClosedLoop、Komodo Health、Health Catalyst
Patient-facing AI
Hippocratic AI、Babylon、Sensely、Woebot、Wysa
🇯🇵 Ubie(症状チェッカー)
成熟度マップ(Hype Cycle 風)
| 段階 | 領域 | 時期目安 |
|---|---|---|
| 普及期 | 放射線画像AIトリアージ、CDSS、UpToDate型情報 | 2024〜 |
| 早期普及 | Ambient Scribe(米大規模)、CGM、Apple Watch AFib | 2025〜2027 |
| 実装研究 | LLM鑑別診断、慢性疾患リスクML、循環器AI(HeartFlow/Cleerly) | 2025〜2028 |
| 研究実証 | マルチモーダル医療基盤モデル、Ambient Scribe(日本)、Patient-facing LLM | 2026〜2029 |
| 萌芽期 | CAL L3条件付自律処方、AI監査制度、Federated medical LLM | 2027〜2030+ |
主要ディール
| 年 | 動き | 金額 |
|---|---|---|
| 2021 | Microsoft が Nuance を買収 | $19.7B |
| 2023 | Med-PaLM 2 発表(Google) | — |
| 2024 | Med-Gemini 発表(Google DeepMind) | — |
| 2024 | Abridge Series D | $150M |
| 2024 | FDA AI/ML-Enabled Devices リスト 1,000件突破 | — |
| 2025 | Abridge Series E(評価額$5B超と報道) | $300M+ |
| 2025 | OpenEvidence Series B | $75M |
| 2025 | EU AI Act 医療AI高リスク分類施行 | — |
日本の内科医療
近未来シナリオ
日本の構造的特徴(プライマリケア弱体・診療科縦割り・公的保険一元)を前提にしたシナリオA〜F。
A. Ambient Scribe で外来効率化
米国実績(医師日90分削減)を踏まえ、日本でも環境型ドキュメンテーションの普及が始まる。患者情報のサーバ所在地・日本リージョン要件が選定基準に。
B. LLMが second-opinion 標準化
外来でLLM鑑別診断が標準ツール化。専門医はAI出力をレビュー・是正する役割に。研修医教育への影響大。
C. 画像AI二段読影
放射線科レポートが「AI一次読影→医師確認」の二段化。遠隔読影と組み合わせて夜間・休日対応の標準化が進む。
D. 連続モニタで reactive→proactive
Apple Watch・CGM・Eko聴診器による常時モニタが慢性疾患管理の主流に。受診頻度の最適化と外来モデル変革。
E. プライマリケアの再定義
症状チェッカー(Ubie等)+オンライン診療+AI鑑別で、軽症のフロントは大きく変わる。家庭医不足の日本では特に効果大。
F. 責任分担と規制
誤診時の責任分担、PMDA SaMD審査、医師法上の位置付けが整備される。EU AI Act の動きが日本に波及。
インパクト・
マトリクス
患者・内科医・病院経営・規制・産業 × 5年/10年/10年+ で内科AIのインパクトを整理しました。
| 軸 | 5年以内 | 5–10年 | 10年以降 |
|---|---|---|---|
| 患者体験 | 症状チェッカー普及、待ち時間短縮 | 連続モニタリングが日常化 | AI主導のproactiveケアの選択肢 |
| 内科医のワークフロー | Ambient Scribeで文書時間半減 | LLM second-opinionが標準化 | 監督・調整役へのシフト |
| 病院経営 | 外来回転率向上、燃え尽き対策 | 遠隔モニタ収益化、二段読影 | AIサービス収益化(保険外) |
| 規制 | TRIPOD-LLM / SaMD整備 | AI監査・PCCP普及 | CAL L3条件付自律処方の制度化 |
| 産業 | Ambient Scribe市場確立 | 医療基盤モデル国内化 | Patient-facing AI輸出 |
| 軸 | 内科AI | 外科AI |
|---|---|---|
| 中核データ | テキスト・画像・時系列 | 手術動画・力覚・機器ログ |
| 主要モデル | LLM | Vision Transformer / 模倣学習 |
| FDA承認最多領域 | 放射線画像AI | ロボット手術機器 |
| 自律化のボトルネック | 法的責任・hallucination | ハードウェア・規制・倫理 |
| 即効インパクト | Ambient Scribe | OR効率最適化 |
| 5年後の主戦場 | LLM臨床統合・規制 | L2タスク自律商用化 |
| 10年後 | プライマリケアAI再定義 | L3自律手術臨床試験 |
| 日本の競争力 | 症状チェッカー・画像AI | 動画DB・技能評価 |
| 投資ホットスポット | 米・イスラエル・英 | 米・加・仏 |
| 規制フレーム | SaMD + LLM新枠組み | SaMD + ロボット規制 |
引用文献
- Singhal K, et al. Large language models encode clinical knowledge. Nature 2023;620:172-180. DOI
- Nori H, et al. Capabilities of Med-Gemini. Nature 2024.
- Goh E, et al. Large Language Model Influence on Diagnostic Reasoning: A Randomized Clinical Trial. JAMA Netw Open 2024;7:e2440969.
- Tierney AA, et al. Ambient Artificial Intelligence Scribes to Alleviate the Burden of Clinical Documentation. NEJM Catalyst 2024.
- Garcia P, et al. Artificial Intelligence-Generated Draft Replies to Patient Inbox Messages. JAMA Netw Open 2024.
- Perez MV, et al. Large-Scale Assessment of a Smartwatch to Identify Atrial Fibrillation. NEJM 2019;381:1909-1917.
- Adams R, et al. Prospective, multi-site study of patient outcomes after implementation of the TREWS machine learning-based early warning system for sepsis. Nat Med 2022;28:1455-1460.
- Min JK, et al. Cleerly Plaque Analysis. JACC 2023.
- Gallifant J, et al. The TRIPOD-LLM reporting guideline for studies using large language models. Nat Med 2024.
- Vyas DA, et al. Hidden in Plain Sight — Reconsidering the Use of Race Correction in Clinical Algorithms. NEJM 2020;383:874-882.
- FDA. Artificial Intelligence and Machine Learning (AI/ML)-Enabled Medical Devices. 2025. FDA
- FDA. Predetermined Change Control Plan (PCCP) Final Guidance. 2024.
- Abridge. abridge.com
- Microsoft Nuance. DAX Copilot. 公式
- Aidoc. aidoc.com
- Viz.ai. viz.ai
- RapidAI. rapidai.com
- OpenEvidence. openevidence.com
- Glass Health. glass.health
- Hippocratic AI. hippocraticai.com
- HeartFlow. heartflow.com
- Cleerly Health. cleerlyhealth.com
- Ultromics. ultromics.com
- Eko Health. ekohealth.com
- iRhythm Technologies. 公式
- Dexcom. dexcom.com
- Apple Heart Study & Apple Watch ECG. Apple Inc.
- Stanford AIMI. aimi.stanford.edu
- MIT Clinical ML. clinicalml.org
- NIH Bridge2AI. 公式
- IDx-DR / Digital Diagnostics. 公式
- Renalytix. KidneyIntelX. 公式
- Bayesian Health. 公式
- Suki AI. suki.ai
- DeepScribe. deepscribe.ai
- Augmedix. augmedix.com
- Heidi Health. 公式
- Annalise.ai. annalise.ai
- Lunit. lunit.io
- Paige.AI. 公式
- Tempus AI. 公式
- Medtronic GI Genius. 公式
- LPIXEL. EIRL シリーズ. lpixel.net
- Ubie. ubie.app
- AIメディカルサービス(CADDIE). ai-ms.com
- サスメド. 公式
- EU. Artificial Intelligence Act. 2024.
- CMS. NTAP Coverage for AI Software (Viz.ai). 2020–.
内科×AI
よくある質問
医療LLMで世界最先端は何ですか?
Google Researchの Med-Gemini と Med-PaLM 2 が学術ベンチマーク(USMLE系)で最高水準の性能を示しています。臨床応用面では OpenEvidence(医師向けエビデンス検索)、Glass Health(鑑別診断)、Hippocratic AI(患者対話)が代表的です。GPT-4・Claudeなど汎用LLMも医療特化チューニングで急速に追い上げています。
環境型AIスクライブとは何ですか?
医師-患者の会話を環境マイクで録音し、リアルタイムでSOAPノート・カルテ記載・処方候補を自動生成するAIです。Abridge(米最大手)、Nuance DAX Copilot(Microsoft傘下)、Suki、DeepScribeが代表的。米国では既にKaiser・HCA・MGB等の大規模システムで全外来導入が進み、医師1人あたり日90分の文書時間削減が報告されています。
画像AIで最もFDA承認が多いのは?
放射線画像AIです。FDAのAI/ML-Enabled Medical Devicesリスト(2025年)では総承認数1,000件超のうち約75%が放射線領域。Aidoc(CT全身)、Viz.ai(脳卒中LVO)、RapidAI(脳卒中・PE)、HeartFlow/Cleerly(冠動脈CT)、Annalise.ai(CXR)、Lunit(マンモ・CXR)が代表企業です。
CAL(Clinical Autonomy Level)とは?
本ページで提案する内科版の自律レベル分類で、外科のSAL(Surgical Autonomy Level)に対応します。L0=純マニュアル、L1=情報提示(UpToDate)、L2=推奨提示(CDSS、現在の主流)、L3=条件付自律(プロトコル下処方)、L4=高度自律(限定領域でAI診断確定)、L5=完全自律(未到達)。学会標準ではなく独自提案である点に注意してください。
日本は内科AIで世界最先端と言える分野はありますか?
LPIXELの眼底AI・脳MRI動脈瘤検出、Ubieの症状チェッカー、AIメディカルサービス(CADDIE)の消化器内視鏡AIは世界水準です。一方、医療LLM基盤モデル・大規模Ambient Scribeでは米国主導で、日本はローカライズ・規制適応に注力する局面です。
環境型AIスクライブはAmbient Scribeとどう違いますか?
同じ概念です。英語ではAmbient Scribe / Ambient AI / Ambient Documentation / Ambient Listeningと呼ばれ、日本語では環境型AIスクライブ・環境型ドキュメンテーションと訳されます。医師の口述を能動的に録音するSIMYのような音声入力AIとは設計思想が異なり、診察会話そのものから自動でカルテを作る点が特徴です。
内科医の業務は10年でどう変わりますか?
短期最大インパクトはAmbient Scribeによる外来文書時間の削減(日90分級)、中期は画像AIの二段読影と慢性疾患の連続モニタリング普及、長期はCAL L3(プロトコル下AI処方)の限定臨床導入と思われます。プライマリケアは症状チェッカー+遠隔診療+AIで再定義される可能性が高く、専門医はsecond-opinion生成型LLMが標準ツール化します。
日本でAmbient Scribeを導入する際の注意点は?
診察音声は要配慮個人情報のため、サーバ所在地・暗号化・LLM学習への利用可否の事前確認が必須です。患者同意の運用も論点です。Pocket IC専用に日本リージョンで運用するSIMYは、患者氏名等の直接識別情報を即時非保存とする設計のため、国内コンプライアンス要件と整合します。
内科AIの最大インパクトは、
"記録の自動化" から始まる。
米国の Ambient Scribe 先行事例は、医師1人あたり日90分の文書時間削減を実証しています。日本リージョンで安全に使える音声AIから始めませんか。