内科×AI 世界最先端マップ 2026｜Med-Gemini・Ambient Scribe・画像AI徹底解説

Q: 医療LLMで世界最先端は何ですか？

Google Research の Med-Gemini と Med-PaLM 2 が学術ベンチマーク（USMLE系）で最高水準の性能を示しています。臨床応用面では OpenEvidence（医師向けエビデンス検索）、Glass Health（鑑別診断）、Hippocratic AI（患者対話）が代表的です。GPT-4・Claudeなど汎用LLMも医療特化チューニングで急速に追い上げています。

Part 1 / PubMed Evidence

PubMedベース・
内科×AI 注目6テーマ

直近1〜2年で内科×AI領域に大きな影響を与えた研究を、研究デザイン・主要結果・臨床的含意の3点で整理しました。

①

臨床推論LLM（鑑別診断・症例推論）

領域: Clinical Reasoning / Medical LLM

GPT-4・Claude・Med-Gemini は USMLE Step 1〜3 で人間平均を超え、NEJM Case Records で熟練医に匹敵する鑑別診断を提示。一方で Goh ら（JAMA 2024）の RCT では「LLM単独 > 医師＋LLM」となり、LLMを臨床ワークフローへ統合する人間-AI協調設計が次の課題に。

研究デザイン: 多施設RCT、ベンチマーク評価
主要結果: LLM単独で診断精度85%超（医師74%）
臨床的含意: AIをsecond-opinionに位置付ける必要性

Goh E et al. JAMA Netw Open 2024. Nori H et al. Nature 2024 (Med-Gemini).

②

環境型AIスクライブ（Ambient Documentation）

領域: Documentation Burden / EHR

Tierney らの The Permanente Journal、Shanafelt の MGB報告などで、Ambient Scribe導入後に医師1人あたり日60〜90分の文書時間削減・燃え尽きスコアの有意改善が確認されている。米国では Abridge・Nuance DAX が大規模医療システムで全外来導入のフェーズに入った。

研究デザイン: 多施設前後比較、医師アンケート
主要結果: pajama time（自宅での記録時間）大幅削減
臨床的含意: 燃え尽き対策として最大の即効インパクト

Tierney AA et al. Perm J 2024. Garcia P et al. JAMA Netw Open 2024.

③

画像診断AI（FDA最多承認領域）

領域: Radiology / Cardiology / Ophthalmology

FDA AI/ML-Enabled Medical Devices リスト（2025）は1,000件超で、その約75%が放射線。Viz.ai LVO（脳卒中CTA）でDoor-to-Puncture時間が有意短縮。HeartFlow FFRct と Cleerly Plaque Analysis で侵襲的冠動脈造影を回避できる症例が増加。

研究デザイン: prospective registry、外部検証
主要結果: 治療開始時間の短縮、不要侵襲検査の削減
臨床的含意: 病院ワークフローへのAI統合

FDA. AI/ML-Enabled Medical Device List 2025. Cleerly: Min JK et al. JACC 2023.

④

慢性疾患リスク予測（CKD・心不全・糖尿病）

領域: Population Health / Predictive ML

EHR + ウェアラブル + ゲノムを統合した CKD進行予測（Renalytix）、心不全再入院予測（Bayesian Health）、糖尿病合併症予測などが、保険者・大規模医療システムで PMPM ベースに採用される段階。reactive→proactive ケアへの転換点。

研究デザイン: 多施設EHR、外部検証、HEDIS連動
主要結果: 高リスク患者特定で介入効率2〜3倍
臨床的含意: バリューベース・ケアの中核技術

Bayesian Health: Adams R et al. Nat Med 2022. Renalytix: KidneyIntelX (FDA breakthrough).

⑤

連続モニタリング・ウェアラブル

領域: Remote Monitoring / Cardiology / Diabetes

Apple Watch AFib通知（Apple Heart Study）、Dexcom CGMによる Time-In-Range概念、Eko AIによる弁膜症スクリーニング、iRhythm Zio。受診→検査→診断の流れが、常時モニタ→通知→確認に逆転する局面。

研究デザイン: prospective cohort、SaMD臨床試験
主要結果: 無症候AFib・糖尿病管理改善
臨床的含意: 外来モデルの再設計

Perez MV et al. NEJM 2019 (Apple Heart). Eko / Ultromics: FDA cleared 2024–2025.

⑥

責任あるAI（hallucination / bias / 規制）

領域: Regulatory / Ethics

2024年 BMJ TRIPOD-LLM、FDA Predetermined Change Control Plan、CMS の AI使用に関する透明性ルールが揃い、内科LLMは hallucination対策・人種補正除去・公平性監査が事実上の必須要件に。EU AI Actで医療AIは高リスクAIに分類。

規格: TRIPOD-LLM、CONSORT-AI v2、SPIRIT-AI
規制: FDA PCCP、CMS AI透明性、EU AI Act
臨床的含意: hallucinationを前提とした人間-AI協調

Gallifant J et al. Nat Med 2024 (TRIPOD-LLM). Vyas DA et al. NEJM 2020 (race correction).

Part 2 / Trend Map

AI関連 vs
AI非関連トレンド

内科の話題はAIに収束していると誤解されがちですが、GLP-1・腸内細菌・心アミロイドーシスなどAI非関連テーマも同等に重要です。

テーマ	AI関連トレンド	AI非関連トレンド
外来診療	Ambient Scribe、症状チェッカー、LLM鑑別診断	遠隔診療普及、SDM（共有意思決定）
画像診断	Aidoc / Viz.ai / RapidAI、心エコーAI	Photon-counting CT、低被曝
慢性疾患	CKD/HF/糖尿病リスクML、Time-In-Range	GLP-1RA・SGLT2、心アミロイドーシス
予防・健康	ウェアラブル連続モニタ、AI健診	Long COVID、腸内細菌、PRSスコア
記録・運営	退院サマリLLM、紹介状自動化	電子カルテ標準化（FHIR）、医療DX
薬剤・処方	処方ML、ポリファーマシー検出AI	薬剤費抑制、後発品政策

Part 3 / World Frontier

内科×AI
世界フロンティア9拠点

「査読論文／FDA承認／実装規模」のいずれかで世界最先端と言える事例だけを選定しました。

🥇 #1

Google / Med-Gemini & Med-PaLM 2 — 医療LLM基盤モデル

米国 / Google Research, DeepMind / Nature 2024–2025

USMLE系ベンチマークで人間専門医水準。マルチモーダル（テキスト・画像・ゲノム・時系列）対応。Mayo Clinic・HCA・Mount Sinaiでパイロット導入。OpenAI GPT-4・Anthropic Claudeも医療チューニングで急速に追随。

Singhal K et al. Nature 2023 (Med-PaLM 2). Nori H et al. Nature 2024 (Med-Gemini).

🥇 #2

Abridge / Nuance DAX Copilot — 環境型AIスクライブ

米国 / Abridge: Pittsburgh / Nuance: Microsoft傘下

Abridge は Kaiser Permanente、Sutter Health、UPMC など全米最大規模の医療システムで全外来導入を達成（Series E累計$5億超）。Nuance DAX Copilot は Epic と統合され、医師1人あたり日60〜90分の文書時間削減、燃え尽きスコア改善が報告されている。

abridge.com / DAX Copilot / Tierney AA et al. Perm J 2024.

🥇 #3

Aidoc / Viz.ai / RapidAI — 画像AIトリアージ

イスラエル・米国 / FDA最多承認領域

Aidoc: CT全身（脳出血・PE・気胸・大動脈解離）、世界1,500病院超
Viz.ai: LVO検出でDoor-to-Puncture時間短縮、初のCMS NTAP取得
RapidAI: Stroke / PE / Aortic、Stanford発

放射線AIは「読影代替」から「ワークフロー再設計」へ進化。CMS のAIに対する追加支払コードが整備された数少ない領域。

aidoc.com / viz.ai / rapidai.com

🥇 #4

OpenEvidence / Glass Health — 臨床推論支援

米国 / Cambridge MA・San Francisco

OpenEvidence は医師確認制で米国医師の利用が急拡大、引用付き回答の標準を確立。Glass Health は鑑別診断と治療プラン生成に特化したクリニカルAI。Isabel・Ada・Buoy・K Healthなどconsumer向けも併存。OpenEvidence × SIMY 比較も参照。

openevidence.com / glass.health

🥇 #5

Apple Watch / Dexcom / Eko — ウェアラブル連続モニタ

米国 / 消費者×医療

Apple Watch: AFib通知（Apple Heart Study, NEJM 2019）、転倒検出、SpO2
Dexcom CGM: Time-In-Range概念、米国非糖尿病使用拡大
Eko: AI聴診器、弁膜症スクリーニング、FDA承認
iRhythm Zio: 不整脈14日連続記録

受診→検査→診断が常時モニタ→通知→確認に逆転していく方向性。

Perez MV et al. NEJM 2019. dexcom.com / ekohealth.com

🥇 #6

HeartFlow / Cleerly / Ultromics — 循環器特化AI

米英 / Cardiovascular AI

HeartFlow FFRct（冠動脈CTから機能評価）、Cleerly Plaque Analysis（プラーク全体評価）、Ultromics EchoGo（心エコーAI）が侵襲的冠動脈造影を回避できる症例増加。Eko聴診器との連携で外来から循環器精査まで連続的にAIが介在。

heartflow.com / cleerlyhealth.com / ultromics.com

🥇 #7

Stanford CHARM / MIT CSAIL Clinical ML — アカデミア中核

米国 / Stanford / MIT

Stanford CHARM (Center for Artificial Intelligence in Medicine) はマルチモーダル医療基盤モデル、MIT CSAIL Clinical ML は EHR・公平性研究、NIH Bridge2AI は基盤データセット整備を主導。学術と FDA・CMS規制の橋渡しを担う。

Stanford AIMI / MIT Clinical ML / Bridge2AI

🥈 #8

Hippocratic AI / Suki / DeepScribe — 患者対話AI・スクライブ

米国

Hippocratic AI は安全性特化型LLMで、退院後フォローアップコール・服薬支援などの患者向け対話を担う。Suki・DeepScribe はAmbient Scribeの中堅勢で、独立クリニック向けに展開。Patient-facing AI が外来時間短縮と再入院抑制を担う段階に。

hippocraticai.com / suki.ai / deepscribe.ai

🇯🇵 JP

日本で世界水準にある領域

LPIXEL / Ubie / AIメディカルサービス

LPIXEL: EIRL シリーズ（眼底・脳MRI動脈瘤・胸部CT）、PMDA最多承認の国内AI企業。
Ubie: 症状チェッカーで月間1,500万人超の利用、製薬企業・自治体への展開も。
AIメディカルサービス（CADDIE）: 上部消化管内視鏡AI、世界水準の早期胃癌検出AI。
サスメド: 不眠症デジタル治療等のSaMD領域。

注: 医療LLM基盤モデル・大規模Ambient Scribeは米国主導で、日本はローカライズ・規制適応・独自データに注力する局面。

Part 4 / Autonomy Levels

臨床自律レベル分類
CAL（Clinical Autonomy Level）

外科のSAL（Surgical Autonomy Level）に対応する内科版自律レベル分類です。本ページの独自提案であり、学会標準ではありません。

L0

No Autonomy
純マニュアル診療

AI不使用、医師の判断のみ。

─

L1

Information Display
情報提示

UpToDate、検査値フラグ、薬剤相互作用警告。判断は医師。

★ UpToDate、DynaMed、KEGG MEDICUS

L2

Recommendation
推奨提示（CDSS）

鑑別診断リスト・治療推奨・画像読影候補。医師が承認。

★ OpenEvidence、Glass、Aidoc、Viz.ai、HeartFlow

L3

Conditional Autonomy
条件付自律

プロトコル下で薬剤推奨や自動オーダー。例外時に医師介入。

◆ 一部CGMポンプ連携、AIトリアージ自動連絡

L4

High Autonomy
高度自律（限定領域）

限定領域でAIが診断確定や処方。医師は監督のみ。

▲ IDx-DR（糖尿病網膜症自動診断, FDA 2018）

L5

Full Autonomy
完全自律

全領域でAIが完結。まだ存在しない。

─

★=普及 ◆=萌芽 ▲=研究/限定承認 ─=未到達

現在のフロンティア

L2が主流（CDSS・画像AI・LLM鑑別）。L4の事例は IDx-DR（眼科だが内科外来でも使用される自動診断AI）が唯一の規制承認例で、これを超える領域は法的責任・hallucination が壁。L3の自動処方は限定プロトコル下で実装が広がり始めた段階。

Part 5 / VC Market Map

内科AI
VCマーケットマップ 2026

領域 × 代表プレーヤーで投資家視点の俯瞰図を提示します。

Health LLM / Foundation

Google Med-Gemini、Med-PaLM 2、OpenAI GPT-4、Anthropic Claude、Hippocratic AI、OpenEvidence

Clinical Decision Support

Glass Health、Isabel、Ada Health、Buoy Health、K Health、Causaly

Ambient Scribe

Abridge、Nuance DAX、Suki、Augmedix、DeepScribe、Heidi Health。
🇯🇵 SIMY（音声入力AI、医療特化、日本リージョン）

Diagnostic Imaging

Aidoc、Viz.ai、RapidAI、HeartFlow、Cleerly、Annalise.ai、Lunit、Paige、Tempus

Wearables / Remote Monitor

Apple、Dexcom、Whoop、Eko、iRhythm、Biofourmis、Withings

Disease-specific AI

循環器: Ultromics、Eko、Cleerly、HeartFlow
消化器: Medtronic GI Genius、Iterative Health、AIメディカルサービス
腎臓: Renalytix
糖尿病: Tidepool、Beta Bionics

Population Health / Risk

Bayesian Health、Jvion、ClosedLoop、Komodo Health、Health Catalyst

Patient-facing AI

Hippocratic AI、Babylon、Sensely、Woebot、Wysa
🇯🇵 Ubie（症状チェッカー）

Maturity

成熟度マップ（Hype Cycle 風）

段階	領域	時期目安
普及期	放射線画像AIトリアージ、CDSS、UpToDate型情報	2024〜
早期普及	Ambient Scribe（米大規模）、CGM、Apple Watch AFib	2025〜2027
実装研究	LLM鑑別診断、慢性疾患リスクML、循環器AI（HeartFlow/Cleerly）	2025〜2028
研究実証	マルチモーダル医療基盤モデル、Ambient Scribe（日本）、Patient-facing LLM	2026〜2029
萌芽期	CAL L3条件付自律処方、AI監査制度、Federated medical LLM	2027〜2030+

M&A / Funding

主要ディール

年	動き	金額
2021	Microsoft が Nuance を買収	$19.7B
2023	Med-PaLM 2 発表（Google）	—
2024	Med-Gemini 発表（Google DeepMind）	—
2024	Abridge Series D	$150M
2024	FDA AI/ML-Enabled Devices リスト 1,000件突破	—
2025	Abridge Series E（評価額$5B超と報道）	$300M+
2025	OpenEvidence Series B	$75M
2025	EU AI Act 医療AI高リスク分類施行	—

Part 6 / Future Scenarios

日本の内科医療
近未来シナリオ

日本の構造的特徴（プライマリケア弱体・診療科縦割り・公的保険一元）を前提にしたシナリオA〜F。

A. Ambient Scribe で外来効率化

米国実績（医師日90分削減）を踏まえ、日本でも環境型ドキュメンテーションの普及が始まる。患者情報のサーバ所在地・日本リージョン要件が選定基準に。

SIMY

B. LLMが second-opinion 標準化

外来でLLM鑑別診断が標準ツール化。専門医はAI出力をレビュー・是正する役割に。研修医教育への影響大。

C. 画像AI二段読影

放射線科レポートが「AI一次読影→医師確認」の二段化。遠隔読影と組み合わせて夜間・休日対応の標準化が進む。

D. 連続モニタで reactive→proactive

Apple Watch・CGM・Eko聴診器による常時モニタが慢性疾患管理の主流に。受診頻度の最適化と外来モデル変革。

E. プライマリケアの再定義

症状チェッカー（Ubie等）＋オンライン診療＋AI鑑別で、軽症のフロントは大きく変わる。家庭医不足の日本では特に効果大。

F. 責任分担と規制

誤診時の責任分担、PMDA SaMD審査、医師法上の位置付けが整備される。EU AI Act の動きが日本に波及。

Part 7 / Impact Matrix

インパクト・
マトリクス

患者・内科医・病院経営・規制・産業 × 5年／10年／10年＋で内科AIのインパクトを整理しました。

軸	5年以内	5–10年	10年以降
患者体験	症状チェッカー普及、待ち時間短縮	連続モニタリングが日常化	AI主導のproactiveケアの選択肢
内科医のワークフロー	Ambient Scribeで文書時間半減	LLM second-opinionが標準化	監督・調整役へのシフト
病院経営	外来回転率向上、燃え尽き対策	遠隔モニタ収益化、二段読影	AIサービス収益化（保険外）
規制	TRIPOD-LLM / SaMD整備	AI監査・PCCP普及	CAL L3条件付自律処方の制度化
産業	Ambient Scribe市場確立	医療基盤モデル国内化	Patient-facing AI輸出

Part 8 / Cross Comparison

内科AI vs 外科AI
比較サマリー

姉妹ページ外科×AI 世界最先端マップとの横断比較です。

軸	内科AI	外科AI
中核データ	テキスト・画像・時系列	手術動画・力覚・機器ログ
主要モデル	LLM	Vision Transformer / 模倣学習
FDA承認最多領域	放射線画像AI	ロボット手術機器
自律化のボトルネック	法的責任・hallucination	ハードウェア・規制・倫理
即効インパクト	Ambient Scribe	OR効率最適化
5年後の主戦場	LLM臨床統合・規制	L2タスク自律商用化
10年後	プライマリケアAI再定義	L3自律手術臨床試験
日本の競争力	症状チェッカー・画像AI	動画DB・技能評価
投資ホットスポット	米・イスラエル・英	米・加・仏
規制フレーム	SaMD + LLM新枠組み	SaMD + ロボット規制

外科版を見る

References

引用文献

Singhal K, et al. Large language models encode clinical knowledge. Nature 2023;620:172-180. DOI
Nori H, et al. Capabilities of Med-Gemini. Nature 2024.
Goh E, et al. Large Language Model Influence on Diagnostic Reasoning: A Randomized Clinical Trial. JAMA Netw Open 2024;7:e2440969.
Tierney AA, et al. Ambient Artificial Intelligence Scribes to Alleviate the Burden of Clinical Documentation. NEJM Catalyst 2024.
Garcia P, et al. Artificial Intelligence-Generated Draft Replies to Patient Inbox Messages. JAMA Netw Open 2024.
Perez MV, et al. Large-Scale Assessment of a Smartwatch to Identify Atrial Fibrillation. NEJM 2019;381:1909-1917.
Adams R, et al. Prospective, multi-site study of patient outcomes after implementation of the TREWS machine learning-based early warning system for sepsis. Nat Med 2022;28:1455-1460.
Min JK, et al. Cleerly Plaque Analysis. JACC 2023.
Gallifant J, et al. The TRIPOD-LLM reporting guideline for studies using large language models. Nat Med 2024.
Vyas DA, et al. Hidden in Plain Sight — Reconsidering the Use of Race Correction in Clinical Algorithms. NEJM 2020;383:874-882.
FDA. Artificial Intelligence and Machine Learning (AI/ML)-Enabled Medical Devices. 2025. FDA
FDA. Predetermined Change Control Plan (PCCP) Final Guidance. 2024.
Abridge. abridge.com
Microsoft Nuance. DAX Copilot. 公式
Aidoc. aidoc.com
Viz.ai. viz.ai
RapidAI. rapidai.com
OpenEvidence. openevidence.com
Glass Health. glass.health
Hippocratic AI. hippocraticai.com
HeartFlow. heartflow.com
Cleerly Health. cleerlyhealth.com
Ultromics. ultromics.com
Eko Health. ekohealth.com
iRhythm Technologies. 公式
Dexcom. dexcom.com
Apple Heart Study & Apple Watch ECG. Apple Inc.
Stanford AIMI. aimi.stanford.edu
MIT Clinical ML. clinicalml.org
NIH Bridge2AI. 公式
IDx-DR / Digital Diagnostics. 公式
Renalytix. KidneyIntelX. 公式
Bayesian Health. 公式
Suki AI. suki.ai
DeepScribe. deepscribe.ai
Augmedix. augmedix.com
Heidi Health. 公式
Annalise.ai. annalise.ai
Lunit. lunit.io
Paige.AI. 公式
Tempus AI. 公式
Medtronic GI Genius. 公式
LPIXEL. EIRL シリーズ. lpixel.net
Ubie. ubie.app
AIメディカルサービス（CADDIE）. ai-ms.com
サスメド. 公式
EU. Artificial Intelligence Act. 2024.
CMS. NTAP Coverage for AI Software (Viz.ai). 2020–.

FAQ

内科×AI
よくある質問

医療LLMで世界最先端は何ですか？

Google Researchの Med-Gemini と Med-PaLM 2 が学術ベンチマーク（USMLE系）で最高水準の性能を示しています。臨床応用面では OpenEvidence（医師向けエビデンス検索）、Glass Health（鑑別診断）、Hippocratic AI（患者対話）が代表的です。GPT-4・Claudeなど汎用LLMも医療特化チューニングで急速に追い上げています。

環境型AIスクライブとは何ですか？

医師-患者の会話を環境マイクで録音し、リアルタイムでSOAPノート・カルテ記載・処方候補を自動生成するAIです。Abridge（米最大手）、Nuance DAX Copilot（Microsoft傘下）、Suki、DeepScribeが代表的。米国では既にKaiser・HCA・MGB等の大規模システムで全外来導入が進み、医師1人あたり日90分の文書時間削減が報告されています。

画像AIで最もFDA承認が多いのは？

放射線画像AIです。FDAのAI/ML-Enabled Medical Devicesリスト（2025年）では総承認数1,000件超のうち約75%が放射線領域。Aidoc（CT全身）、Viz.ai（脳卒中LVO）、RapidAI（脳卒中・PE）、HeartFlow/Cleerly（冠動脈CT）、Annalise.ai（CXR）、Lunit（マンモ・CXR）が代表企業です。

CAL（Clinical Autonomy Level）とは？

本ページで提案する内科版の自律レベル分類で、外科のSAL（Surgical Autonomy Level）に対応します。L0=純マニュアル、L1=情報提示（UpToDate）、L2=推奨提示（CDSS、現在の主流）、L3=条件付自律（プロトコル下処方）、L4=高度自律（限定領域でAI診断確定）、L5=完全自律（未到達）。学会標準ではなく独自提案である点に注意してください。

日本は内科AIで世界最先端と言える分野はありますか？

LPIXELの眼底AI・脳MRI動脈瘤検出、Ubieの症状チェッカー、AIメディカルサービス（CADDIE）の消化器内視鏡AIは世界水準です。一方、医療LLM基盤モデル・大規模Ambient Scribeでは米国主導で、日本はローカライズ・規制適応に注力する局面です。

環境型AIスクライブはAmbient Scribeとどう違いますか？

同じ概念です。英語ではAmbient Scribe / Ambient AI / Ambient Documentation / Ambient Listeningと呼ばれ、日本語では環境型AIスクライブ・環境型ドキュメンテーションと訳されます。医師の口述を能動的に録音するSIMYのような音声入力AIとは設計思想が異なり、診察会話そのものから自動でカルテを作る点が特徴です。

内科医の業務は10年でどう変わりますか？

短期最大インパクトはAmbient Scribeによる外来文書時間の削減（日90分級）、中期は画像AIの二段読影と慢性疾患の連続モニタリング普及、長期はCAL L3（プロトコル下AI処方）の限定臨床導入と思われます。プライマリケアは症状チェッカー＋遠隔診療＋AIで再定義される可能性が高く、専門医はsecond-opinion生成型LLMが標準ツール化します。

日本でAmbient Scribeを導入する際の注意点は？

診察音声は要配慮個人情報のため、サーバ所在地・暗号化・LLM学習への利用可否の事前確認が必須です。患者同意の運用も論点です。Pocket IC専用に日本リージョンで運用するSIMYは、患者氏名等の直接識別情報を即時非保存とする設計のため、国内コンプライアンス要件と整合します。

内科AIの最大インパクトは、
"記録の自動化" から始まる。

米国の Ambient Scribe 先行事例は、医師1人あたり日90分の文書時間削減を実証しています。日本リージョンで安全に使える音声AIから始めませんか。

SIMYの導入相談をする外科版マップを見る

内科×AIの世界最先端を一望する

PubMedベース・内科×AI 注目6テーマ