外科×AI 世界最先端マップ 2026｜自律手術L4・OR Black Box・基盤モデル徹底解説

Part 1 / PubMed Evidence

PubMedベース・
外科×AI 注目6テーマ

直近1〜2年で外科×AI領域に大きな影響を与えた研究を、研究デザイン・主要結果・臨床的含意の3点で整理しました。

①

LLMによる手術時間・OR効率予測

領域: Peri-operative AI / 実装研究

Kothariら（Medical College of Wisconsin, Selig Hub for Surgical Data Science）は、汎用LLMを手術室スケジューリングに応用し、手術時間予測の精度を従来の統計モデル比で有意に改善することを示した。LLMが研究室から手術室の運営に持ち込まれた代表的実装研究。

研究デザイン: 単施設実装研究、retrospective + prospective
主要結果: 手術時間予測誤差の有意改善、OR利用率向上
臨床的含意: ORスケジューラーの自動化と病院経営インパクト

Kothari AN, et al. JAMA Surg 2025. MCW Selig Hub

②

術中AI・手術動画解析（phase recognition / 技能評価）

領域: Computer-Assisted Surgery / 技能AI

国立がん研究センター東病院の伊藤雅昭らによる AICS（AI Confidence Score）は、腹腔鏡下S状結腸切除の術野展開を特異度93%・感度82%で自動評価する。学会の技術認定審査補助への応用が現実的視野に入った世界的にも稀有な実装事例。

研究デザイン: 多施設動画コホート、ML分類器の外部検証
主要結果: 術野展開スコアと熟練度の相関を定量化
臨床的含意: 動画ベースの専門医認定・教育の標準化

国立がん研究センター東病院プレスリリース 2023. Cholec80・EndoVis Challenge 関連: MICCAI 2024–2025.

③

術後合併症予測モデル（NSQIP超越）

領域: Predictive Analytics / 周術期

従来 ACS-NSQIP リスク計算機が標準だったが、深層学習・XGBoost・SHAP説明可能AIを組み合わせた新世代モデルが C-statistic で NSQIP を上回る報告が相次いでいる。一方で外部検証・公平性の課題が残り、TRIPOD-AI/CONSORT-AI への準拠が必須に。

研究デザイン: 多施設EHR・機械学習・外部検証
主要結果: AUC 0.85前後、SHAP値による特徴量寄与の可視化
臨床的含意: 高リスク症例の同意取得・術前最適化

Ann Surg 2024–2025 系列、TRIPOD-AI: Collins GS et al. BMJ 2024;385:e078378.

④

退院遅延・在院日数（LOS）予測

領域: Hospital Operations / DPC連動

術前因子・周術期バイタル・術中動画特徴を統合した LOS予測モデルが、退院調整・前habリテーション・地域連携枠の事前確保に活用される段階に。日本ではDPC包括点数との接続が経営インパクトを直接生む。

研究デザイン: 後ろ向き多施設、複合特徴量
主要結果: 平均LOSを0.5〜1.2日短縮しうる
臨床的含意: ベッドコントロール・ERAS強化

JAMA Netw Open 2024; Ann Surg 2025.

⑤

AI支援教育（resident education / EPA）

領域: Surgical Education

動画AIによる技能評価が「客観的・継続的・低コスト」のEPA（Entrustable Professional Activities）評価を可能にする。OR Black Box・JSES動画DBが教育インフラとして機能し始め、専門医制度の評価基盤が動画ベースに移行。

研究デザイン: 縦断的訓練介入・動画AIフィードバック
主要結果: 学習曲線の短縮、評価者間一致の改善
臨床的含意: 専門医認定・更新の標準化

Ann Surg 2024 EPA系・JSES Standards.

⑥

責任あるAI（fairness / 外部検証 / 規制）

領域: Regulatory / Ethics

2024年 BMJ TRIPOD-AI、2025年 CONSORT-AI v2、FDA Good Machine Learning Practice、PMDA SaMD ガイダンスが揃い、外科AIは「論文発表」フェーズから「外部検証・モデル監査・市販後監視」フェーズへ。Model Cards・Datasheets for Datasetsの記載が事実上の必須要件に。

規格: TRIPOD-AI, CONSORT-AI, SPIRIT-AI, DECIDE-AI
規制: FDA GMLP, PMDA SaMD通知, EU AI Act
臨床的含意: 単施設論文の限界・全国DB連携の必要性

Collins GS et al. BMJ 2024;385:e078378. Liu X et al. Nat Med 2020;26:1364.

Part 2 / Trend Map

AI関連 vs
AI非関連トレンド

外科の話題はAIに収束していると誤解されがちですが、AI非関連の臨床テーマこそが多くの病院の主戦場です。

テーマ	AI関連トレンド	AI非関連トレンド
術前評価	合併症予測ML、画像AI術前評価	プレハビリテーション、フレイル評価
周術期管理	LLM電子カルテ要約、LOS予測	ERAS、地域連携クリパス
手術手技	ロボット手術、自律タスク、力覚FB	単孔式、低侵襲、Reduced Port
教育・認定	動画AI技能評価、AICS、EPA	専門医制度改革、サブスペ整備
経営・運営	OR Intelligence、スケジューラ	集約化、タスクシフト、HTA
記録・データ	音声入力AI、構造化抽出LLM	NCD・JSES・JOANR・世界レジストリ

※ AI非関連トレンドの詳細は世界レジストリ比較・医師の働き方改革も参照。

Part 3 / World Frontier

外科×AI
世界フロンティア8拠点

「査読論文／規制承認／実装規模」のいずれかで世界最先端と言える事例だけを選定しました。

🥇 #1

Johns Hopkins / SRT-H — 自律手術L4

米国 / Axel Krieger Lab / Science Robotics 2025

言語条件付き模倣学習（language-conditioned imitation learning）と階層型フレームワークにより、胆嚢摘出術の17工程をex vivoモデルで完全自律実行することに成功。視野が血液で汚れたり開始位置が変わっても適応する点が、2022年のSTAR（予定経路の追従のみ）からの決定的な進化。

Kim JH et al. Science Robotics 2025. JHU Hub 2025/07/09

🥇 #2

Surgical Safety Technologies / OR Black Box — 手術室AVプラットフォーム

カナダ・トロント / Teodor Grantcharov

世界最大の手術室AV/データプラットフォーム。累計320,000症例超・700万時間。世界24病院で稼働中。Mount Sinai Health System、NIHR、Wellcome Leapと提携。航空業界のフライトレコーダー相当のインフラを医療に持ち込んだ唯一の本格実装。

surgicalsafety.com / MIT Tech Review 2024

🥇 #3

Intuitive Surgical / da Vinci 5 — 力覚FB搭載第5世代

米国 / 2024年3月 FDA 510(k) / 2025年 CE

ロボット手術に初めて Force Feedback（触覚）が搭載された。前臨床試験で組織にかかる力を最大43%低減。2025年9月の大型アップデートで Force Gauge（力の可視化）と In-Console Video Replay（術中録画即時再生）を追加。力データという新しいデータストリームが外科データサイエンスに加わった。

intuitive.com/da-vinci-5 / Real-Time Surgical Insights 2025

🥇 #4

IHU Strasbourg / CAMMA — 外科AI学術ハブ

フランス / Nicolas Padoy教授

論文・規制承認・スピンオフ・教育（Surgical Data Science Summer School）が一拠点で完結する世界唯一の機関。MICCAI 2025で6本採択。スピンオフ Scialytics、膵癌超音波内視鏡支援AI mAI Companion® は2025年CE MDR取得・市販化決定。

ihu-strasbourg.eu / mAI Companion CE 2025

🥇 #5

Surgical Foundation Models — GSViT / SurgVLP / EndoFM-LV

米・仏・香港 / 2024–2025

GSViT（JHU・Schmidgall）: 28術式・680時間動画、General Surgery全般
SurgVLP（CAMMA）: 数百本の手術講義、マルチモーダル（映像+音声）
EndoFM-LV（CUHK med-air）: 6,469動画・1,300万フレーム、内視鏡長時間動画特化
SurgMotion（2025最新）: ポリープ分割・深度推定でSOTA

個別タスクごとにモデルを作る時代から、1つの基盤モデルをfine-tuneして使い回す時代へ。研究効率が桁違いに上がる。

GSViT / SurgVLP (MedIA 2025) / EndoFM-LV (IEEE JBHI 2025)

🥇 #6

Medical College of Wisconsin / Selig Hub — LLM周術期実装

米国 / Anai N. Kothari, MD MS

LLMを「研究室から手術室の運営」に持ち込んだ実装研究の代表例。手術時間予測、症例マッチング、退院調整など、Peri-Op運営にLLMを直接適用する数少ないアカデミックハブ。

MCW Department of Surgery

🥈 #7

商用 OR Intelligence プラットフォーム

独・米・英・加

Caresyntax（独・米）: 4,000 OR・年200万症例、2024 ドイツAI賞
Theator（米）: "Surgical Intelligence" カテゴリ提唱、Intuitiveと提携
Activ Surgical（米）: ActivSight（術中血流・組織灌流可視化）FDA 510(k)
Proximie（英）: Telementoring + 術中AI

手術室そのものを「データセンター化」するビジョンが、学術領域を超えてビジネス化されている。

caresyntax.com

🇯🇵 JP

日本で世界水準にある領域

国立がん研究センター東病院 / JSES

AICS（伊藤雅昭ら）: 腹腔鏡下S状結腸切除の術野展開を特異度93%・感度82%で自動評価。学会の技術認定審査補助の応用が見える、世界的に稀有な実装。
JSES動画DB: 6,000例規模の構造化された手術動画DB。学会主導の全国一元管理という点でグローバルに独自。

注: 上記2件以外、autonomous robotics・foundation models・商用OR Intelligence・力覚FBの領域で日本発が世界先端と言えるものは現時点では存在しない。

Part 4 / Autonomy Levels

自律手術レベル分類
SAL（Surgical Autonomy Level）

自動車のSAE J3016（L0〜L5）に倣った分類で、Yangら（Sci Robot 2017）以降アカデミアで定着しています。

L0

No Autonomy
完全マニュアル

従来の腹腔鏡・開腹手術。AI支援なし。

─

L1

Robot Assistance
術者が常時操作

ロボットは追従のみ。商用ロボット手術の主流形態。

★ da Vinci Xi/5、hinotori、Hugo、Versius

L2

Task Autonomy
個別タスクを自律

縫合・結紮・内視鏡追尾など特定タスクをAIが自動化。

◆ da Vinci 5 Force Feedback、自動縫合プロトタイプ

L3

Conditional Autonomy
工程を自律、術者監視

必要時に人が介入。動物・ex vivoでの研究段階。

▲ STAR（2022, 動物・ex vivo）

L4

High Autonomy
想定範囲内で完全自律

術者は監督のみ。臨床応用は未。

▲ SRT-H（2025, ex vivo, 胆摘）Johns Hopkins

L5

Full Autonomy
全術式を自律

まだ存在しない。

─

★=商用普及 ◆=商用初期 ▲=研究段階 ─=未到達

現在のフロンティア

商用は L1 が主流、L2 が立ち上がり期。研究は L4 のデモが出たばかり（SRT-H, 2025）。規制・倫理がL3以上の臨床導入の最大の壁。参考: Yang GZ et al. Sci Robot 2017; Haidegger T. IEEE Trans Med Robot Bionics 2019; Attanasio A et al. Annu Rev Control 2021.

Part 5 / VC Market Map

外科AI
VCマーケットマップ 2026

領域 × 代表プレーヤーで投資家視点の俯瞰図を提示します。

Hardware / Robotics

Multi-port: Intuitive (da Vinci 5)、Medtronic (Hugo)、CMR (Versius)
Single-port: Intuitive SP、Moon Surgical (Maestro)
Specialty: Stryker (Mako/ortho)、Globus (Excelsius GPS)、Asensus (LUNA)、Vicarious Surgical
🇯🇵 Medicaroid hinotori、RIVERFIELD Saroa

OR Intelligence / Video

Caresyntax (DE/US)、Theator (US)、Proximie (UK)、Surgical Safety / OR-BB (CA)、Activ Surgical (US)、Touch Surgery (US, Medtronic買収)

Autonomous / ML Core

Academic: JHU (SRT-H)、CAMMA / Strasbourg、CUHK (EndoFM)
Foundation: GSViT、SurgVLP、EndoFM-LV、SurgMotion
Spinouts: Scialytics (IHU)

Peri-Op / Workflow AI

LLM scheduling: MCW Selig Hub (academic)
Risk prediction: Bayesian Health、Qventus、LeanTaaS
Pre-habilitation: PtPalCX、DorsaVi

Training / Simulation

Osso VR (US)、Fundamental VR (UK)、Surgical Theater (US)、PrecisionOS (CA)、Level Ex (US)、ImmersiveTouch (US)

Intraop Imaging / Guidance

Activ Surgical (灌流)、Stryker (ICG/SPY)、Brainlab、7D Surgical (spine)、Augmedics (xvision-AR)

Data Infrastructure

NCD (JP, 1.5M cases/yr)、ACS-NSQIP (US)、EUSOMA (EU)、JSES Video DB (JP, 6,000+)、OR Black Box (7M hrs)、MICCAI / Cholec80 / EndoVis

Documentation AI（執刀医直結）

SIMY (JP, 音声→構造化, NCD/JOANR)、Abridge、Nuance DAX。NCD音声入力・JOANR音声入力参照。

Maturity

成熟度マップ（Hype Cycle 風）

段階	領域	時期目安
普及期	Robotic Surgery (L1)、Surgical Video Recording	2024〜
早期普及	OR Intelligence、Force Feedback (da Vinci 5)、Pre-hab clinics	2025〜2027
実装研究	ML合併症予測、LOS予測、LLM ORスケジューラ、AI技能評価 (AICS, JSES)	2025〜2028
研究実証	Surgical Foundation Models、リアルタイム術中AIガイダンス、AR Overlay (Augmedics)	2026〜2029
萌芽期	Autonomous Surgery L4 (SRT-H)、マルチモーダル外科LLM、Federated Surgical Learning	2027〜2030+

M&A / Funding

主要ディール

年	動き	金額
2021	Medtronic が Touch Surgery を買収	非開示
2023	Surgical Safety Technologies Series A	$15M
2024	da Vinci 5 FDA 510(k) 取得	—
2024	Caresyntax がドイツAI賞	—
2025	mAI Companion® CE MDR 取得（IHU spinout）	—
2025	SST × Mount Sinai グローバル提携	—
2025	da Vinci 5 CE 取得（欧州展開）	—

Part 6 / Future Scenarios

日本の外科医療
近未来シナリオ

日本の構造的特徴（NCD・専門医制度・DPC・地域包括ケア）を前提にしたシナリオA〜F。

A. LLM × OR効率最適化

手術時間予測・スケジューラの精度向上で、週1〜2件のOR増を目指す病院が出現。DPC包括の中で経営インパクトに直結。

B. 動画AIで専門医認定が変わる

JSES動画DB+技能AIで「動画ベースの認定審査」が現実化。地域で症例数が足りない若手の救済策にも。

C. 記録業務がAI音声に移行

NCD・JOANR・手術所見・退院サマリが医師の口述から自動構造化。SIMYなどがハブ化。

SIMY

D. プレハビリ × AI

術前リスクML × 在宅プレハビリで、高齢心血管・整形術の合併症半減を狙うプログラム。

E. ロボット価値再評価

HTAでロボット手術の価値が再評価。L2タスク自律商用化により従来の「ロボットは時間がかかる」議論が転換。

F. 責任あるAI規制

PMDA SaMD・モデル監査・市販後監視の整備で、単施設論文止まりのAIから市販製品へ。学会主導のレジストリと接続。

関連: 医師の働き方改革 / 世界レジストリ比較 / NCD音声入力

Part 7 / Impact Matrix

インパクト・
マトリクス

患者・外科医・病院経営・規制・産業 × 5年／10年／10年＋で外科AIのインパクトを整理しました。

軸	5年以内	5–10年	10年以降
患者体験	プレハビリ・在院短縮	AI術前意思決定共有	自律手術L3の選択肢化
外科医のワークフロー	LLM・音声AIで書類削減	動画AI技能認定の標準化	監督的役割への移行
病院経営	OR効率最適化	HTAでロボット価値再評価	データ収益化・動画マーケット
規制	TRIPOD-AI / SaMD整備	AI監査制度・市販後監視	自律ロボ承認フレーム整備
産業	OR Intelligence普及	基盤モデル商用化	国産自律ロボの輸出

Part 8 / Cross Comparison

外科AI vs 内科AI
比較サマリー

姉妹ページ内科×AI 世界最先端マップとの横断比較です。

軸	外科AI	内科AI
中核データ	手術動画・力覚・機器ログ	テキスト・画像・時系列
主要モデル	Vision Transformer / 模倣学習	LLM
FDA承認最多領域	ロボット手術機器	放射線画像AI
自律化のボトルネック	ハードウェア・規制・倫理	法的責任・hallucination
即効インパクト	OR効率最適化	Ambient Scribe
5年後の主戦場	L2タスク自律商用化	LLM臨床統合・規制
10年後	L3自律手術臨床試験	プライマリケアAI再定義
日本の競争力	動画DB・技能評価	症状チェッカー・画像AI
投資ホットスポット	米・加・仏	米・イスラエル・英
規制フレーム	SaMD + ロボット規制	SaMD + LLM新枠組み

内科版を見る

References

引用文献

Kim JH, et al. SRT-H: A hierarchical framework for autonomous surgery via language-conditioned imitation learning. Science Robotics. 2025. DOI
Johns Hopkins University. Robot performs first realistic surgery without human help. 2025. Hub
Surgical Safety Technologies. OR Black Box Platform. surgicalsafety.com
MIT Technology Review. This AI-powered "black-box" could make surgery safer. 2024. 記事
Intuitive Surgical. da Vinci 5 product page. 公式
Intuitive Surgical. Real-Time Surgical Insights for da Vinci 5. 2025. プレスリリース
IHU Strasbourg / CAMMA. 公式
mAI Companion® CE MDR marking. IHU Strasbourg, 2025. 公式
Schmidgall S, et al. General Surgery Vision Transformer (GSViT). arXiv:2403.05949. arXiv
CAMMA-public. SurgVLP. Medical Image Analysis 2025. GitHub
med-air. EndoFM-LV. IEEE JBHI 2025. GitHub
Caresyntax — Surgical Intelligence Platform. caresyntax.com
Medical College of Wisconsin, Department of Surgery. MCW
Yang GZ, et al. Medical robotics—Regulatory, ethical, and legal considerations for increasing levels of autonomy. Sci Robot. 2017;2(4):eaam8638. DOI
Haidegger T. Autonomy for Surgical Robots: Concepts and Paradigms. IEEE Trans Med Robot Bionics. 2019;1(2):65-76.
Attanasio A, et al. Autonomy in Surgical Robotics. Annu Rev Control Robot Auton Syst. 2021;4:651-679. DOI
Collins GS, et al. TRIPOD+AI statement: updated guidance for reporting clinical prediction models that use regression or machine learning methods. BMJ 2024;385:e078378.
Liu X, et al. Reporting guidelines for clinical trial reports for interventions involving artificial intelligence: the CONSORT-AI extension. Nat Med 2020;26:1364-1374.
Mascagni P, et al. Artificial intelligence for surgical safety: automatic assessment of the critical view of safety. Ann Surg 2022.
Madani A, et al. Artificial Intelligence for Intraoperative Guidance. Ann Surg 2022.
国立がん研究センター東病院. AI Confidence Score (AICS) プレスリリース. 2023.
日本内視鏡外科学会. 動画データベース構築事業. JSES
NCD（National Clinical Database）. 公式
Medtronic. Touch Surgery acquisition. 2020.
Theator. Surgical Intelligence Platform. theator.io
Activ Surgical. ActivSight. 公式
Proximie. Connected Operating Room. 公式
Augmedics. xvision Spine System. 公式
Stryker. Mako SmartRobotics. 公式
Globus Medical. Excelsius GPS. 公式
CMR Surgical. Versius. 公式
Medicaroid. hinotori Surgical Robot System. 公式
RIVERFIELD. Saroa Surgical System. 公式
Moon Surgical. Maestro System. 公式
Asensus Surgical. 公式
Vicarious Surgical. 公式
Bayesian Health. 公式
Qventus. 公式
LeanTaaS. 公式
Osso VR. 公式
FundamentalVR. 公式
PrecisionOS. 公式
FDA. Good Machine Learning Practice for Medical Device Development. 2021–2025.
PMDA. SaMDに関する通知・ガイダンス.
EU. Artificial Intelligence Act (AI Act). 2024.
MICCAI. EndoVis Challenge / Cholec80 dataset. 公式
CB Insights / Pitchbook. Surgical AI market reports（公開要約版）.

FAQ

外科×AI
よくある質問

自律手術はもう実現していますか？

2025年7月、Johns Hopkins大学のSRT-Hが胆嚢摘出術の17工程をex vivoモデルで完全自律実行することに成功し、Science Roboticsで報告されました。ただし臨床応用には数年かかると見られており、商用ロボット手術は依然として SAL L1（術者操作下のロボット支援）が主流です。

OR Black Boxとは何ですか？

カナダSurgical Safety Technologies社が運営する手術室向けデータプラットフォームで、手術室内の映像・音声・機器データを統合記録しAIで解析します。航空業界のフライトレコーダーに相当する存在で、世界24病院・累計320,000症例超・700万時間のデータを保有しています。

da Vinci 5の力覚フィードバックとは？

da Vinci 5は2024年3月にFDA 510(k)を取得した第5世代ロボットで、世界で初めてForce Feedback（術具先端の力を術者に伝える機能）を実装しました。前臨床試験では組織にかかる力を最大43%低減することが確認され、これが将来の外科データサイエンスにおける新たなデータストリームになります。

Surgical Foundation Modelとは？

画像認識におけるGPT的な大規模事前学習モデルの手術版で、GSViT（JHU）、SurgVLP（CAMMA）、EndoFM-LV（CUHK）などが2024〜2025年に発表されました。個別タスクごとにモデルを作る時代から、1つの基盤モデルをfine-tuneして使い回す時代に移行しています。

日本は外科AI領域で世界最先端と言える分野はありますか？

国立がん研究センター東病院の手術技能AI評価（AICS）と、日本内視鏡外科学会の構造化動画データベースは世界水準と言える領域です。一方、自律ロボット・基盤モデル・商用OR Intelligence・Force Feedbackの領域では現時点で日本発の世界先端事例はありません。

自律手術レベル分類（SAL）とは？

自動車のSAE J3016（L0〜L5）に倣った分類で、Yangら（Sci Robot 2017）以降アカデミアで定着しています。L0=完全マニュアル、L1=ロボット支援（商用主流）、L2=タスク自律、L3=工程自律（術者監督）、L4=高度自律（SRT-H相当）、L5=完全自律（未到達）です。

日本の外科医はAI時代にどう働き方が変わりますか？

短期では書類業務のLLM支援とOR効率の最適化、中期では手術動画AIによる技能認定の標準化と前habリテーションのAI化、長期では監督的役割への移行が予測されます。短期で確実に価値が出るのは音声入力AIによる記録業務削減で、SIMYなどの導入が進んでいます。

外科×AIで日本が今から戦える領域は？

NCD（年間150万症例）・JSES動画DBという世界に類のないデータインフラと、技能評価AI、医療従事者主導の現場実装が日本の強みです。商用ロボット・基盤モデルの主導権争いは難しいため、データ層と現場実装層に賭けるのが現実的です。世界レジストリ比較もご参照ください。

外科×AIの最強コンビは、
"動画" と "音声"。

手術動画AIが世界で進化する一方、日本の外科医の現場で先に効くのは「術中口述→構造化記録」のSIMYです。

SIMYの導入相談をする内科版マップを見る

外科×AIの世界最先端を一望する

PubMedベース・外科×AI 注目6テーマ