外科×AIの
世界最先端を一望する
Johns Hopkins SRT-H が自律手術 L4 を実証し、OR Black Box が手術室をデータセンター化し、da Vinci 5 が触覚を取り戻し、IHU Strasbourg が学術と実装を一拠点で完結させる。本ページは PubMed・規制承認・実装規模で世界最先端と言える事例だけを地図化したものです。続編の内科版と合わせてご覧ください。
PubMedベース・
外科×AI 注目6テーマ
直近1〜2年で外科×AI領域に大きな影響を与えた研究を、研究デザイン・主要結果・臨床的含意の3点で整理しました。
LLMによる手術時間・OR効率予測
Kothariら(Medical College of Wisconsin, Selig Hub for Surgical Data Science)は、汎用LLMを手術室スケジューリングに応用し、手術時間予測の精度を従来の統計モデル比で有意に改善することを示した。LLMが研究室から手術室の運営に持ち込まれた代表的実装研究。
- 研究デザイン: 単施設実装研究、retrospective + prospective
- 主要結果: 手術時間予測誤差の有意改善、OR利用率向上
- 臨床的含意: ORスケジューラーの自動化と病院経営インパクト
Kothari AN, et al. JAMA Surg 2025. MCW Selig Hub
術中AI・手術動画解析(phase recognition / 技能評価)
国立がん研究センター東病院の伊藤雅昭らによる AICS(AI Confidence Score)は、腹腔鏡下S状結腸切除の術野展開を特異度93%・感度82%で自動評価する。学会の技術認定審査補助への応用が現実的視野に入った世界的にも稀有な実装事例。
- 研究デザイン: 多施設動画コホート、ML分類器の外部検証
- 主要結果: 術野展開スコアと熟練度の相関を定量化
- 臨床的含意: 動画ベースの専門医認定・教育の標準化
国立がん研究センター東病院 プレスリリース 2023. Cholec80・EndoVis Challenge 関連: MICCAI 2024–2025.
術後合併症予測モデル(NSQIP超越)
従来 ACS-NSQIP リスク計算機が標準だったが、深層学習・XGBoost・SHAP説明可能AIを組み合わせた新世代モデルが C-statistic で NSQIP を上回る報告が相次いでいる。一方で外部検証・公平性の課題が残り、TRIPOD-AI/CONSORT-AI への準拠が必須に。
- 研究デザイン: 多施設EHR・機械学習・外部検証
- 主要結果: AUC 0.85前後、SHAP値による特徴量寄与の可視化
- 臨床的含意: 高リスク症例の同意取得・術前最適化
Ann Surg 2024–2025 系列、TRIPOD-AI: Collins GS et al. BMJ 2024;385:e078378.
退院遅延・在院日数(LOS)予測
術前因子・周術期バイタル・術中動画特徴を統合した LOS予測モデルが、退院調整・前habリテーション・地域連携枠の事前確保に活用される段階に。日本ではDPC包括点数との接続が経営インパクトを直接生む。
- 研究デザイン: 後ろ向き多施設、複合特徴量
- 主要結果: 平均LOSを0.5〜1.2日短縮しうる
- 臨床的含意: ベッドコントロール・ERAS強化
JAMA Netw Open 2024; Ann Surg 2025.
AI支援教育(resident education / EPA)
動画AIによる技能評価が「客観的・継続的・低コスト」のEPA(Entrustable Professional Activities)評価を可能にする。OR Black Box・JSES動画DBが教育インフラとして機能し始め、専門医制度の評価基盤が動画ベースに移行。
- 研究デザイン: 縦断的訓練介入・動画AIフィードバック
- 主要結果: 学習曲線の短縮、評価者間一致の改善
- 臨床的含意: 専門医認定・更新の標準化
Ann Surg 2024 EPA系・JSES Standards.
責任あるAI(fairness / 外部検証 / 規制)
2024年 BMJ TRIPOD-AI、2025年 CONSORT-AI v2、FDA Good Machine Learning Practice、PMDA SaMD ガイダンスが揃い、外科AIは「論文発表」フェーズから「外部検証・モデル監査・市販後監視」フェーズへ。Model Cards・Datasheets for Datasetsの記載が事実上の必須要件に。
- 規格: TRIPOD-AI, CONSORT-AI, SPIRIT-AI, DECIDE-AI
- 規制: FDA GMLP, PMDA SaMD通知, EU AI Act
- 臨床的含意: 単施設論文の限界・全国DB連携の必要性
Collins GS et al. BMJ 2024;385:e078378. Liu X et al. Nat Med 2020;26:1364.
外科×AI
世界フロンティア8拠点
「査読論文/規制承認/実装規模」のいずれかで世界最先端と言える事例だけを選定しました。
Johns Hopkins / SRT-H — 自律手術L4
言語条件付き模倣学習(language-conditioned imitation learning)と階層型フレームワークにより、胆嚢摘出術の17工程をex vivoモデルで完全自律実行することに成功。視野が血液で汚れたり開始位置が変わっても適応する点が、2022年のSTAR(予定経路の追従のみ)からの決定的な進化。
Kim JH et al. Science Robotics 2025. JHU Hub 2025/07/09
Surgical Safety Technologies / OR Black Box — 手術室AVプラットフォーム
世界最大の手術室AV/データプラットフォーム。累計320,000症例超・700万時間。世界24病院で稼働中。Mount Sinai Health System、NIHR、Wellcome Leapと提携。航空業界のフライトレコーダー相当のインフラを医療に持ち込んだ唯一の本格実装。
Intuitive Surgical / da Vinci 5 — 力覚FB搭載第5世代
ロボット手術に初めて Force Feedback(触覚)が搭載された。前臨床試験で組織にかかる力を最大43%低減。2025年9月の大型アップデートで Force Gauge(力の可視化)と In-Console Video Replay(術中録画即時再生)を追加。力データという新しいデータストリームが外科データサイエンスに加わった。
IHU Strasbourg / CAMMA — 外科AI学術ハブ
論文・規制承認・スピンオフ・教育(Surgical Data Science Summer School)が一拠点で完結する世界唯一の機関。MICCAI 2025で6本採択。スピンオフ Scialytics、膵癌超音波内視鏡支援AI mAI Companion® は2025年CE MDR取得・市販化決定。
Surgical Foundation Models — GSViT / SurgVLP / EndoFM-LV
- GSViT(JHU・Schmidgall): 28術式・680時間動画、General Surgery全般
- SurgVLP(CAMMA): 数百本の手術講義、マルチモーダル(映像+音声)
- EndoFM-LV(CUHK med-air): 6,469動画・1,300万フレーム、内視鏡長時間動画特化
- SurgMotion(2025最新): ポリープ分割・深度推定でSOTA
個別タスクごとにモデルを作る時代から、1つの基盤モデルをfine-tuneして使い回す時代へ。研究効率が桁違いに上がる。
Medical College of Wisconsin / Selig Hub — LLM周術期実装
LLMを「研究室から手術室の運営」に持ち込んだ実装研究の代表例。手術時間予測、症例マッチング、退院調整など、Peri-Op運営にLLMを直接適用する数少ないアカデミックハブ。
商用 OR Intelligence プラットフォーム
- Caresyntax(独・米): 4,000 OR・年200万症例、2024 ドイツAI賞
- Theator(米): "Surgical Intelligence" カテゴリ提唱、Intuitiveと提携
- Activ Surgical(米): ActivSight(術中血流・組織灌流可視化)FDA 510(k)
- Proximie(英): Telementoring + 術中AI
手術室そのものを「データセンター化」するビジョンが、学術領域を超えてビジネス化されている。
日本で世界水準にある領域
- AICS(伊藤雅昭ら): 腹腔鏡下S状結腸切除の術野展開を特異度93%・感度82%で自動評価。学会の技術認定審査補助の応用が見える、世界的に稀有な実装。
- JSES動画DB: 6,000例規模の構造化された手術動画DB。学会主導の全国一元管理という点でグローバルに独自。
注: 上記2件以外、autonomous robotics・foundation models・商用OR Intelligence・力覚FBの領域で日本発が世界先端と言えるものは現時点では存在しない。
自律手術レベル分類
SAL(Surgical Autonomy Level)
自動車のSAE J3016(L0〜L5)に倣った分類で、Yangら(Sci Robot 2017)以降アカデミアで定着しています。
完全マニュアル
術者が常時操作
個別タスクを自律
工程を自律、術者監視
想定範囲内で完全自律
全術式を自律
★=商用普及 ◆=商用初期 ▲=研究段階 ─=未到達
現在のフロンティア
商用は L1 が主流、L2 が立ち上がり期。研究は L4 のデモが出たばかり(SRT-H, 2025)。規制・倫理がL3以上の臨床導入の最大の壁。参考: Yang GZ et al. Sci Robot 2017; Haidegger T. IEEE Trans Med Robot Bionics 2019; Attanasio A et al. Annu Rev Control 2021.
外科AI
VCマーケットマップ 2026
領域 × 代表プレーヤーで投資家視点の俯瞰図を提示します。
Hardware / Robotics
Multi-port: Intuitive (da Vinci 5)、Medtronic (Hugo)、CMR (Versius)
Single-port: Intuitive SP、Moon Surgical (Maestro)
Specialty: Stryker (Mako/ortho)、Globus (Excelsius GPS)、Asensus (LUNA)、Vicarious Surgical
🇯🇵 Medicaroid hinotori、RIVERFIELD Saroa
OR Intelligence / Video
Caresyntax (DE/US)、Theator (US)、Proximie (UK)、Surgical Safety / OR-BB (CA)、Activ Surgical (US)、Touch Surgery (US, Medtronic買収)
Autonomous / ML Core
Academic: JHU (SRT-H)、CAMMA / Strasbourg、CUHK (EndoFM)
Foundation: GSViT、SurgVLP、EndoFM-LV、SurgMotion
Spinouts: Scialytics (IHU)
Peri-Op / Workflow AI
LLM scheduling: MCW Selig Hub (academic)
Risk prediction: Bayesian Health、Qventus、LeanTaaS
Pre-habilitation: PtPalCX、DorsaVi
Training / Simulation
Osso VR (US)、Fundamental VR (UK)、Surgical Theater (US)、PrecisionOS (CA)、Level Ex (US)、ImmersiveTouch (US)
Intraop Imaging / Guidance
Activ Surgical (灌流)、Stryker (ICG/SPY)、Brainlab、7D Surgical (spine)、Augmedics (xvision-AR)
Data Infrastructure
NCD (JP, 1.5M cases/yr)、ACS-NSQIP (US)、EUSOMA (EU)、JSES Video DB (JP, 6,000+)、OR Black Box (7M hrs)、MICCAI / Cholec80 / EndoVis
成熟度マップ(Hype Cycle 風)
| 段階 | 領域 | 時期目安 |
|---|---|---|
| 普及期 | Robotic Surgery (L1)、Surgical Video Recording | 2024〜 |
| 早期普及 | OR Intelligence、Force Feedback (da Vinci 5)、Pre-hab clinics | 2025〜2027 |
| 実装研究 | ML合併症予測、LOS予測、LLM ORスケジューラ、AI技能評価 (AICS, JSES) | 2025〜2028 |
| 研究実証 | Surgical Foundation Models、リアルタイム術中AIガイダンス、AR Overlay (Augmedics) | 2026〜2029 |
| 萌芽期 | Autonomous Surgery L4 (SRT-H)、マルチモーダル外科LLM、Federated Surgical Learning | 2027〜2030+ |
主要ディール
| 年 | 動き | 金額 |
|---|---|---|
| 2021 | Medtronic が Touch Surgery を買収 | 非開示 |
| 2023 | Surgical Safety Technologies Series A | $15M |
| 2024 | da Vinci 5 FDA 510(k) 取得 | — |
| 2024 | Caresyntax がドイツAI賞 | — |
| 2025 | mAI Companion® CE MDR 取得(IHU spinout) | — |
| 2025 | SST × Mount Sinai グローバル提携 | — |
| 2025 | da Vinci 5 CE 取得(欧州展開) | — |
日本の外科医療
近未来シナリオ
日本の構造的特徴(NCD・専門医制度・DPC・地域包括ケア)を前提にしたシナリオA〜F。
A. LLM × OR効率最適化
手術時間予測・スケジューラの精度向上で、週1〜2件のOR増を目指す病院が出現。DPC包括の中で経営インパクトに直結。
B. 動画AIで専門医認定が変わる
JSES動画DB+技能AIで「動画ベースの認定審査」が現実化。地域で症例数が足りない若手の救済策にも。
C. 記録業務がAI音声に移行
NCD・JOANR・手術所見・退院サマリが医師の口述から自動構造化。SIMYなどがハブ化。
D. プレハビリ × AI
術前リスクML × 在宅プレハビリで、高齢心血管・整形術の合併症半減を狙うプログラム。
E. ロボット価値再評価
HTAでロボット手術の価値が再評価。L2タスク自律商用化により従来の「ロボットは時間がかかる」議論が転換。
F. 責任あるAI規制
PMDA SaMD・モデル監査・市販後監視の整備で、単施設論文止まりのAIから市販製品へ。学会主導のレジストリと接続。
インパクト・
マトリクス
患者・外科医・病院経営・規制・産業 × 5年/10年/10年+ で外科AIのインパクトを整理しました。
| 軸 | 5年以内 | 5–10年 | 10年以降 |
|---|---|---|---|
| 患者体験 | プレハビリ・在院短縮 | AI術前意思決定共有 | 自律手術L3の選択肢化 |
| 外科医のワークフロー | LLM・音声AIで書類削減 | 動画AI技能認定の標準化 | 監督的役割への移行 |
| 病院経営 | OR効率最適化 | HTAでロボット価値再評価 | データ収益化・動画マーケット |
| 規制 | TRIPOD-AI / SaMD整備 | AI監査制度・市販後監視 | 自律ロボ承認フレーム整備 |
| 産業 | OR Intelligence普及 | 基盤モデル商用化 | 国産自律ロボの輸出 |
| 軸 | 外科AI | 内科AI |
|---|---|---|
| 中核データ | 手術動画・力覚・機器ログ | テキスト・画像・時系列 |
| 主要モデル | Vision Transformer / 模倣学習 | LLM |
| FDA承認最多領域 | ロボット手術機器 | 放射線画像AI |
| 自律化のボトルネック | ハードウェア・規制・倫理 | 法的責任・hallucination |
| 即効インパクト | OR効率最適化 | Ambient Scribe |
| 5年後の主戦場 | L2タスク自律商用化 | LLM臨床統合・規制 |
| 10年後 | L3自律手術臨床試験 | プライマリケアAI再定義 |
| 日本の競争力 | 動画DB・技能評価 | 症状チェッカー・画像AI |
| 投資ホットスポット | 米・加・仏 | 米・イスラエル・英 |
| 規制フレーム | SaMD + ロボット規制 | SaMD + LLM新枠組み |
引用文献
- Kim JH, et al. SRT-H: A hierarchical framework for autonomous surgery via language-conditioned imitation learning. Science Robotics. 2025. DOI
- Johns Hopkins University. Robot performs first realistic surgery without human help. 2025. Hub
- Surgical Safety Technologies. OR Black Box Platform. surgicalsafety.com
- MIT Technology Review. This AI-powered "black-box" could make surgery safer. 2024. 記事
- Intuitive Surgical. da Vinci 5 product page. 公式
- Intuitive Surgical. Real-Time Surgical Insights for da Vinci 5. 2025. プレスリリース
- IHU Strasbourg / CAMMA. 公式
- mAI Companion® CE MDR marking. IHU Strasbourg, 2025. 公式
- Schmidgall S, et al. General Surgery Vision Transformer (GSViT). arXiv:2403.05949. arXiv
- CAMMA-public. SurgVLP. Medical Image Analysis 2025. GitHub
- med-air. EndoFM-LV. IEEE JBHI 2025. GitHub
- Caresyntax — Surgical Intelligence Platform. caresyntax.com
- Medical College of Wisconsin, Department of Surgery. MCW
- Yang GZ, et al. Medical robotics—Regulatory, ethical, and legal considerations for increasing levels of autonomy. Sci Robot. 2017;2(4):eaam8638. DOI
- Haidegger T. Autonomy for Surgical Robots: Concepts and Paradigms. IEEE Trans Med Robot Bionics. 2019;1(2):65-76.
- Attanasio A, et al. Autonomy in Surgical Robotics. Annu Rev Control Robot Auton Syst. 2021;4:651-679. DOI
- Collins GS, et al. TRIPOD+AI statement: updated guidance for reporting clinical prediction models that use regression or machine learning methods. BMJ 2024;385:e078378.
- Liu X, et al. Reporting guidelines for clinical trial reports for interventions involving artificial intelligence: the CONSORT-AI extension. Nat Med 2020;26:1364-1374.
- Mascagni P, et al. Artificial intelligence for surgical safety: automatic assessment of the critical view of safety. Ann Surg 2022.
- Madani A, et al. Artificial Intelligence for Intraoperative Guidance. Ann Surg 2022.
- 国立がん研究センター東病院. AI Confidence Score (AICS) プレスリリース. 2023.
- 日本内視鏡外科学会. 動画データベース構築事業. JSES
- NCD(National Clinical Database). 公式
- Medtronic. Touch Surgery acquisition. 2020.
- Theator. Surgical Intelligence Platform. theator.io
- Activ Surgical. ActivSight. 公式
- Proximie. Connected Operating Room. 公式
- Augmedics. xvision Spine System. 公式
- Stryker. Mako SmartRobotics. 公式
- Globus Medical. Excelsius GPS. 公式
- CMR Surgical. Versius. 公式
- Medicaroid. hinotori Surgical Robot System. 公式
- RIVERFIELD. Saroa Surgical System. 公式
- Moon Surgical. Maestro System. 公式
- Asensus Surgical. 公式
- Vicarious Surgical. 公式
- Bayesian Health. 公式
- Qventus. 公式
- LeanTaaS. 公式
- Osso VR. 公式
- FundamentalVR. 公式
- PrecisionOS. 公式
- FDA. Good Machine Learning Practice for Medical Device Development. 2021–2025.
- PMDA. SaMDに関する通知・ガイダンス.
- EU. Artificial Intelligence Act (AI Act). 2024.
- MICCAI. EndoVis Challenge / Cholec80 dataset. 公式
- CB Insights / Pitchbook. Surgical AI market reports(公開要約版).
外科×AI
よくある質問
自律手術はもう実現していますか?
2025年7月、Johns Hopkins大学のSRT-Hが胆嚢摘出術の17工程をex vivoモデルで完全自律実行することに成功し、Science Roboticsで報告されました。ただし臨床応用には数年かかると見られており、商用ロボット手術は依然として SAL L1(術者操作下のロボット支援)が主流です。
OR Black Boxとは何ですか?
カナダSurgical Safety Technologies社が運営する手術室向けデータプラットフォームで、手術室内の映像・音声・機器データを統合記録しAIで解析します。航空業界のフライトレコーダーに相当する存在で、世界24病院・累計320,000症例超・700万時間のデータを保有しています。
da Vinci 5の力覚フィードバックとは?
da Vinci 5は2024年3月にFDA 510(k)を取得した第5世代ロボットで、世界で初めてForce Feedback(術具先端の力を術者に伝える機能)を実装しました。前臨床試験では組織にかかる力を最大43%低減することが確認され、これが将来の外科データサイエンスにおける新たなデータストリームになります。
Surgical Foundation Modelとは?
画像認識におけるGPT的な大規模事前学習モデルの手術版で、GSViT(JHU)、SurgVLP(CAMMA)、EndoFM-LV(CUHK)などが2024〜2025年に発表されました。個別タスクごとにモデルを作る時代から、1つの基盤モデルをfine-tuneして使い回す時代に移行しています。
日本は外科AI領域で世界最先端と言える分野はありますか?
国立がん研究センター東病院の手術技能AI評価(AICS)と、日本内視鏡外科学会の構造化動画データベースは世界水準と言える領域です。一方、自律ロボット・基盤モデル・商用OR Intelligence・Force Feedbackの領域では現時点で日本発の世界先端事例はありません。
自律手術レベル分類(SAL)とは?
自動車のSAE J3016(L0〜L5)に倣った分類で、Yangら(Sci Robot 2017)以降アカデミアで定着しています。L0=完全マニュアル、L1=ロボット支援(商用主流)、L2=タスク自律、L3=工程自律(術者監督)、L4=高度自律(SRT-H相当)、L5=完全自律(未到達)です。
日本の外科医はAI時代にどう働き方が変わりますか?
短期では書類業務のLLM支援とOR効率の最適化、中期では手術動画AIによる技能認定の標準化と前habリテーションのAI化、長期では監督的役割への移行が予測されます。短期で確実に価値が出るのは音声入力AIによる記録業務削減で、SIMYなどの導入が進んでいます。
外科×AIで日本が今から戦える領域は?
NCD(年間150万症例)・JSES動画DBという世界に類のないデータインフラと、技能評価AI、医療従事者主導の現場実装が日本の強みです。商用ロボット・基盤モデルの主導権争いは難しいため、データ層と現場実装層に賭けるのが現実的です。世界レジストリ比較もご参照ください。
外科×AIの最強コンビは、
"動画" と "音声"。
手術動画AIが世界で進化する一方、日本の外科医の現場で先に効くのは「術中口述→構造化記録」のSIMYです。