18/12/2025
突破骨質疏鬆檢測瓶頸:
AI 輔助一般 X 光於骨質疏鬆症的伺機性篩檢與臨床應用
台大醫院骨科 侯君翰 副教授
一、骨質疏鬆症的「診斷缺口」與篩檢新契機
骨質疏鬆症及其併發的脆弱性骨折,對醫療體系的衝擊已不亞於癌症與心血管疾病。根據國際骨質疏鬆症基金會 (IOF) 統計,對於 45 歲以上女性,因骨鬆性骨折導致的住院天數,甚至超過了糖尿病、心肌梗塞及乳癌的總和1。根據流行病學統計,台灣髖部骨折的發生率在亞洲名列前茅,且發生髖部骨折後一年內的死亡率可高達 15-20%2,3。
然而,臨床上面對的最大困境在於巨大的「診斷缺口」 (Diagnostic Gap)。儘管雙能量 X 光吸收儀 (DXA) 是診斷的黃金標準,但受限於設備普及性尚有改善空間(全台灣不到500 台)4、檢查成本高與耗時等因素,尚未有骨折及疼痛等骨鬆潛在病患並無病識感(或者也未有機會接觸到有骨鬆專業訓練的醫師),台灣 50 歲以上人口接受過 DXA 檢查的比例極低。許多病患甚至在發生骨折後,仍未接受標準的骨密度檢測,導致無法獲得完善的骨質疏鬆照護與治療。
近年來,將 AI 導入醫學影像進行「伺機性篩檢 (Opportunistic Screening)」已是備受矚目的國際趨勢。除了利用電腦斷層 (CT) 影像進行定量骨密度分析 (QCT) 或篩查壓迫性椎體骨折 (VCF) 外,為了進一步填補診斷缺口,將此概念應用於臨床更為普及的 KUB 或脊椎 X 光影像上,已成為國際間提升骨鬆診斷率的重要策略5。
隨著 AI 醫療影像技術的百家爭鳴,臨床醫師在選擇篩檢工具時,必須回歸醫學本質,審慎評估其「解剖學的合理性」與「數據的臨床意義」。
二、 慎選 AI 工具,從統計推論回歸精準量測
目前市面上的 AI 骨鬆篩檢模型大致可分為「間接推論」與「直接量測」兩大類。
其實,利用 AI 輔助 X 光進行中軸骨分析的概念,在學術界早已獲得驗證。例如長庚團隊於 2021 年發表在《Nature Communications》的研究中6,即證實了透過深度學習分析腰椎 X 光影像,能獲得與 DXA 高度一致的骨密度預測值,並有效篩檢出骨質疏鬆症。這項先驅研究確立了直接分析中軸骨影像在科學上的有效性與臨床價值。
然而,並非所有 AI 工具都遵循此一原則。在臨床效度與偽陽性風險的控制上,不同技術原理存在本質上的差異。
1. 胸腔 X 光 (CXR) 的解剖限制與偽陽性風險
部分 AI 產品利用胸腔 X 光進行骨鬆篩檢。但依據國際臨床骨密檢測學會 (ISCD) 指引,骨鬆診斷應優先量測中軸骨(腰椎、髖部),這不僅是為了符合診斷標準,更關鍵的原因在於:臨床上發生在腰椎與髖部的骨折,其所導致的臨床後果、醫療成本以及 死亡率皆最為嚴重,是骨鬆防治工作中必須優先守住的防線。
胸腔 X 光的視野 (FOV) 通常僅能涵蓋第 12 胸椎 (T12) 或第 1 腰椎 (L1)。此類技術多是透過分析 T12/L1 的特徵,再利用統計模型去推估整體腰椎 (L1-L4) 的骨密度。這種方式存在顯著風險:若病患真正的骨質流失發生在 L2-L4,或者 L1 存在退化性增生,CXR 模型將無法正確反應真實骨密狀況。
此外,間接推論的模型在極端值(嚴重骨鬆)的預測上,常出現回歸線斜率 (Slope) 遠離 1 的現象(即低估或高估嚴重程度)。若因此產生大量偽陽性 (False Positive),將重演過去足跟超音波 (QUS) 篩檢的困境,產生過多的假警報,導致後續轉介 DXA 的結果多為正常,不僅徒增無謂的醫療支出,更可能因此磨損民眾對新科技的信心。
2. 監管類別的落差與數據透明度隱憂 另一項臨床醫師需警覺的是產品宣稱與核准內容的落差。市面上部分廠商雖宣稱具備 AI 分析髖部骨密度功能,且持有醫療器材許可證,但細究其核准內容,並非屬於高標準的人工智慧/機器學習醫療器材 (AI/ML-based SaMD)類別。
這意味著該產品的 AI 演算法、模型架構與驗證數據,未經過主管機關針對智慧醫材的嚴格效能審查。最直接的影響是,其仿單上缺乏經監管機關審查的效能數據(如 PPV、NPV、敏感度、特異度、與 DXA 的相關係數/誤差等等),導致臨床醫師無法透過仿單客觀評估其功效,難以掌握該檢測真實的臨床特性。。
此外,若此類模型在導入醫院時,強調需要針對該院 X 光機台進行客製化重新訓練 (Re-training),這在 AI 領域上往往是個警訊。一個成熟的醫療 AI 模型應具備跨機台的通用性 (Generalizability);若需逐院調整,暗示模型可能僅是透過過度擬合 (Overfitting)來適應特定機台、單一場域的參數雜訊,而非學習到真正的骨骼生物特徵。在缺乏 DXA 作為驗證標準的基層醫療場域,這類缺乏仿單數據背書的黑箱分析,其可信度令人存疑。
三、 選擇 AI 輔助系統的臨床指標
面對不同原理的 AI 工具,臨床醫師在導入時可參考以下指標,以確保篩檢效益最大化:
• 解剖學的相關性 (Anatomical Relevance): 考量骨鬆骨折的高風險部位主要位於髖部與腰椎,選擇能直接分析該解剖部位的檢測工具,在病理生理學上最具說服力。這能避免因其他部位(如足跟、胸骨)的雜訊干擾,而錯失了真正需要治療的病患。 更關鍵的是,臨床上常需依賴世界衛生組織開發的 FRAX® (骨折風險評估工具) 來輔助臨床決策。值得注意的是,股骨頸 (Femoral Neck)」的量測是FRAX 運算模型中唯一認可輸入的骨密度參數。因此,具備髖部分析能力的 AI 系統,方能提供此關鍵參數,協助醫師計算病患未來十年的骨折機率。
• 風險分層的細緻度與常模依據 (Risk Stratification and Reference Standards): 骨密度的檢測是對骨折風險的連續性評估,而非僅是「有病/無病」的二元切點。理想的 AI 輔助系統不應只給出「異常/正常」的二分法結果,而應提供具備臨床意義的風險分層資訊,例如符合 WHO 標準的分類(正常、低骨量 Low Bone Mass/Osteopenia、骨質疏鬆 Osteoporosis)或具體的 T-score 數值,協助醫師精準判斷病患是處於早期骨流失還是急需藥物介入的階段。此外,T-score 的計算高度依賴所選用的參照族群 (Reference Population)。依據台灣骨質疏鬆症學會及 ISCD 的建議,應採用 NHANES 年輕白人女性的資料作為計算常模8,9。若 AI 系統未明確告知使用者其使用的參照族群,或使用定義不明的內部資料庫,其產出的 T-score 將失去臨床通用的比較意義。
• 仿單資訊與驗證的透明度 (Transparency of Validation): 無論是採用何種影像模態,AI 模型的泛化能力至關重要。理想的 AI 醫材應在仿單或公開資料中,揭露其與黃金標準 DXA 的比對數據(如相關係數、回歸誤差、均方根誤差等等)。若模型還需要針對個別醫院機台進行客製化調校,除了需留意過度擬合 (Overfitting) 的技術風險外,更潛藏了醫療器材合規性的疑慮。使用未經查驗登記許可的「客製化模型」,本質上可能已偏離了原始核准的軟體規格,醫師在臨床使用時恐面臨適法性風險。 具備跨院所、跨機台穩定性的模型,才能在基層醫療或不同臨床場域中,提供可信賴且合規的輔助資訊。
四、 臨床情境範例:從常規腹腔影像發現骨鬆風險
將此類伺機性篩檢應用導入臨床流程,能實現不增加輻射暴露、不改變現有流程的無縫篩檢。
【臨床情境模擬】 一位 65 歲女性因腰痛或懷疑腎結石至泌尿科/家醫科就診,醫師開立常規 KUB (腹部 X 光) 檢查:
1. 自動化分析: 影像上傳 PACS 後,AI 系統於背景自動執行。系統依據預設的篩檢條件(如檢查醫令碼、拍攝部位等),辨識出適合分析的 X 光影像,自動進行髖部或腰椎的骨密度運算,並輸出骨折風險指標(如 T-score、WHO 分類)。
2. 風險提示: 醫師在診間閱片時,可同步審閱 AI 輔助報告。例如:系統提示該病患腰椎 L1-L4 T-score 為 -2.8,屬於骨鬆高風險族群。
3. 精準轉介: 醫師依據此客觀數據(基於系統具備足夠高的陽性預測值 PPV),向病患解釋:「雖然這次是看結石,但AI分析影像中的腰椎部位,發現您的骨質密度有異常風險。」進而安排轉介至骨科或新陳代謝科,進行標準 DXA 確診與後續藥物照護。
五、 結論
DXA 依然是目前骨質疏鬆症診斷與療效追蹤的黃金標準,但在受限的醫療資源與檢測量能下,我們需要更普及的工具來填補巨大的篩檢缺口。隨著 AI 技術的成熟,透過賦能現有的 X 光影像,我們能有效補足 DXA 的檢測量能,將篩檢戰線大幅前推。選擇具備 「檢測部位與臨床風險相關性」、「標準化風險分層」 、 「高陽性預測值」以及「多場域上市後效能驗證」的 AI 工具,將是落實精準醫療、降低高齡骨折風險的關鍵一步。
參考文獻
1. International Osteoporosis Foundation. Epidemiology. https://www.osteoporosis.foundation/health-professionals/about-osteoporosis/epidemiology.
2. Chie WC, Yang RS, Liu JP, Tsai KS. High incidence rate of hip fracture in Taiwan: estimated from a nationwide health insurance database. Osteoporos Int. 2004;15(12):998-1002.
3. Lee SH, Chen IJ, Li YH, Fan Chiang CY, Chang CH, Hsieh PH. Incidence of second hip fractures and associated mortality in Taiwan: A nationwide population-based study of 95,484 patients during 2006–2010. Acta Orthopaedica et Traumatologica Turcica. 2016;50(4):437-442.
4. 核能安全委員會. 113年游離輻射應用與管理統計.; 2025.
5. 16 Bit Inc. 16 Bit Announces FDA De Novo Marketing Authorization of RhoTM, an AI-enabled Opportunistic Pre-Screen for Low Bone Mineral Density on Standard X-Rays.
6. Hsieh CI, Zheng K, Lin C, et al. Automated bone mineral density prediction and fracture risk assessment using plain radiographs via deep learning. Nat Commun. 2021;12(1):5472.
7. FRAX Calculation Tool. https://www.fraxplus.org/calculation-tool.
8. 台灣成人骨質疏鬆症防治之共識及指引. 中華民國骨質疏鬆症學會; 2025.
9. The International Society For Clinical Densitometry. 2019 ISCD Official Positions Adult. Published online 2019.