發佈日期:2019-07-15

人工智慧醫療器材監管措施之初探

作者:洪長春

政策評析 人工智慧 機器學習 醫療器材專屬軟體 監管 總產品生命週期 Artificial Intelligence Machine Learning SaMD Regulatory TPLC

文章圖片所有權: https://ppt.cc/fZyVrx ,Created by Bokskapet
版權適用聲明: CC0 Public Domain-可以做商業用途-不要求署名

11

一、醫療器材政策制定的框架

22

醫療器材(medical device)領域的快速發展和問題的複雜性使得技術採用和管理決策成為醫療衛生主管機關和照護管理機構一項非常具有挑戰性的任務。醫療器材監管的複雜性,部分原因是因為各式各樣的物品皆歸類為醫療器材,如醫用紗布、醫用手套與棉花等,對於政策制定者或醫療照護管理人(health care manager)來說,其監管行為是試圖在允許消費者快速接觸新的或改良的醫療器材以及防止不安全和無效的器材進入市場之間取得平衡點。醫療器材的開發和製造主要取決於是否具有成本效益,嚴厲的監管措施可能會增加開發成本,但如果對器材的監管不夠嚴格,不安全或無效的產品對消費者會造成傷害或損失。

33

以國家政策制定來說,最簡單的框架是用消費者市場行為做類比的三層級監管干預 (regulatory interventions),如表1所示:此框架可以促進所有公眾利益相關者(stakeholders)之間取得共識。

44

表1 政策和監管干預措施

政策和監管
干預層級
政策要素 功能和目標 典型覆蓋範圍
1 器材市場 1. 器材安全,性能和品質符合全球標準
2. 進行市場設備註冊
3. 上市後監控
全球性
國家性
2 採用/選擇 1. 當地人為因素(包括熟練的操作員)/環境因素
2. 成本效益分析
3. 當地文化,政治,公平考慮因素
4. 健康照護預算的影響
國家性
省/地區
健康照護設施
3 使用/處置 1. 安全,適當和有效的使用
2. 性能監控,問題識別和解決
3. 良好管理實踐的基本要素(包括用戶訓練,器材性能監控,維護和處置)
健康照護設施性
專業協會
個人
資料來源:HNP Brief #8(2007) WHO.
55

第3層級的監管干預措施是屬於本地操作的使用/處置,醫療器材用於患者護理,國家應該優先考慮資源分配。一般而言,醫療器材生命週期管理的基本要素,可作為醫療器材良好管理實踐的精髓。美國FDA為因應技術進步,積極制訂數位醫療相關產品的監管措施,並據此規劃「數位健康創新計畫(Digital Health Innovation Plan)」及「數位健康產品開發商預認證試行方案(Pre-Certification for Software pilot program)」。其核心概念在於將原以醫材產品為主的上市前監管模式,改為增加對產品製造商的評量與上市後監管的力度。

66

二、美國醫療器材監管程序

77

美國是當今最大的醫療器材市場,一般醫療器材產品擬在美國境內上市的廠商,必須經過美國食品和藥物管理局(FDA)之器材和放射健康中心(Center of Devices and Radiological Health,CDRH)監管醫療器材的安全性和效能。FDA會根據器材對消費者的風險對器材進行產品等級分類,申請法規途徑可簡略區分為三種(如圖1):

88

圖1 USFDA醫療器材監管程序 資料來源:Meidata(2012);本研究自行整理。

99

第1種為低風險器材(Class I)如:塑料手套、彈性繃帶或手持式手術器材對消費者構成的風險最小,僅在註冊時就可以合法銷售;第2種為上市前通知(Premarket Notification),屬於中等風險器材(Class II)如:電動輪椅、輸液泵或手術消毒蓋布(drapes)等,此途徑是依據FD&C Act第510節第k項,簡稱510(k)進行監管,另外510(k)Exempt,部分醫療器材的風險危害因子較小,經FDA公告可免除510(k)或PMA申請途徑,主要為Class I和少部分Class II的醫療器材;第3種為上市前審查(Premarket Approval,PMA),此途徑主要為Class III的高風險醫療器材,如:心臟瓣膜、矽膠乳房植入物或心臟起搏器等。目前最普遍申請上市的美國醫療器材是透過510(k) 法規路徑,不過根據CDRH對510(k)制度評估報告指出安全性及有效性衍生之問題(陳慧如、王明哲,2011),有些類似品已經不適合當作比對的產品,應考慮發佈法規或指引來定義範圍、觀點、和合理的程序(包含公告及聽證會)等。如何在資訊充足下及時有效且可預測方式進行510(k)實質相等性之比對,對CDRH而言仍是一項挑戰,根據評估報告指出建議建置類別"IIa”及"IIb”的管理區別方式 1 。新類別"IIb”產品,一般而言是指ClassⅡ中風險等級比較高的醫療器材,可能包括:可植入物、生命支撐系統器材或生命維護系統器材等,CDRH的審查員必須透過產業的教育訓練具備判別類別"IIa”及類別"IIb”之能力。

1010

三、人工智慧醫療器材監管議題

1111

人工智慧(Artificial Intelligence, AI)和機器學習(Machine Learning, ML)為主的技術有可能透過從每天提供醫療照護期間產生的大量數據中獲得新的重要見解來改善醫療照護。目前高價值應用的示例包括:早期疾病檢測、更準確的診斷、新的觀察或人體生理學模式的識別,以及個人化診斷和治療的發展。 AI / ML技術最大好處之一在於其設計和訓練軟體演算法,從實際使用的數據中學習,透過反饋(訓練)提高其性能和採取行動。因此,AI / ML技術的適應性(adaptation)學習,成為獨特的醫療器材專屬軟體(Software as a Medical Device ,SaMD)中快速擴展的研發領域。

1212

根據FD&C Act,FDA將醫療目的視為旨在治療(treat)、診斷(diagnose),治癒(cure),緩解(mitigate)或預防其他疾病的目的。國際醫療器材監管機構論壇(International Medical Device Regulators Forum,IMDRF)將“SaMD”定義為旨在用於執行這些醫療目的的一個或多個的軟體,而不是硬體醫療器材的一部分。目前,FDA已許可或批准多種AI / ML為主的SaMD,但通常僅包括醫療器材在上市之前使用的“鎖定演算法” 。所謂“鎖定”演算法是指每次提供相同輸入時即提供相同結果的演算法。鎖定演算法將固定功能(例如:靜態查找表、決策樹或複雜分類器等)應用於給定的一組輸入,這些演算法可以使用手動過程進行更新和驗證;相反於鎖定演算法,自適應演算法(例如:連續學習演算法)使用定義的學習過程來改變其行為。自適應演算法之適配或改變,對於給定的一組輸入,在實現改變之前和之後的輸出可以是不同的,這些演算法更改通常透過定義明確且可能完全自動化的過程來實現和驗證,該過程是基於對新數據的分析,旨在提高SaMD之性能。

1313

傳統的醫療器材監管模式並非針對自適應AI / ML技術而設計,從監管角度來看,目前沒有專門規範醫療器材中人工智慧使用的法規或統一標準。即使如此,人工智慧醫療器材仍必須符合現有的法規要求,例如:製造商必須證明醫療器材的益處(benefit)和性能(performance),對於診斷目的用的設備,必須證明其靈敏度和特異性;必須根據預期目的進行器材驗證及描述,並根據規範進行證明;必須確保軟體開發方式能夠可重複性、可靠性和性能;如果臨床評估是基於比較器器材(comparator device),則該器材必須具有足夠的技術等效性(technical equivalent),明確包括軟體演算法的評估等。2019年4月美國FDA公布AI / ML為主SaMD之監管架構修正的討論文章,希望收集各界回饋意見,時程從4月2日至6月3日止。

1414

四、美國FDA對人工智慧SaMD之監管要求

1515

FDA認知根據現有法規,自學習或持續學習演算法的醫療器材專屬軟體(SaMD)需要再次進行檢查和批准,並且著眼於對演算法進行修改的目標。FDA提出根據IMDRF之風險分類框架、FDA之利益風險框架(benefit-risk framework)、FDA軟體修改指南 (決定何時提交510(k)進行軟體變更到現有器材) 中的風險管理原則及批准程序,包括FDA的預認證計劃(pre-cert program)等,針對這些醫療器材的高度疊代,自主和自適應性質要求提出一個新的,總產品生命週期(total product lifecycle,TPLC)監管架構的法規研究 (如圖2),以促進產品改進的快速循環,並允許這些器材在提供有效保護的同時不斷精進。

1616
17

圖2 FDA在AI / ML之SaMD監管架構上疊加的TPLC流程 資料來源:USFDA;本研究自行整理。

17

IMDRF SaMD風險分類框架是根據預期用途對SaMD進行風險分類,如表2所示:分為四類,從最低(I)到最高風險(IV),以反映風險有關的臨床情況和器材使用,類似於FDA使用的傳統風險方法。

1818

表2 IMDRF SaMD風險分類

醫療照護情況
或條件
SaMD對醫療照護決策提供信息的重要性
治療或診斷
(Treat or diagnose)
驅動臨床管理(Drive clinical management) 告知臨床管理(Inform clinical management)
危急 (critical) IV III II
嚴重(serious) III II I
非嚴重(non-serious) II I I
資料來源: USFDA.
1919

510(k)軟體修改指南是側重於軟體變更對用戶/患者造成的風險,目標著眼於演算法修改所引起的新風險或修改可能導致重大損害的現有風險之變更等,修改類型通常分為三大類:

2020

(一)臨床和分析性能的改進

2121

這些改進可能包括使用重新訓練預期使用群體內的新數據集。例如:在檢測數位乳房X線照片中可疑癌症的乳房病變時SaMD的敏感性增加。

2222

(二)修改演算法使用的“輸入數據”

2323

例如:可以支援與其他製造商CT掃描儀的兼容性;可以擴展到診斷心房顫動的輸入類型,例如:心率數據等。

2424

(三)預期用途的變化

2525

如上所述IMDRF風險分類框架,SaMD提供有關醫療照護情況或條件信息的重要性進行描述,例如:從“診斷輔助”(驅動臨床管理)的信賴度分數(confidence score)到“明確診斷”(診斷);使用SaMD演算法已擴展從一種癌症到另一種癌症的病變檢測等,此類型修改製造商必須明確聲明。

2626

根據FDA所提出的TPLC方法,製造商可以遵照以下4種修改方向作為確保其器材安全性和有效性的基礎,包括:

2727

(一)品質管理體系和良好機器學習規範(GMLP)

2828

FDA並無針對AI/ML演算法要求建立特定的GMLP,但必須體現GMLP的獨特考慮因素,例如:數據管理(data management)、特徵提取(feature extraction)、訓練(training)和評估(evaluation)等軟體工程和品質系統的實踐。FDA希望每個醫療器材製造商都擁有一套既定的品質體系,SaMD開發人員信守品質文化和卓越組織的卓越原則,所有SaMD設備皆能達到符合IMDRF臨床評估指南(如表3)所述的分析和臨床驗證。另外,FDA也討論到訓練、調諧(tuning)和測試數據集(dataset)的適當分離,以及關於輸出和演算法的適當透明度等議題。

2929

表3 IMDRF對臨床評估要件的描述

臨床評估
有效的臨床相關性 分析驗證 臨床驗證
SaMD輸出與SaMD的目標臨床情況有一個有效的臨床相關? SaMD是否正確處理輸入數據以生成準確,可靠和精確的輸出數據 在臨床照護的情境下, SaMD之準確,可靠和精確的輸出數據是否能達到目標人群的預期目的
資料來源: USFDA.
3030

(二)安全和有效性的計劃和初步評估

3131

FDA提議預定的變更控制計劃的監管方法,基於再訓練和模組更新策略,期望製造商依據“SaMD預規格”(SaMD Pre-Specifications,SPS)提出預期修改的類型;並以演算法更改協議(Algorithm Change Protocol,ACP)的控制方法(如表4)進行修改,ACP是對要遵循的數據和程序做逐步描述,以便修改後器材保持安全和有效。

3232

表4 演算法更改協議組成

數據管理 對新的訓練&測試數據
1.蒐集協議;2.品質保證;3.參考標準決定
訓練和測試數據集之審核和分離
再訓練 再訓練目標
相關更改:ML方法,包括架構與參數 ;數據前處理
啟動性能評估的標準
性能評估 評估指標(assessment metric)
統計分析計畫
評估的頻率和觸發
性能目標
必要時用“循環中的臨床醫生”進行測試的方法
更新程序 軟體證明與驗證
何時以及如何實施更新
全球與當地更新的計畫
對用戶溝通及透明
資料來源: USFDA.
3333

(三)初始發布(release)後的修改方法

3434

如果製造商未提交SPS或ACP進行初始批准,則必須再次向主管部門提交未來的修改。如果製造商確實提交了這些文件,主管部門將決定新的提交,是否“僅”執行“重點審查”,或者是否只希望製造商記錄修改,這些決定取決於製造商是否遵循“已批准”的SPS和ACP和/或預期用途是否發生改變。

3535

(四)透明度和真實的性能監測

3636

透過實際使用情況的性能數據收集和監控讓製造商了解其產品的使用狀況,識別改進機會,可以降低修改所涉及的風險,以評估特定AI / ML為主SaMD的利益風險概況。目前FDA採用或正在試用的各種真實的性能監測之建議機制,例如:預先添加文件或年度報告、品質案例活動或透過Pre-Cert Program實際性能分析等,可以基於器材設備的風險、修改的數量和類型以及演算法的成熟度來制定報告類型和頻率。

3737

醫療器材之功能和修改的透明度對於隨時間變化的AI / ML為主 SaMD等設備之使用安全性尤為重要。透明度可對FDA、器材公司和製造商的合作者以及公眾(例如臨床醫生、患者和一般用戶)的更新,對於SPS和ACP的修改,製造商須確保仿單標示更改準確並完整地描述修改,包括其基本原理、輸入的任何變化以及SaMD的更新性能等。製造商可能還需要更新任何受影響的支援設備、附件或非設備組件的規格或兼容性。最後,製造商儘可能透過獨特的機制建立通信程序,描述如何通知用戶更新(例如:信件、電子郵件或軟體通知)以及可以提供哪些信息(例如:如何適當地描述當前版本和先前版本之間的性能差異等)。

3838

五、結論

3939

目前美國FDA正在討論如何處理不斷學習的AI / ML為主 SaMD等系統的監管程序與架構,因此於2019年4月公布一個新的,總產品生命週期的監管方法之討論文章,此監管架構採用IMDRF之風險分類框架、FDA之利益風險框架(平衡利益和風險)、FDA軟體修改指南的風險管理原則及批准程序,包括預認證計劃等程序,期望尋求各界回饋意見。FDA所公布的TPLC監管架構中仍然缺乏所謂的“良好機器學習規範”(GMLP)的指南,目前正由Johner研究所(Johner Institute,2019)與指定機構一起制定中。不過,FDA根據預先批准的演算法修改程序而不要求新提交的想法是一項創舉。

4040

台灣面對目前最大的醫療器材市場,以及人工智慧醫療器材研發領域的快速發展,製造廠商可參考美國FDA所提出的TPLC監管架構,根據本文所介紹的4種修改原則及早準備,方能縮短美國市場上市的申請流程。

4141

註解

4242

註1:2010年8月USFDA之CDRH內部針對510(k)制度初步做了評估建議,建議將Class II分為"IIa”及"IIb”,其中IIb為新建置的類別。

4343

參考文獻

  1. 陳慧如、王明哲(2011), 美國醫療器材510(K)近期改革及未來趨勢之介紹(上), RegMed, Vol.8, pp12-18, 財團法人醫藥品查驗中心醫療器材組。
  2. HNP Brief #8(2007), An Overview of Medical Device Policy and Regulation, http://apps.who.int/medicinedocs/documents/s16737e/s16737e.pdf
  3. Johner Institute(2019), Artificial Intelligence in Medicine, https://www.johner-institute.com/articles/software-iec-62304/artificial-intelligence/
  4. Meidata(2012), Israel medical devices industry, Market Overview。
  5. USFDA (2019), Proposed Regulatory Framework for Modifications to Artificial Intelligence/Machine Learning (AI/ML)-Based Software as a Medical Device (SaMD), https://www.fda.gov/media/122535