英美推動資料科學於衛生醫療行動方案介紹

導讀
資料科學成為近年產學研界熱衷討論的課題,其應用也為各界所期待。其中一項最為各界所關心的應用就是如何結合資料科學的方法工具與醫療行為及醫學研究來提昇醫療品質及公眾的衛生健康。本文就英美等國衛生部門推動資料科學應用在醫療保健的行動方案作一簡要的介紹。
文章圖片所有權: https://ppt.cc/fX8Kmx ,Created by mohamed_hassan
著作權聲明: CC0 Public Domain-可以做商業用途-不要求署名

一、前言

資料科學不是突然興起的新興科學議題,而是經過長期演變的學術研究主題。統計學或是統計模型的使用已經深深扎根在資料科學領域,隨著科技的進步,資料近用(access)多元化使得資料科學也被應用在如人工智慧、機器學習及萬物聯網等新興科技範疇內。同時伴隨著網路使用者日眾、社群媒體、電子商務的應用推動大量資料/數據的產生,許多新興資訊分析研究主題如消費者行為、民眾情感動向預測、自然物種遷移、自然環境演化等課題也促進資料科學的發展,不管是理論或是應用都獲得極大的進步。許多分析師及研究者都認為資料科學的應用潛力將能提供決策者更好的決策分析依據,使得這門科學獲得產業界、學術界及情報部門更大的重視與應用,被廣泛應用在醫藥、工程、商業情報及社會科學等。下文將說明美英兩國在推動資料科學應用在醫療衛生的具體行動。

二、美國衛生研究院 (NIH) 發佈數據策略

2019年6月4日,美國衛生研究院 (National Institute of Health, NIH) 的資料科學策略辦公室 (Office of Data Science Strategy) 發布該院第一份「資料科學策略計畫」(Strategic Plan for Data Science),其目的即為對該院補助的各類生醫研究計畫所產生的大量數據與資料進行現代化的管理與應用提供發展路徑,並對所補助計畫的研究成果產生的資料價值極大化。其總體計畫目標見圖1所示:

圖1 NIH資料科學策略計畫目標
資料來源:NIH; 本研究整理。

本策略計畫共有五大目標,即為圖1所示的(1)支持高效及有效的生醫研究資料基礎設施;(2)促進資料源生態圈的現代化;(3)支持先進管理、分析與視覺化工具的開發與推廣;(4)加強生醫資料科學的人力資源開發;(5)制定適當的政策以促進管理及永續發展。

計畫的總體目標是打造完整的生醫研究資料生態圈,所以在未來的執行工作內容上涵蓋基礎設施建設、人才培育、管理方法、研究分析工具開發、推動政策等主要工作。透過這種完整的配套措施與行動方案來推動生態圈現代化工程,打造一個能夠讓從個人、企業到社群的使用者都能夠在其中定位及角色扮演的資料應用環境。同時為確保這些生醫研究資料及延伸的產品或服務可以符合NIH所設定的FAIR原則,即資料可檢索(Findable)、可存取(Accessible)、可交互運作(Interoperable)和可重複使用(Reusable)。其具體的措施包含:

  • (一)支持通用性的基礎建設及結構,並在其上打造更為專業及具備互聯功能之平台。
  • (二)利用商業工具、技術、服務及專業知識,並採用及改造來自其他領域的工具或技術來使用在生物醫學研究上。
  • (三)透過培訓及合作方式,加強美國生醫資料科學研究的人力素養。
  • (四)強化資料共享、存取及可交互運用等方式,讓NIH所支持的資料資源符合FAIR原則。
  • (五)根據NIH的要求和合法性,確保來自患者或參與者所提供的資料符合安全性及保密性。
  • (六)提高生醫研究在獲取、策展(curate)、驗證、儲存和分析臨床資料的能力。
  • (七)透過社群的參與推廣、建造適用於廣泛領域應用的資料標準,包含標準化資料詞彙(standardized data vocabularies )和知識本體(ontologies)。
  • (八)與其他聯邦、私人及國際組織協調合作,促進具經濟規模的協同效應以避免不必要的重複工作。

為了符合所設定之FAIR原則,無可避免的將造成大量的額外工作。如需要滿足可被檢索這項要求則資料/數據必須被標記,使其具有唯一的“身份証明”,這可以想像其中浩大的工作量;同時為了使資料可存取,資料必須通過開放系統以有效且安全的身份驗證及授權程序來檢索使用;而可交互運作,則資料必須標準化使之具備共同性的”語言”,同時為了可重複使用,資料/數據也必須能夠追溯出處來源。這些要求都可預期將對資料格式標準化、標籤設定系統化及具備可擴充性較現階段更為嚴格,也對擴大資料應用產生許多不可預期的障礙。

NIH其中一個重要任務便是就生醫研究所產生的各類資料及數據進行儲存、管理、標準化以及發佈等工作。因此發布資料科學策略計畫對NIH的推動深化工作有其必要。可存取、條理分明、安全及高效的可操作資料源是近代科學研究調查的關鍵因素。NIH為最大化其所資助的研究計畫所產生的資料價值,以加速生醫研究的發現與突破。為了跟上生醫資料科學的快速發展,NIH必須解決以下的問題:

  • (一)使NIH所資助的生醫計畫產生之資料集(data set)及研究資源具備可檢索性、可互聯、可交互運作性等性質;
  • (二)整合現有及同時開發新的資料管理工具;
  • (三)將學界所開發的創新演算法及工具普適化,使之適用於企業間現成之資料資源,並滿足容易使用及高效操作等產業標準;
  • (四)不斷增長的資料管理成本。

為了強化資料科學管理與推動措施,NIH已經在內部設立首席資料策略師的職務(Chief Data Strategist) 。2019年所發布的新的策略計畫,也反映美國國家衛生院意識到資料科學在生醫研究將扮演舉足輕重的角色,必須在整體性的規劃上作更為細膩與聰明的布局,才能有效推動生醫資料科學的發展與應用。

三、英國的衛生資料科學行動

2019年4月9日,英國衛生資料研究所 (Health Data Research UK, HDR UK) 發布了該所「2019/20 研究所一體化策略」 (One Institute Strategy 2019/20) 報告。英國衛生資料研究所是一個獨立非營利機構,接受高達十個外部單位的經費補助,包含像是英國心臟基金會(BHF, British Heart Foundation)、蘇格蘭首席科學家辦公室(Chief Scientist Office, CSO)、工程與物理科學研究委員會(Engineering And Physical Sciences Research Council, EPSRC)、經濟社會研究委員會(Economic & Social Research Council, ESRC)、醫學研究委員會(Medical Research Council, MRC)、國立衛生研究院(National Institute for Health Research, NIHR)等。機構成立目的為統一與整合英國民眾的衛生醫療資料,找出潛藏其中的新科學發現藉以改善民眾生活品質。HDR與五個機構達成策略合作伙伴(分別為英國心臟基金會、KQ實驗室、藥物發現推動中心(Medicines Discovery Catapult)、艾倫圖靈研究所、英國衛生資料研究聯盟),並和分布在英國六個區域的22家大學及研究機構合作,分別為(見表1):

表1 HDR 合作機構分布

區域 合作大學與研究機構
英國劍橋衛生資料研究 (Health Data Research UK Cambridge) •劍橋大學醫院NHS信託基金會(Cambridge University Hospitals NHS Foundation Trust)
•EMBL-歐洲生物資訊研究所 (EMBL-European Bioinformatics Institute)
•劍橋大學
•惠康信託桑格研究所 (Wellcome Trust Sanger Institute)
英國倫敦衛生資料研究 (Health Data Research UK London) •倫敦帝國理工學院 (Imperial College London)
•倫敦國王學院 (King’s College London)
•倫敦衛生與熱帶醫學院 (London School of Hygiene & Tropical Medicine)
•倫敦瑪麗皇后大學 (Queen Mary University of London)
•倫敦大學學院 (University College London)
英國中部地區衛生資料研究 (Health Data Research UK Midlands) •伯明翰大學醫院NHS信託基金會 (University Hospitals Birmingham NHS Foundation Trust)
•伯明翰大學 (University of Birmingham)
•萊斯特大學 (University of Leicester)
•諾丁漢大學 (University of Nottingham)
•華威大學 (University of Warwick)
英國牛津衛生資料研究 (Health Data Research UK Oxford) •牛津大學
英國蘇格蘭衛生資料研究 (Health Data Research UK Scotland) •阿伯丁大學(University of Aberdeen)
•鄧迪大學(University of Dundee)
•愛丁堡大學(University of Edinburgh)
•格拉斯哥大學(University of Glasgow)
•聖安德魯斯大學(University of St. Andrews)
•斯特拉斯克萊德大學(University of Strathclyde)
英國威爾士與北愛爾蘭衛生資料研究(Health Data Research UK Wales and Northern Ireland) •貝爾法斯特女王大學(Queen’s University Belfast)
•斯旺西大學(Swansea University)
資料來源:HDRUK官網。

透過彙整這六個地區的醫療衛生資料,並與各區域的資料團隊及醫療團隊合作,集中資源並共享資料與知識來打造更專業的醫療衛生資料科學團隊。HDR成立於2018年4月,是一家很年輕的機構。在2019年所發布的策略報告中,該研究所將打造具創新性的資料分析處理引擎,並提出在未來五年所要達成的8大優先處理工作項目:

  • (一)改善新疾病與療法的發現;
  • (二)改善對病患安全、有效且能夠負擔的診療方法評估;
  • (三)改善患有常見疾病病患的健康預期壽命;
  • (四)改善臨新創新以促進NHS (National Health Service) 和社會照護服務;
  • (五)開發與應用先進的衛生資料來解決具挑戰性的衛生問題;
  • (六)培養超過10,000名衛生資料學家;
  • (七)創建全球領先的資料基礎建設及全英國範圍內的資料服務安全方法;
  • (八)透過讓民眾參與研究所的研究與創新活動來贏取公眾信任。

英國衛生資料研究所未來行動架構,可參考圖2所示,利用透明、參與的方式並透過科學研發(如臨床試驗的參與、治療方法的開發等)、人才培養(如資料科學家、數學家等)、打造適用的基礎建設(如資料庫、穿載式裝置的開發、基因組學等),做好資料治理(如電子病歷、醫學影像的管理儲存及保護措施)以贏取民眾的信任。透過這些組合式的推動措施與行動來打造英國的衛生資料治理框架,以促進未來安全、可信賴的衛生醫療研究資料服務,並進一步來改善病患的護理與治療水準。

圖2 英國衛生資料研究所未來行動架構示意圖
資料來源:HDR UK; 本研究重製。

而在實際的行動方法共分為:科學、人才、基礎建設與公眾參與四大主題,每一主題都有不同的優先項目(見表2)。完整的說明見後述文字,茲就說明如下:

表2 HDR UK推動衛生資料行動方案之策略架構

主題 主軸 優先項目
科學 衛生資料科學的工具與科技 人類表型計畫(Human Phenome Project)
應用分析
示範大規模衛生資料解決重大衛生挑戰問題的能量 瞭解疾病成因
更好、更快、更有效的臨床試驗
改善公共衛生
數位健康洞察力
人培 學校畢業生
研究生培訓
博士後培訓
支持職涯道路
基礎建設 建構數位創新中心的生態系統
成立英國衛生資料研究聯盟
提供安全使用衛生資料的環境
極大化衝刺示範計畫的衝擊與學習體驗
實現均衡、嚴格、高效及透明的資料治理
促使NHS與公部門獲取公平價值
公眾參與 公眾參與決策與推動建議
透明、開放及負責任
創新工作方法
資料來源:本研究整理。

(一)科學

抱負期許:發展先進的衛生資料科學工具與技術來分析複雜與發散的衛生資料,以解決具挑戰性的衛生問題。

在科學研發推動上分為兩大主軸、計有六個優先項目:

1.衛生資料科學的工具與科技

(1)優先項目1.人類表型計畫—應用科學量測技術可靠的重現人類衛生與疾病的各類表徵。

(2)優先項目2.應用分析—將機器學習與人工智慧的方法應用在處理大量和複雜的衛生資料上。

2.示範大規模衛生資料解決重大衛生挑戰問題的能量

(1)優先項目3.瞭解疾病成因—整合多樣資料來確認新的疾病成因,從而開發全新的或重新定位臨床治療方法、診斷方法及治療干預手段。

(2)優先項目4.更好、更快、更有效的臨床試驗—與資料管理人合作,改善英國地方臨床試驗的招募、評估與監控工作。

(3)優先項目5.改善公共衛生—為相應的政策及干預措施提供必要資料,以提高民眾健康平均餘命 (health life expectancy) 及預防疾病的發生。

(4)優先項目6.數位健康洞察力—把衛生資料轉換為個人、臨床及衛生健康系統決策所需之洞察力。

(二)人才培育

抱負期許:將培養超過10,000位以上涵蓋從各級學校畢業生、資深研究人員到國際知名學者等不同的職涯階段的衛生資料科學家。

1.優先項目1.學校畢業生有兩項主要行動方案:

(1)學徒計畫將提供年青學子有關衛生資料科學技能培訓與學習體驗。透過雇主與教育機構的合作,提供從A-level(相當於國內高中畢業)到碩士級的培訓課程。

(2)大學醫學課程將與各級皇家學院、醫學總會(General Medical Council, GMC)、臨床資料學院(Faculty of Clinical Informatics, FCI)及英國醫學院長研究生會議(Conference of Postgraduate Medical Deans of the United Kingdom, COPMeD)合作,推動資料科學培訓作為未來醫學士課程(Bachelor of Medicine and Bachelor of Surgery degrees, MBChB)的核心項目。

2.優先項目2.研究生培訓有兩個主要行動方案:

(1)碩士學位,將補助一年制的衛生資料科學碩士學程,以促使生命科學系及計量科學系畢業生能夠參與未來的衛生資料科學研究。

(2)HDR/圖靈博士訓練計畫,與圖靈研究院合作,每年提供12位數學、統計與計算科學系畢業生進修衛生資料科學博士培訓名額。

3.優先項目3.博士後培訓包含四個行動方案:

(1)NIHR/HDR UK衛生資料科學孵化器,三年內將提供40個國家衛生研究院臨床研究工作,並邀請外部研究人員加入HDR工作團隊,打造跨領域研究網絡。

(2)職涯中斷回歸研究工作,提供2年期的研究工作職務鼓勵職涯中斷的衛生資料科學家重回此一領域,重建他們的研究工作或重新訓練專業能力。

(3)與英國其他的研究委員會共同補助包含但不受限在衛生資料科學相關的研究計畫案。

(4)夏季學校,HDR UK將舉辦為期一周的暑期學校,課程包含科學報告、短期課程以及提供與會者與同儕互動的人際網絡機會。

4.優先項目4.支持職涯道路包含三個行動方案:

(1)HDR將與英國醫學研究委員會、學術界及產業界合作,提供論文發表場域及職場升遷等作為吸引及留住此領域之專業人士。

(2)產業合作—與產業界共同補助博士生,或針對製藥及科技類公司員工或個人進行培訓,結合個人專長來解決領域的學術問題。

(3)持續專業發展機會—根據需求及訓練缺口開發設計各類培訓方案,並計對HDR的培訓活動設計一套績效評估指標。

(三)基礎建設

抱負期許:將打造世界領先的資料基礎建設,以及可供全英國範圍內的資料服務安全方法以加速科學研究及數位創新。

其主要活動共有六項優先推動項目:

1.優先項目1.建構數位創新中心的生態系統—中心將提供各界所需之專業服務,包含疾病資料集、臨床試驗服務、分析平台等,並成為國際投資的重心;

2.優先項目2.成立英國衛生資料研究聯盟、整合跨領域專業知識以加速資料研究與創新的步伐,並在衛生資料管理上提供最佳的實踐案例。該聯盟將整合包含NHS的病患資料、基因組資料、分子資料來提升資料分析的規模與速度;

3.優先項目3.發展基礎建設以提供安全使用英國衛生資料的環境—此設施將提供一個單一、安全且可檢索使用的資料設施,這些設施將由完善的資料/數據治理框架以及先進的資料發現工具軟體所支持;

4.優先項目4.極大化來自衝刺示範計畫 (Sprint Exemplar projects) 的衝擊與學習體驗—從2018~19年間,HDR即補助十個衝刺示範計畫來驗証技術、方法論以及研發服務的構想;

5.優先項目5.在英國衛生資料研究聯盟下實現均衡、嚴格、高效及透明的資料治理—優先改善資料托管人之間的互動關係,並透過DIH所補助的計畫來建構足以信賴、適當的資訊治理 (IG, information governance) 規範;

6.優先項目6:為照顧病患及納稅人的利益,促使NHS與公部門獲取公平價值—預期在2019~20年間透過各利害關係人的協商後完成參與協議(Participation Agreement),參與協議主要分為三個部份:中心運作模型、基礎設施的使用條款以及使用者認證規章與收費方式等。透過參與協議鼓勵資料使用、意見回饋給NHS和社會以促使本工作永續發展。

(四)公眾參與

抱負期許:透過更多民眾在不同的創新過程中參與以鼓勵更有效率的衛生資料科學。

1.優先項目1.病患與公眾將參與HDR方有關方向、政策、決策、規劃與推動方法等。

2.優先項目2.HDR將以透明、開放及負責任的態度來處理、儲存、安全、檢索、使用及共享資料的方式 (how) 及原因 (why)。

3.優先項目3.HDR將以創新的工作方法、應用機制及說故事的方式(如動漫)等多元方法來贏取公眾的信任。

英國對此衛生資料研究所的期望甚高,在2019和2020年將投入3,450萬英鎊(約台幣13.8億),打造一個小規模但具戰力的核心團隊,希望HDR能夠在未來5~20年間成為全球領先的國際知名衛生資料研究機構,能夠對英國政府未來可能推動的衛生資料政策及行動提供實質有用的策略建議。

四、結論

資料科學發展的意義不僅是其本身的學術意義,也包含了資料科學對其他科學研究所帶來的正向衝擊與助益。透過多年來學界熱衷討論的資料開發進用,未來對資料與數據的深化應用將可能帶來一波新的學術研究方法論的革新。而在各國所推動的資料科學發展行動上,除了聚焦在資料科學本身的學術研究上,把資源投入在資料科學方法與理論、資料科學的基礎建設(如設立研究系所以作為人才培育之根本外),對資料科學的應用研究也是各國的關注重點,如英國所推動的衛生資料科學行動方案,或是美國NIH所發布的資料科學策略,其中對未來醫療健康及病患所帶來的可能效益,都是我國衛生主管部門或是醫療照護體系可以參考學習的對象。

延伸閱讀