發佈日期:2016-03-28

我國學研能量分析方法於科技政策規劃之應用 —以預測分析為例

作者:林品安王宣智

科研投入科技政策學術研究能量分析Technology policyQuantitative analysis in Science and Technology

文章圖片所有權:https://goo.gl/dAnwxy,Created by Bonnybbx
版權適用聲明:CC0 Public Domain─可以做商業用途─不要求署名

前言

一個國家的經濟、民生、國防甚至教育文化皆深深受到科技的影響。因此在科技發展方面不斷開創、推陳出新不只是開發中國家的使命,更是已開發國家的國家綱領;科技政策引導一國科技發展的方向則是重要關鍵,因此科技政策的規劃將扮演著推動國家進步的重要腳色(郝甡, 1994)。而科技政策規劃需要因應在地化需求、合乎當前事宜,除了進行科技探索來預測未來需求而篩選出具有潛力的技術項目之外,了解國內原有的學術研究技術發展能量,將可以幫助了解在技術項目的研發中,該國有較強優勢以及有待加強的部分。

2015年6月我國行政院提出「生產力4.0 」初步規劃(科技會報辦公室, 2015),勾勒出產業在進行4.0升級的概念架構,目標是以設備智能化、工廠智慧化與系統虛實化來完成多項產業在營運面向的轉型,架構包含了以智慧感知層偵測動作方位、光學影像、環境等,以系統管理經由感知層蒐集到的資訊並進行研發、製造、自動化管理,以巨量資料中心將感知層的資訊進行萃取、分析甚至進行決策,最後是以寰宇實體系統(CPS)結合巨量資料中心以及系統管理實行機械智慧化、機器人聯網(經濟部工業局, 2015; 經濟部技術處、科技部前瞻司、農委會科技處, 2015)。綜觀整個架構,硬體層面我們將需要多種多量的實體感測器、可精密控制的工具機甚至是機器人,但在感知層裡預先進行訊號的處理或定義,以及在系統管理裡進行研發模擬、自動化管理所需要的判斷系統,與在巨量分析的軟體運算技術以進行如人腦般的決策分析,則將仰賴預測分析技術來輔助完成。可謂預測分析技術將為未來實現「生產力4.0」很重要的軟體技術,因此本文將針對此技術執行我國學研能量分析,可望得知我國在這項技術發展的研究投入概況,藉此給予發展方向之建議。

研究方法及目的

預測分析的定義為從廣泛蒐集來的資料提供未來趨勢以及機率的預測分析。此技術將使用到資料探勘、機器學習、統計模組等工具以分析資料、建構明顯的模式,並從中得知機率預測。我們希望藉由預測分析技術內包含的子項技術出現的頻率多寡,來分析我國於預測分析技術投入的技術熱點之歷史脈絡,用以推測出我國學研在此技術的實力。

首先,我們從政府研究資訊系統(GRB) 搜尋篩選出與預測分析相關的學研計畫(國研院科政中心, 2015),若計畫的標題、關鍵詞或摘要,凡任一出現預測分析相關的名詞[1],則此計畫將被篩出。對於篩出的計畫資料,我們僅採取計畫上註明的關鍵詞進行其出現頻率高低分析。詞頻高低分析需要一定的關鍵詞數量才能有鑑別度,經過多次測試,我們發現計畫總數需要高於120個,其產生的關鍵詞數量方足夠,而計畫的補助年限通常為3-5年一期,因此,我們將計畫年度分成五年為一個區間,共分成89年以前、90-94年、95-99年以及100-104年等區間,將篩選出來的計畫所包含的關鍵詞,根據年度區間加以分群。因計畫中所列之關鍵詞常有複合關鍵詞,其意涵代表兩種以上的技術,因此我們須將複合關鍵詞拆開(如,模糊類神經網路拆成模糊理論和類神經網路),加以整理;針對關鍵詞之同義不同詞,亦將之收斂成同一個詞。爾後即可對該年度區間的關鍵詞詞頻作排序,並將頻率出現高於1%(關鍵詞出現頻率/總關鍵詞數)的關鍵詞選出。因為預測分析本身應用的領域廣泛,在這頻率高於1%的關鍵詞中,不全然與生產力4.0相關(如、診療決策系統),所以需要將這類無關的關鍵詞刪除。利用前述方法針對每年度區間的關鍵詞做完篩選、排序後,將這些關鍵詞繪製成泡泡型散佈圖。泡泡的大小意指關鍵詞出現的頻率高低(相關計畫數量),泡泡的位置(x軸)則是該關鍵詞出現的年度區間。由泡泡型散布圖中可以顯示出預測分析下的關鍵技術或主要應用領域,並且得知這些關鍵技術或是應用領域的投入歷史脈絡,同時泡泡的大小代表了關鍵技術或是應用領域的投入量。倘若對某年份的泡泡(關鍵技術)有興趣,也可找到相對應的計畫內容與計畫主持人,藉此,可提供學界或產業界尋求某技術上的合作時所需要的資訊。

研究結果與討論

預測分析的泡泡型散布圖(圖 1),首先呈現的是相對投入較多的組成技術,如類神經網路、灰色理論、基因演算法、遺傳演算法、模糊理論、人工智慧、資料庫、資料探勘、專家系統、決策支援系統、決策樹、影像辨識、辨識系統以及地理資訊系統。

預測分析的技術組成為先將資料儲存在資料庫系統,資料探勘索取有用且相關的資料,接著進行專家系統、決策分析。於泡泡型散佈圖發現專家系統、決策樹及決策支援系統在89年以前為相對高度投入的項目,但在90年後的投入較少,資料庫於89年以前和90-94年間的投入相對高,但94年後也減少投入,反之在90年後,資料探勘以及量子理論開始興起,尤其是資料探勘在預測分析技術上的支援,日益成長;推測過往學研利用發展資料庫以整理資料,再將資料進行專家系統研究,發展資料庫進行資料整理,但隨著資料量的蒐集日益龐大,如何篩選、挖掘有用的資料為首要步驟,因此資料探勘的技術隨之成長,而應用於資料探勘的模糊理論、基因演算法之投入也提高。而資料探勘技術須更為精進,才能進行決策判斷,因此近年來,相對的在決策樹、決策支援系統以及專家系統的投入就比以往低。此外,我國在類神經網路以及影像辨識、辨識系統的投入相對穩定。因類神經網路為資料探勘、機器學習、決策系統等的主要技術,而影像辨識一直是從處理文字、數字升級到處理影像的關鍵技術。

利用此研究方法,除了可以應用於預測分析此等大類技術外,亦可針對其某個子項目進行分析。以類神經網路為例,該技術為資料探勘、機器學習、預測分析的重要演算法之一,且其演算法有多種不同系統加以應用,我們可以從包含類神經網路的複合關鍵詞,來分析我國投入的應用系統之時程路徑為何。

圖 1 預測分析的泡泡型散佈圖,橫軸為時段的區分,共四個時段:89年以前、90-94年、95-99年以及100-104年,顯示每個泡泡皆代表一種關鍵技術,其大小代表計劃數量多寡。虛線泡泡代表上位技術,包含了實心泡泡(如,決策支援系統包含了決策樹這項技術),縱軸無特殊意涵。

圖 2的泡泡散佈圖,可以觀察出我國歷年來在反向傳遞網路、模糊類神經網路上的投入仍為大宗;小波理論逐年成長但在近四年來卻無發展能量,Hopfield網路的研究量也是漸漸降低,而貝式網路則是在90年投入後就保有穩定的研究能量。

圖 2類神經網路的泡泡型散佈圖,橫軸為時段的區分,共四個時段:89年以前、90-94年、95-99年以及100-104年,顯示每個泡泡皆代表一種關鍵技術,其大小代表計劃數量多寡。縱軸無特殊意涵。

結論與政策建議

根據我國預測分析之研究能量分析概況,觀測出自80年代以來,在資料庫、資料探勘、機器學習、決策支援系統及專家系統,學術研究單位便有能量投入,而近八年來投入概況著重於類神經網路、模糊理論以及資料探勘等,在將大量資料進行篩選等的關鍵技術上建立良好的根基,相信此基礎對於「生產力4.0」的規劃中,欲達成感測器的智慧化、自動化管理的判斷系統、巨量分析的決策分析的目標鋪出一條紮實的道路,而對於未來產業要能進行現場模擬、改良研發甚至是自動決策判斷,更需要於專家系統或決策分析系統等大量投入學研能量,方能達成智慧、自動化的產業升級。我們亦期許我國學研能量分析之泡泡散佈圖,可以幫助在某特定技術下有更仔細的了解,於科技政策規劃時能輔以判斷資金及人力的投入,在產學合作時亦可從中找到合適的人選。

參考文獻

  1. 使用”預測分析、專家系統、預測系統、模糊集合、決策支援系統、B. I.、商業智慧、OEE、PHM、類神經網路”等相關名詞進行計畫篩選。
  2. 國研院科政中心. (2015). 政府研究資訊系統 GRB. Retrieved November 10, 2015, from https://www.grb.gov.tw/
  3. 科技會報辦公室. (2015). 2015年行政院生產力4.0科技發展策略會議-6月4日新聞稿 [text/html]. Retrieved November 10, 2015, from http://www.bost.ey.gov.tw/News_Content.aspx?n=5331137415276DD6&s=3D4E1C3925B35795
  4. 經濟部工業局. (2015). 生產力4.0產業與技術發展策略之製造業生產力推動策略.
  5. 經濟部技術處、科技部前瞻司、農委會科技處. (2015). 生產力4.0核心技術研發策略.
  6. 郝甡. (1994). 發展科技,政策為先. 遠見雜誌, (94).