探索病歷表現型– 發展醫療大數據中的疾病發展歷程探勘方法與模組

補助單位

科技部

執行期間

2018/02/01 - 2023/01/31

計畫摘要

醫療大數據分析為加速臨床研究進展的重要技術之一,在病歷電子化後,疾病發生前、中、後的醫療照護數據已完整記錄在電子病歷中,其中可能隱含未知的疾病發展歷程,可用於醫療照護決策支援。然而,因醫療大數據的異質性與分散性等特色,資料前處理常為分析研究的瓶頸,更重要的是,我們需要一演算法與易用的分析軟體來協助探索基於病歷所記載的疾病發展歷程,協助研究人員從醫療大數據中探勘有用的知識。

因此,本計畫提出『病歷表現型』的概念,代表存儲在電子病歷中的疾病演進歷程,透過標準化的醫療大數據處理方式,擷取出其中有代表性的資訊,並應用機器學習與統計技術,探索其中所隱含的病歷表現型。本計劃預計使用R語言開發醫療大數據標準化整合的模組與開源套件,建立可將醫學大數據轉換為標準編碼並依其臨床意義分群分類的資料處理與整合流程和工具,完成醫療大數據前處理後,建立監督式分組病歷表現型探勘演算法以及非監督式疾病子類別探勘演算法,在醫療大數據中找到特殊的病歷表現型,並開發相對應的病歷表現型探勘分析模組與開源工具,最後建立基於網路的病歷表現型知識共享平台,輔助研究成果呈現與推廣,並期盼將過往多由醫療專業角度推動醫療大數據分析的方向反轉,發展數據導向的健康照護與臨床研究模式。