《AI》MIT:以自動模型建構的「健康知識圖」,需要微調以適用於特定疾病

臨床醫生或專家,常會根據臨床診斷,繪製出所謂的「健康知識圖 (health knowledge graph)」,可以明白顯示症狀與疾病之間的關聯,以幫助臨床診斷。不過,這通常是一個耗時費力的工程。

2017年時,由紐約大學和 MIT 引領的研究團隊,嘗試從 273,174 名、含蓋近200 種疾病、共 770 多種症狀的患者的病歷數據庫中提取資料,以三種機率模型:「邏輯回歸 (Logistic regression)」、「樸素貝葉斯分類器 (naïve Bayes classifier)」以及「使用noisy OR gates 的貝葉斯網絡 (Bayesian network using noisy OR gates)」,自動建構健康知識圖,並評估出以「noisy OR」模型建構出的精準度最高。

但 MIT 最近針對上述這個成果,做了更進一步的分析。他們分析了這三種模型是如何使用電子病歷數據來「自動學習」疾病-症狀間之關聯,並且,探討這些圖表在不同疾病和患者族群中的適用性。結果發現,對於「患者中年紀或性別有極端偏頗」 [即:患者中有很高比例是年紀很高 (超過 85歲)、很低,或多數是男性或女性] 的疾病,這些模型產生的健康知識圖的效果就會特別差,也就是,很難將特定疾病與特定症狀關聯起來。而且,不同的資料庫建立方式,也會影響模型的準確度。不過如果能針對特定的疾病,選擇正確的模型類型、並選擇以適當的方式建立資料庫,就可以改善性能。

健康知識圖可以協助了解疾病與症狀之間的關聯,但還無法從症狀直接給出疾病的判斷。研究人員希望,最終,他們可以建立起強大的預測模型,利用產生的各種醫學知識圖表,廣泛應用於臨床環境中,並協助臨床醫生或機器進行學習。

資料來源:MIT、Rotmensch M, Halpern Y, Tlimat A, Horng S, Sontag D. (2017) Learning a Health Knowledge Graph from Electronic Medical Records. Sci Rep. 7(1):5994. doi: 10.1038/s41598-017-05778-z.

 

喜歡這篇文章嗎?立即分享

你可能感興趣的文章