《AI》MIT：以自動模型建構的「健康知識圖」，需要微調以適用於特定疾病

日期 : 2020/7/10 作者 : 葉懷璘(生技醫療第一站) 人工智慧、人工智能、 AI

臨床醫生或專家，常會根據臨床診斷，繪製出所謂的「健康知識圖 (health knowledge graph)」，可以明白顯示症狀與疾病之間的關聯，以幫助臨床診斷。不過，這通常是一個耗時費力的工程。

2017年時，由紐約大學和 MIT 引領的研究團隊，嘗試從 273,174 名、含蓋近200 種疾病、共 770 多種症狀的患者的病歷數據庫中提取資料，以三種機率模型：「邏輯回歸 (Logistic regression)」、「樸素貝葉斯分類器 (naïve Bayes classifier)」以及「使用noisy OR gates 的貝葉斯網絡 (Bayesian network using noisy OR gates)」，自動建構健康知識圖，並評估出以「noisy OR」模型建構出的精準度最高。

但 MIT 最近針對上述這個成果，做了更進一步的分析。他們分析了這三種模型是如何使用電子病歷數據來「自動學習」疾病-症狀間之關聯，並且，探討這些圖表在不同疾病和患者族群中的適用性。結果發現，對於「患者中年紀或性別有極端偏頗」 [即：患者中有很高比例是年紀很高 (超過 85歲)、很低，或多數是男性或女性] 的疾病，這些模型產生的健康知識圖的效果就會特別差，也就是，很難將特定疾病與特定症狀關聯起來。而且，不同的資料庫建立方式，也會影響模型的準確度。不過如果能針對特定的疾病，選擇正確的模型類型、並選擇以適當的方式建立資料庫，就可以改善性能。

健康知識圖可以協助了解疾病與症狀之間的關聯，但還無法從症狀直接給出疾病的判斷。研究人員希望，最終，他們可以建立起強大的預測模型，利用產生的各種醫學知識圖表，廣泛應用於臨床環境中，並協助臨床醫生或機器進行學習。

資料來源：MIT、Rotmensch M, Halpern Y, Tlimat A, Horng S, Sontag D. (2017) Learning a Health Knowledge Graph from Electronic Medical Records. Sci Rep. 7(1):5994. doi: 10.1038/s41598-017-05778-z.

引領趨勢