《AI》Google 的健康聲學表徵人工智慧系統「HeAR」可利用咳嗽聲診斷肺部疾病

日期 : 2024/4/11 作者 : 葉懷璘(生技投資第一站) 數位醫療/AI人工智慧

Google 研究院的一個人工智慧研究小組與尚比亞傳染病研究中心的一對同事合作，開發出了一種命名為「健康聲學表徵」(Health Acoustic Representations, HeAR) 的機器學習系統，目的在根據咳嗽聲診斷肺部疾病。該研究目前以預印本的形式發表在 arXiv。

該系統開發的起源，是因為醫護人員提出，他們在大流行病期間逐漸發現，可透過咳嗽聲判斷出哪些患者感染 COVID-19，因此希望開發出能根據咳嗽聲檢測出各種疾病的系統。

Google 在疾病檢測方面採取了與其他團隊不同的方法。他們沒有使用帶有識別特定疾病註記的錄音來訓練人工智慧系統，而是採用了與創建 ChatGPT 等 LLM 相似的方法。

透過自動化流程，Google 研究人員從公開的 YouTube 影片中提取了超過 3 億個咳嗽、呼吸、清喉嚨和其他人類聲音的短聲音片段，將之轉換為聲音的視覺表示，並稱之為頻譜圖。接著，研究人員屏蔽了頻譜圖的各個部分，以幫助模型學習預測缺失的部分。這類似於 ChatGPT 背後的大型語言模型，在接受無數文字範例的訓練後如何預測句子中的下一個單字。使用這種方法，研究人員創建了所謂的「基礎模型」，可以適用於許多任務。

就 HeAR 而言，研究人員用它來學習檢測肺結核或 COVID-19，並使用標準量表比較了 HeAR 與隨機猜測的準確性，0.5 代表模型的表現不優於隨機預測、1 代表每次都能做出準確預測。HeAR 在 COVID-19 檢測方面的得分為 0.645 和 0.710 (取決於測試的資料集) — 兩者都比在語音資料或一般音訊上訓練的現有模型具有更好的性能。對於檢測結核病，得分則為 0.739。

儘管要開發為產品，還需要進行許多研究工作，但研究人員認為，聲學檢測有朝一日可能會進入醫療系統，成為醫護人員另一種診斷肺部疾病的工具。

延伸閱讀：《AI》FDA核准 AI 輔助診斷 Fibresolve 用於診斷「特發性肺纖維化」，可減少活檢41%

資料來源：Medical Xpress、Nature (doi: 10.1038/d41586-024-00869-0)

國際生醫新聞