【詐病請假注意】AI 可單憑聲線診斷感冒

A+A-
圖片來源:Elnur/Shutterstock

疫情期間,不少醫療集團都提供視像會診服務,但最新 AI 研究更進一步簡化程序 —— AI 單憑聲線便能夠分辨病人是否真感冒,就算對方演技非凡,AI 亦能通過聲學,分辨對方是演戲還是真病。

感冒之所以改變病人聲線,是由於聲帶通常會因此發炎,以致聲帶組織膨脹,改變其聲學特性,使病人只能以較低音頻發出振動,從而產生較低沉的聲音。「經濟學人」報道指,印度蘇拉特國家理工學院(SVNIT Surat)研究團隊,正嘗試分辨感冒與健康聲線的分別。

與樂器相似,人類並不能發出單一頻率聲音,即使是訓練有素的歌手,亦無法發出有如音叉的純音符。人聲總是夾雜著一系列較高音的「泛音」(overtone),假如轉化成音符組合,可得出名為「諧波」(harmonic)的數學模型。其中泛音的頻率是原始音符的數倍,而語音中諧波的振幅,會隨頻率上升而減弱。

電子工程師 Pankaj Warule 領導的研究團隊推斷,感冒可能改變振幅減弱的過程。他們利用了德國 630 人的錄音作為樣本,其中 111 人患有感冒。所有人一律被要求從 1 數到 40、講述過去週末的活動、大聲朗誦伊索寓言「北風和太陽」(The North Wind and the Sun)—— 1949 年以來語音學研究的熱門文本。

研究人員拆解每個人的聲音,識別其中的主導頻率與諧波,再利用機器學習演算法分析諧波的振幅關係,成功分辨出「感冒聲線」與「健康聲線」。有關結果發表於學術期刊 Biomedical Signal Processing and Control,但或許用於機器學習的數據尚且有限,以致正確斷症的比率只約莫 70% 左右。

類似的聲音斷症技術,隨著 AI 技術成熟而變得可能。去年就有科學家成功研究,以聲線診斷柏金遜症;其他科學家亦依循相同方式,研究抑鬱症到頭頸癌的聲音診斷辦法。假如日後有醫療科技公司利用類似理論模型,投資以提高正確斷症比率,繼而開發 AI 聽診服務,想必為醫療產業帶來另一場革命。