機器學習在檢驗醫(yī)學應用的現(xiàn)狀與思考
更新時間:2022/12/28 16:15:03 瀏覽次數(shù):14452
文章來源:中華檢驗醫(yī)學雜志, 2022,45(12) : 1197-1200
作者:沈立松 曾俊祥
摘要
近年來機器學習成為各研究領域的熱點,利用機器學習可以實現(xiàn)由數(shù)據(jù)驅動向知識發(fā)現(xiàn)的轉化,是今后實驗室智能化的重要發(fā)展方向。機器學習在檢驗醫(yī)學領域的應用目前已顯示出了巨大潛力,但存在許多問題及挑戰(zhàn)。推進機器學習技術的臨床轉化,實現(xiàn)在醫(yī)學實驗室的實用化、產(chǎn)業(yè)化,早日實現(xiàn)輔助臨床決策的目標,是我們共同努力的方向。
我國檢驗醫(yī)學近年來飛速發(fā)展,已經(jīng)成為臨床醫(yī)療體系中不可或缺的部分。醫(yī)學檢驗實驗室也飛速發(fā)展至當今現(xiàn)代化、自動化、集成化的實驗室[1, 2]。日常工作產(chǎn)生的各類檢驗,數(shù)據(jù)不僅體量巨大、類型繁多,還有特征高維和冗余等特點[3]。但檢驗數(shù)據(jù)本身并不產(chǎn)生價值,如何分析和利用使其在疾病的診斷、分型、療效評價和預后預測發(fā)揮臨床價值才是關鍵[1,4]。在此背景下,利用機器學習(machine learning,ML)實現(xiàn)由數(shù)據(jù)驅動向知識發(fā)現(xiàn)轉化的技術路徑逐漸成為研究熱點。
近年來美國食品藥品監(jiān)督管理局已批準了數(shù)十個基于人工智能醫(yī)療輔助設備[5],這代表著以ML為載體的醫(yī)療產(chǎn)品向臨床轉化邁出了重要一步。但迄今為止,此類產(chǎn)品都聚焦在腫瘤、放射及病理領域,在臨床實驗室中的應用還比較有限,相關研究也大多仍停留在初始階段,較其他領域還存在較大差距[6]。
基于此,本期刊策劃機器學習?,帶來國內相關最新研究和報道,讓讀者了解ML的基本概念、方法,以及體會國內學者如何利用ML的方法在檢驗醫(yī)學領域進行實踐。希望以此加強在檢驗醫(yī)學領域中ML的研究和應用,共同推進ML技術的臨床轉化,早日實現(xiàn)輔助臨床決策的目標。
一、機器學習在檢驗醫(yī)學的應用現(xiàn)狀
根據(jù)ML的訓練任務,可大致將ML分為三大類,即有監(jiān)督學習、無監(jiān)督學習和強化學習。
(一)有監(jiān)督學習在檢驗醫(yī)學的應用
有監(jiān)督學習是指從有標簽的訓練數(shù)據(jù)中推導出預測函數(shù)?珊唵卫斫鉃椋航o定數(shù)據(jù),預測標簽。典型算法包括:K最近鄰、支持向量機、決策樹和隨機森林、梯度提升機、神經(jīng)網(wǎng)絡等。相對于傳統(tǒng)的統(tǒng)計學分析方法(如線性回歸等),此類方法對數(shù)據(jù)分布無線性要求,其自動發(fā)現(xiàn)并利用相關因素之間的交互效應及非線性關系,通過大量隨機選擇樣本的方法平衡了樣本誤差的影響,由此產(chǎn)生的模型相比于僅以單個測試樣本進行擬合的線性回歸模型的結果更為可靠。由于檢驗參數(shù)絕大部分都為結構性數(shù)據(jù),故大多數(shù)研究使用的都是有監(jiān)督的ML方法。
1.有監(jiān)督學習在診斷模型構建的應用:此類型可以參考本期刊登的《基于機器學習技術利用常規(guī)檢驗數(shù)據(jù)建立肺結核鑒別診斷方法》[7],作者通過回顧性分析,比較了支持向量機、隨機森林、K最近鄰、邏輯回歸這4種機器學習算法在挖掘肺結核患者的常規(guī)檢驗數(shù)據(jù)構建模型的診斷效能,發(fā)現(xiàn)隨機森林算法性能最佳,根據(jù)模型特征重要性排序,選擇37個非特異性檢驗項目構成肺結核鑒別診斷模型。由于肺結核初診患者往往在基層醫(yī)療衛(wèi)生機構,而很多基層機構醫(yī)療水平相對落后,缺少肺結核檢驗技術,常造成疾病誤診和漏診。本研究以最終診斷作為標簽,利用多種有監(jiān)督學習ML算法,通過常規(guī)檢驗指標的挖掘建立一種簡單、有效和快速的肺結核鑒別診斷模型,具有較強的臨床實用性,也從側面展現(xiàn)了有監(jiān)督學習在疾病診斷中的應用前景。
2.有監(jiān)督學習在風險評估模型構建的應用:檢驗結果往往是構成臨床疾病預后風險評估模型的重要參數(shù)[8]。ML通過對檢驗指標的深度挖掘,與患者的臨床表型、個人史等整合建立風險預測模型,進行并發(fā)癥的預測,提供有針對性的風險評估和治療建議,目前已有主要依賴檢驗指標建立關于2型糖尿。9]、原發(fā)性肝癌[10]、急性心梗[11]等疾病風險模型的多項研究報道。
3.有監(jiān)督學習在可解釋性檢驗報告的應用:本期刊登《人工智能在檢驗醫(yī)學領域的應用和發(fā)展》[12]一文指出了在可解釋性檢驗報告的核心:即賦予傳統(tǒng)檢驗報告單除了數(shù)據(jù)和箭頭或+/-以外更多的信息,如檢驗項目臨床意義標注、異常結果綜合分析解釋、疾病和/或潛在風險提示、多種疾病危險度排序加注釋。同時介紹了以胡長愛等[13]研究作為該方向的代表,該團隊通過AdaBoost法同時對7種泌尿系統(tǒng)疾病進行預測建模,可以區(qū)分尿液報告的異常程度,最后通過模型可以預測可能的疾病相似度,同時匹配出個性化的診療建議。這很好地體現(xiàn)了檢驗報告從單純數(shù)據(jù)模式向輔助臨床診斷方向發(fā)展這一趨勢?梢姡贛L在可解釋性檢驗報告的臨床應用中,更為重要的是它帶來了一種全新的檢驗報告解讀方式。
(二)無監(jiān)督學習在檢驗醫(yī)學的應用
無監(jiān)督學習,即從無標簽的訓練數(shù)據(jù)中推斷結論。這種方式可以探索性數(shù)據(jù)分析階段用于發(fā)現(xiàn)隱藏的模式或者對數(shù)據(jù)進行分組,也可簡單理解為:給定數(shù)據(jù),尋找隱藏的結構。典型算法包括:k均值聚類、分層聚類算法,最大期望算法,主成分分析等。
1.無監(jiān)督學習在質譜數(shù)據(jù)分析的應用:基質輔助激光解吸電離飛行時間質譜目前通常在大多數(shù)臨床實驗室中用作微生物菌種的分類鑒定及耐藥性檢測。質譜數(shù)據(jù)本身具有高維性特征,但目前臨床結果分析僅依賴少量的特征,如質荷比和峰高等,大量的質譜信息實質上并沒有利用到,因此對于發(fā)育密切相關的物種,分辨率會下降到屬水平。有學者[14]通過k均值聚類和分層聚類算法,從基質輔助激光解吸電離飛行時間質譜數(shù)據(jù)中對未知布魯菌屬(無標簽)進行訓練,實現(xiàn)了對44個布魯菌屬精確分類,從而實現(xiàn)高度準確的細菌物種識別以實現(xiàn)最佳物種識別。隨著質譜技術的發(fā)展普及,臨床應用面也越來越廣,使用無監(jiān)督學習的方法對質譜數(shù)據(jù)進行處理及可視化,表現(xiàn)了較好的效果,值得借鑒和參考。
2. 無監(jiān)督學習在檢驗結果自動審核中的應用:檢驗報告自動審核是現(xiàn)代醫(yī)學實驗室自動化發(fā)展的重要方向。本期刊登的《機器學習在檢驗醫(yī)學中的應用進展與挑戰(zhàn)》[15]一文,指出自動審核的本質在于通過將專家在報告審核中的應用的臨床關聯(lián)分析思路、判斷依據(jù)等信息轉化成統(tǒng)一的邏輯語言這一核心要素。同時,作者分別列舉了國內外兩項[16, 17]非常有代表性的研究進行介紹,這兩項研究均利用無監(jiān)督學習(人工神經(jīng)網(wǎng)絡和自編碼機算法),嘗試完全排除任何人為干預、無須標注數(shù)據(jù),僅靠原始臨床檢驗結果建立自動審核判斷機制。為日后檢驗報告自動審核系統(tǒng)提供了一種新的思路和方法借鑒。
(三)強化學習(reinforcement learning,RL)在檢驗醫(yī)學的應用
RL是ML的一個領域。它關注的是如何在一個環(huán)境中采取行動以便最大化某種累積的回報?衫斫鉃椋航o定數(shù)據(jù),學習如何最優(yōu)解,以求最大化長期收益。算法包括:Q-learning算法、有限狀態(tài)機等。
1.RL在檢驗項目整合優(yōu)化中的應用:隨著檢測技術日新月異,各種生物學標志物層出不窮,實質上指標間可能存在功能交叉重疊的情況,重復檢測不僅不能使患者獲益還造成不必要的醫(yī)療浪費,對檢測項目進行評價與合理應用,是檢驗醫(yī)學研究的最重要任務之一[18]。
RL是假設系統(tǒng)與環(huán)境的互動是基于馬爾科夫決策過程,在互動中學習最優(yōu)行為策略,往往將其應用于求最優(yōu)解的研究中。如Cheng等[19]研究了在急診重癥監(jiān)護病房患者如何進行實驗室檢測項目開單的最佳方案,其利用了一種叫做多輸出高斯進程的強化學習方法,在保證不影響重癥監(jiān)護病房患者臨床決策的前提下,計算了檢驗項目對兩種致死率較高的病種——膿毒血癥及急性腎衰竭患者的相關獲益及風險之間存在固有的權衡,并對特定時間給予特定的檢測提出建議。如此可以在保證治療效果的情況下降低實驗室檢測的頻率,最終達到減少患者醫(yī)療開支的目的。
2. RL在實驗室流程優(yōu)化管理的應用:利用RL可以整合調配實驗室資源配置,提高整個實驗室內部的流程效率,優(yōu)化以最大限度地調度檢驗分析能力[3]。在標本采集階段可以實現(xiàn)全自動備管、叫號、采血,引導患者分流,縮短排隊時間,提高患者滿意率;標本運輸階段可以讓標本在流轉作業(yè)過程中形成便捷有效的分撥模式,實現(xiàn)物流信息的可視化,甄別其中的冗余環(huán)節(jié),提升標本流轉效率[6];利用患者數(shù)據(jù)的移動均值方法來對實驗室誤差進行質量控制可以提高實驗室檢驗結果的準確性和整體質量水平[20, 21]。
二、機器學習在檢驗醫(yī)學應用存在的問題及對策
(一)有監(jiān)督學習可重復及過擬合問題
諸多研究建立的ML模型往往在訓練集上可以獲得較為理想的結果,但應用于真實臨床世界時,往往模型不能可重復或者出現(xiàn)準確性嚴重下降的情況。其主要原由就在于訓練集是經(jīng)過篩選的、標注完整的樣本,而真實臨床世界中則情況復雜得多,存在著數(shù)據(jù)缺失或者出現(xiàn)大量訓練集中沒有出現(xiàn)的例外情況。解決的辦法就是提高訓練集數(shù)量,增加模型的泛化能力,但同時也會伴隨新的挑戰(zhàn),即海量數(shù)據(jù)的標注需要大量的時間成本及人力成本。
(二)數(shù)據(jù)的質量問題
在醫(yī)院內部信息系統(tǒng)中,檢驗實驗室管理系統(tǒng)無法與門診系統(tǒng)、住院電子病歷系統(tǒng)進行有效地關聯(lián),數(shù)據(jù)結構相對孤立,因此在獲取臨床信息的時候可能存在不規(guī)范、統(tǒng)計口徑隨意化和、信息缺失的情況。另外,疾病是以不確定的方式隨著時間的推移而進展和變化的,同一患者處于不同疾病階段的實驗室檢測結果可能截然不同。然而,現(xiàn)有的ML模型,都假設基于靜態(tài)矢量的輸入,無法以自然的方式處理時間因素。因此,設計建設可有效關聯(lián)各醫(yī)學信息系統(tǒng),并能夠處理序慣性醫(yī)療數(shù)據(jù)是解決的方法之一。
(三)模型的可解釋性問題
盡管ML模型在相當多的應用領域都取得了成功,但它們通常被視為“黑匣子”,無法給出具體規(guī)則和邏輯,讓研究者無法理解、解釋和信任預測結果。一個預測表現(xiàn)接近完美、卻屬于“黑匣子”的ML模型,可能會誤導醫(yī)療決策招致系統(tǒng)性風險,一方面,這在一定程度上影響了模型在臨床的應用前景。另一方面,若不能理解模型運轉原理,也就無從對模型進一步進行修改、優(yōu)化。本期專題中刊出的《機器學習在檢驗醫(yī)學中的應用進展與挑戰(zhàn)》《人工智能在檢驗醫(yī)學領域的應用和發(fā)展》等[20, 21]2篇文章均指出了這個問題,因此對ML模型進行解釋、可視化,是實現(xiàn)臨床轉化的關鍵一步。近年來提出的SHAP(Shapley additive explanations)是解決模型可解釋性的一種方法[22],該模型來源于經(jīng)濟學家Lloyd Shapley提出的博弈論概念,隨后被開發(fā)為一個“模型解釋”工具,用于解釋任何ML模型的輸出。SHAP最大的優(yōu)勢是能反映出每一份樣本中某個特征的影響力,是正影響還是負影響,如此便間接實現(xiàn)了對模型內部參數(shù)及規(guī)則的可視化,或許這是解決模型可解釋性的方法之一。
三、結語
隨著醫(yī)學實驗室不斷地自動化、數(shù)字化、信息化,檢驗“大數(shù)據(jù)”這一理念已深入人心。面對這一寶庫,運用ML或者深度學習的方法進行探索目前在檢驗醫(yī)學領域尚處于起步階段,特別在當前更為熱門的深度學習領域更是少之又少。從2021年美國食品藥品監(jiān)督管理局首次公布的已獲得許可的人工智能相關醫(yī)療器械名單情況來看,90%以上的產(chǎn)品聚焦在放射影像、心血管、血液3類方向。而近期國家工信部與國家藥監(jiān)局共同組織的“人工智能醫(yī)療器械創(chuàng)新任務揭榜工作”公布的結果,檢驗醫(yī)學領域的項目較少。智能輔助診斷產(chǎn)品強調需要擁有核心技術知識產(chǎn)權,檢驗醫(yī)學專業(yè)無論是相關研究、專利還是成果轉化都較其他專業(yè)有較大差距。
本期刊出的ML在檢驗醫(yī)學的應用和研究進展的相關內容,特邀及篩選專家組稿,相對全面地闡述了ML在檢驗醫(yī)學的應用進展及面對的若干挑戰(zhàn),并針對所面對的若干共性問題提出了比較有探索性的解決意見。希望以此可以加強在檢驗醫(yī)學領域中ML的研究和應用,共同推進ML技術的臨床轉化,實現(xiàn)在醫(yī)學實驗室的實用化、產(chǎn)業(yè)化,早日實現(xiàn)輔助臨床決策的目標。