我們先來設想如下場景,某天,57歲的王大爺發(fā)現他的肩膀上起了皮疹,也不疼,于是就沒有當回事。數月后,這塊皮疹越來越不舒服,于是在王大娘的催促聲中到了醫(yī)院,醫(yī)生診斷為脂溢性角化癥。又過了幾個月,在年度體檢中,醫(yī)生告訴他肩膀上有發(fā)黑的斑點,建議去醫(yī)院做檢查。皮膚科醫(yī)生在對活檢樣本分析后認為是非癌性色素沉著病變,之后,換了一家醫(yī)院掛了專家號再次分析樣本,診斷為侵襲性黑色素瘤。于是王大爺開始接受腫瘤科的全身化療,這時,他的一位在醫(yī)院工作的朋友建議他可以嘗試免疫療法。
類似王大爺的經歷其實并不少見,很多病往往一發(fā)現就是中晚期,如果在早期就有醫(yī)療介入,對于患者的治療和康復都是大有裨益的。但是且不說患者很難對疾病早期的端倪有所察覺,即便到了醫(yī)院,在有限的醫(yī)療資源下也不會讓每個患者都接受專家團隊的會診,往往是醫(yī)生憑個人經驗給予患者診斷、確定治療方式和開取自己熟悉的藥物,有時未必是最佳治療。
想要改善這一局面,就要對每位患者進行精準醫(yī)療,需要收集、處理并詳細分析他們的病歷和數據,而這正是人工智能(AI)技術最擅長的。自從AI進入醫(yī)療健康和生物制藥領域以來,圍繞相關話題的預測和應用一直影響廣泛。早在50年前,《華爾街日報》在一篇文章中就大膽預測未來計算機將在特定情況下替代醫(yī)生完成患者診治,但直到今天,除了個別AI輔助診斷已經落地,醫(yī)療的核心驅動仍然是由我們人類主導的。AI的應用似乎正處在技術成熟度曲線(hype cycle)下滑的一段中,我們見證了很多數據和承諾,但似乎離商業(yè)模式成功的明確性還有很長的路要走。
技術成熟度曲線(hype cycle)(圖片源自維基百科)
即便如此,目前一些早期模型的應用以及相關政策、監(jiān)管和經濟的鼓勵,都可以看作是對醫(yī)藥領域AI“落地”的樂觀態(tài)度。利用AI技術將所有臨床醫(yī)生的決策經驗和數十億患者的病歷集于一體,每一次診斷和治療都將是基于患者的個性化信息,結合無數相同病例的經驗給出的最佳治療,這是AI與現代醫(yī)學融合的動力。
AI和醫(yī)學的融合
首先要明確的是,AI是一個大的概念,它包括了多種算法,如專家系統(tǒng)、機器學習(MachineLearning)、深度學習(Deep Learning)等,目的是創(chuàng)建能夠解讀外部信息、學習并適應以實現特定目標的模型。深度學習是機器學習的一個子集,受大腦如何通過神經網絡工作的啟發(fā),可以梳理出非線性的特征,在圖像分析中是非常有效的。AI可以很強大,但它不是魔法,即使是最復雜的神經網絡本質上仍然是回歸模型,受限于你所訓練的內容。你可以用一百萬個貓的圖像建立一個很棒的貓識別系統(tǒng),但是當你給它一個大象的圖像時,這個系統(tǒng)就沒用了。
人工智能、機器學習和深度學習的關系(圖片源自LifeSciVC網站)
AI的早期年代,醫(yī)學曾被認為是AI最有前途的應用領域之一,當時的研究人員提出并開發(fā)了許多臨床決策支持系統(tǒng),這類基于規(guī)則的系統(tǒng)在20世紀70年代取得了許多成功,并被證明可以分析心電圖、診斷疾病、選擇適當療法以及幫助醫(yī)生對復雜的患者病例下診斷等。但是基于規(guī)則的系統(tǒng)構建成本太高了,所基于的規(guī)則也必須具有邏輯性和可解釋性,而醫(yī)學領域的規(guī)則過于廣泛復雜,很難簡單提取出相關信息。
未來AI與醫(yī)療健康的融合貫徹“從生到死”的過程(圖片源自參考文章3)
近年以來AI研究多利用機器學習方法,在給定情況下,各種示例以輸入(特性)和輸出(標簽)的形式提供,不再拘泥于規(guī)則,又稱為監(jiān)督機器學習。打個比方,讓模型學習腫瘤醫(yī)生的數字化病理片,通過像素分解完成對腫瘤陰影的識別,也就是將特征轉換為標簽,建立觀察學習的算法。然后不斷讓算法學習從特征到標簽的映射,以創(chuàng)建一個模型來概括信息,最后使該模型能夠從新輸入中提取特征,幫助醫(yī)生閱片。機器學習模型非常適合從現代臨床產生的復雜異構數據中學習,包括醫(yī)療記錄、醫(yī)學圖像、傳感器的連續(xù)監(jiān)測數據和基因組數據等,幫助做出醫(yī)學預測,而人類醫(yī)生在整個職業(yè)生涯都很難接觸到這么多的數據。
深度神經網絡及以咖啡杯為例的卷積神經網絡不同卷積層的闡釋(圖片源自參考文章3和4)
AI在醫(yī)療健康系統(tǒng)中的應用
基于圖像的診斷
許多醫(yī)學專業(yè)如放射科、眼科、皮膚科和病理研究,都依賴于圖像分析。2018年,FDA批準了首個利用心臟MRI(核磁共振成像)圖像診斷心血管疾病的深度學習系統(tǒng),可以幫助醫(yī)生診斷心臟問題,它使用了一個自教的人工神經網絡,迄今為止已經學習了1000個案例,并將繼續(xù)提高其數據量。這個系統(tǒng)平均只需15秒就能得到分析結果,而一個專業(yè)醫(yī)生通常要花30分鐘到一個小時。
首個利用心臟MRI圖像診斷心血管疾病的深度學習系統(tǒng)(圖片源自參考文章4)
最近,針對129,450張臨床圖像訓練的卷積神經網絡在診斷皮膚惡性腫瘤方面也達到了皮膚科醫(yī)生的水平。通過和21名皮膚科醫(yī)生比較對一組皮膚圖像的預測和評估,深度學習算法的表現優(yōu)于一般皮膚科醫(yī)生。雖然深度學習模型的培訓階段可能更昂貴,但最終的診斷模型可以部署在移動設備上,這可以提高全球專家級別皮膚病變篩查的可操作性。
深度學習模型對皮膚腫瘤分類的示意圖(圖片源自參考文章5)
基因組分析
高通量測序方法為基因組研究提供了億兆級的原始數據。對這些數據的準確臨床解讀是理解個體差異的關鍵,并為精準醫(yī)療鋪平了道路。與傳統(tǒng)的邏輯回歸和支持向量機方法相比,深度神經網絡能夠更好地對致病基因變異進行注釋,識別非編碼DNA的功能。已經有基于神經網絡的方法將基因組變異轉換為圖像分類任務,其性能優(yōu)于廣泛使用的基因組分析工具包。這種計算方法可以用于診斷帶有遺傳成分的復雜疾病,比如癌癥。
發(fā)現生物標志物
生物標志物的發(fā)現依賴于識別之前未發(fā)現的測量值和表型之間的相關性。組學技術使得對海量基因、蛋白的和遺傳性畸變的高通量測試成為可能,但是,想要人工分析從組學方法中收集大量數據幾乎是不可能的。機器學習方法可以識別與疾病狀態(tài)和疾病亞型相關的分子模式,解釋測量值之間的高級交互作用,并獲得組學特征來預測疾病表型。很多從機器學習中獲得的生物標記物表現都優(yōu)于傳統(tǒng)方法的選擇,其中一些已經獲得FDA的批準,可以用于指導常規(guī)治療。
預測臨床結果和患者監(jiān)測
EHRs(電子病歷)系統(tǒng)的日益普及,不僅加快了大規(guī)模臨床數據的收集,而且使人工智能系統(tǒng)更順暢地集成到臨床工作流程中。Bayesian網絡可以通過急診科的EHRs預測死亡率、再入院率和住院時間。醫(yī)療保險理賠數據可以用來預測老年患者的死亡率,EHRs中的患者屬性可以用來對化療反應不同的癌癥患者進行分類,可以識別接受胸部器官移植患者預后的臨床預測因子等。這些研究為患者預后提供了大量可靠的臨床預測指標,可用于指導患者及其醫(yī)生選擇個性化治療策略。
傳統(tǒng)臨床、傳統(tǒng)決策支持系統(tǒng)、綜合決策支持系統(tǒng)和AI全自動臨床系統(tǒng)的流程對比(圖片源自參考文章2)
在重癥監(jiān)護病房、手術室、急診室和心臟病房,病人的監(jiān)測至關重要,臨床決策的及時性可以用秒來衡量。在這些高靈敏度的環(huán)境中,常規(guī)的監(jiān)測設備會產生大量的數據,從而為人工智能輔助報警系統(tǒng)提供了巨大的機會。群體統(tǒng)計學、實驗室結果和生命體征可用于預測心臟驟停、轉入重癥監(jiān)護室或死亡。通過深度學習算法,可以更好地利用原始的患者監(jiān)測數據,使臨床預測更準確,決策更及時。
利用可穿戴設備做健康監(jiān)測
現代可穿戴設備記錄了大量的生物醫(yī)學信號,包括心率、聲音和運動等。這些記錄可用于檢測疾病和推斷健康狀況。例如,通過可穿戴設備記錄的心率和皮膚溫度數據,可以及早發(fā)現傳染病和炎癥反應的跡象。在可穿戴設備中加入光體積描記傳感器,可以監(jiān)測心血管疾病、肺部疾病、貧血和睡眠呼吸暫停。另外,由于醫(yī)療資源有限,醫(yī)生不可能與所有需要治療的病人單獨互動,如果讓患者佩戴傳感器或活動跟蹤設備,然后通過發(fā)送他們在智能手機上拍攝的照片或傳輸數據來獲得診斷,可以避免很多不必要的緊急護理。
(圖片源自網絡)
AI在醫(yī)療領域的應用還遠不止于此,機器學習模型可以收集很多患者的健康軌跡模式,幫助醫(yī)生預測患者預后發(fā)展。機器學習還可用于根據臨床文獻自動選擇符合隨機對照試驗入組條件的患者,或是判斷出哪些高風險患者或亞群體可能受益于正在研究的新療法。目前已經有AI自主手術出現。隨著預編程、圖像引導和遠程手術機器人的不斷發(fā)展,更多的機器人輔助或自動化干預方法有望被納入外科手術。在可預見的未來,AI系統(tǒng)可以增強臨床決策能力,促進疾病診斷。
面臨的挑戰(zhàn)
盡管AI有望給醫(yī)療實踐帶來革命性的變革,但仍將面臨許多技術挑戰(zhàn)。構建機器學習模型的核心挑戰(zhàn)是搭建一個具有代表性的、多樣化、高質量的數據庫,因此必須謹慎地編寫能夠代表目標患者群體的數據。來自不同醫(yī)療環(huán)境的數據可能包含各種類型的偏差和噪聲,這可能導致針對一家醫(yī)院的數據進行訓練的模型無法推廣到另一家醫(yī)院。盡量避免較小的數據體量,當擁有足夠大的數據量時,機器學習模型往往表現最佳,可以更成功地訓練模型。
隨著臨床AI系統(tǒng)的成熟,其臨床應用和部署將不可避免地增加,這將導致新的社會、經濟和法律問題。一個關鍵問題就是做好隱私和監(jiān)管需求,與大量數據獲取使用之間的平衡。為了應對這些挑戰(zhàn),AI研究人員和醫(yī)療從業(yè)者需要共同努力,優(yōu)先考慮并開發(fā)滿足關鍵臨床需求的應用程序。在引入新的AI應用系統(tǒng)時,必須確定正確的框架,先進行前瞻性臨床試驗,這將需要多學科和多部門的合作。
有一種觀點認為隨著醫(yī)療AI的發(fā)展,醫(yī)生將被機器取代,對此我們可以與汽車自動駕駛的發(fā)展相比較。根據美國汽車工程師協(xié)會的定義,“自動駕駛”分為5個級別,其中5級表示在任何情況下都由汽車完全控制,沒有任何人為參與控制汽車。但是普遍的共識是,出于安全顧慮,這種情況永遠不會實現。而由于同樣的原因,醫(yī)學AI不太可能超過3級,即有條件的自動化,人類確實需要對圖像和數據的AI算法進行監(jiān)督,很難想象在照顧病人時完全托付給機器,因為人類的健康太寶貴了。
自動駕駛和醫(yī)學AI之間的類比(圖片源自參考文章3)
我們這個時代的醫(yī)學發(fā)展正處在十字路口,左邊是過去舊的醫(yī)療模式,支出和崗位在不斷增加,但誤診和不恰當的治療、醫(yī)療資源的浪費、工作流程的低效、醫(yī)患難以充分溝通等問題并未得到改善。而右邊是AI與醫(yī)學融合的嶄新之路,是從高分辨率醫(yī)學成像、可穿戴設備的生理指標傳感器、基因組測序和電子醫(yī)療記錄等來源生成的大量數據。
基于大數據的AI未來將從根本上改變醫(yī)療健康的性質,在現有基礎上豐富醫(yī)生和患者之間的關系。也許在不遠的將來,開篇的一幕會是這樣的,王大爺先用智能手機給自己的肩膀拍了一張皮疹的照片,通過App立即發(fā)到電子皮膚科醫(yī)生,很快得到醫(yī)院復查的通知。然后通過醫(yī)療保險系統(tǒng)完成家附近醫(yī)院的預約,該預約將自動與王大爺的日程表進行交叉檢查,確定最合適的時間。在一名經驗豐富的皮膚科醫(yī)生對病變進行活檢后,在計算機輔助下診斷為早期黑色素瘤,盡快由皮膚科醫(yī)生切除,在一個月內王大爺已經在恢復中。
只要腳踏實地的去做,這一幕就不會遙遠。