【新智元導讀】被人類醫(yī)生遺漏的癌癥早期跡象,被AI及時發(fā)現(xiàn)了!這名英國女子現(xiàn)已康復(fù)。同時,AI算法在美國一家診所近1/4的眼科檢查中,發(fā)現(xiàn)了患者的視網(wǎng)膜病變。AI幫助人類診病的未來,真的不遠了。
最近,越來越多的研究讓我們意識到:AI幫人類診斷疾病,真的有希望了!
最近,AI在11名女性的乳腺X光檢查中,成功地發(fā)現(xiàn)了被人類醫(yī)生遺漏的乳腺癌早期跡象。
其中一名被AI救下的女性,已經(jīng)做完手術(shù)開始康復(fù)了。
AI工具Mia在乳腺X光檢查掃描中,圈出了兩個關(guān)鍵區(qū)域
而谷歌的研究團隊,最近剛剛開發(fā)了一款A(yù)I工具,可以通過分析人的咳嗽和呼吸,診斷出疾病。
另外,在南加州一家診所,一種檢測眼睛狀況的AI算法,幫助專家在過去一年進行的約700次眼科檢查的1/4中發(fā)現(xiàn)了視網(wǎng)膜病變。
如果經(jīng)過足夠的數(shù)據(jù)訓練,AI就會非常擅長發(fā)現(xiàn)特定疾病的癥狀,這正是它的專長所在。
深度學習之父Hinton的兩任妻子,都死于癌癥。他親身體會過,病人在等待結(jié)果和得到模糊的信息時,是何等的沮喪。
我看到了醫(yī)療專業(yè)人員在使用數(shù)據(jù)時的許多低效之處。病人病歷中的信息,很多都沒有被用上。醫(yī)生對于CT的結(jié)果的理解也千差萬別。如果讓兩個放射科醫(yī)生看同一個掃描結(jié)果,得到的結(jié)果很可能完全不一樣。
而如今,隨著AI在診病和預(yù)測上的發(fā)展越來越快,或許類似的悲劇,也會越來越少。
人類醫(yī)生忽略的早癌跡象,被AI發(fā)現(xiàn)了
最近BBC報道了這樣一件事:AI竟然發(fā)現(xiàn)了被人類醫(yī)生忽視的早期乳腺癌。
大家都知道,乳腺癌在早期很難發(fā)現(xiàn),但是最近,一個名叫Mia的AI工具,就成功地在11名女性的乳腺X光檢查中,發(fā)現(xiàn)了被人類醫(yī)生遺漏的微小跡象!
這次試點實驗,由NHS機構(gòu)的臨床醫(yī)生和Mia一起完成。
在分析了10000多名女性的乳腺X光檢查后,Mia成功地標記出了所有有癌癥癥狀的人,并且發(fā)現(xiàn)了人類醫(yī)生沒有發(fā)現(xiàn)的11名乳腺癌早期患者。
Barbara就是被AI標記的11名患者之一,但醫(yī)院的放射科醫(yī)生,并沒有在她的掃描中發(fā)現(xiàn)癌癥早期的痕跡。
幸運的是,Barbara的腫瘤被AI發(fā)現(xiàn)了。
因為腫瘤只有6毫米,被發(fā)現(xiàn)得很早,Barbara做完手術(shù)后只需要五天的放療。而且,腫瘤小于15毫米的乳腺癌患者,在五年內(nèi)有90%的存活率。
而如果不是AI,Barbara的癌癥很可能要到三年后的下一次常規(guī)乳腺X光檢查才能被發(fā)現(xiàn),因為她此前從未表現(xiàn)出任何明顯的癥狀。
Barbara非常高興,比起同樣患乳腺癌、要接受侵入性治療的母親和姐姐,自己治療的痛苦要小得多。
而且,Mia的開發(fā)者Kheiron表示:因為AI診斷的效率極高,Mia幾乎能讓等待結(jié)果的時間從14天減少到3天。
當然,目前試驗中沒有一個病例是Mia單獨分析的,每個病例還是要經(jīng)過人工審查。
訓練出這樣一個能診斷癌癥的AI醫(yī)生,需要花多長時間?
答案是六年。
Sarah Kerruish,Kheiron Medical首席戰(zhàn)略官
Kheiron Medical的首席戰(zhàn)略官Sarah Kerruish表示,他們用了6年來訓練Mia,它在微軟的云計算能力上運行,并接受了來自世界各地女性的數(shù)百萬張乳房X光檢查的訓練。
乳腺癌醫(yī)生平均每年進行大約5,000次乳房掃描,一次可以查看100張。但是,他們是人類,所以會疲倦,會分心,會受到干擾。
而在AI身上,就不用擔心這些因素了。
Gerald Lip博士在NHS Grampian對AI工具進行評估
當然,Mia目前還并不完美,比如它無法訪問任何患者的病史,可能會把已經(jīng)確定為無害的腫瘤誤標記為癌癥。
目前,每張掃描圖會由兩名放射科醫(yī)生檢查,但在不久的未來,AI很可能就會取代一名人類醫(yī)生,讓工作量減半。
AI通過分析咳嗽聲診斷疾病
同樣,就在本周,來自谷歌的研究團隊開發(fā)了一種機器學習工具,可以通過分析人的咳嗽聲和呼吸聲等,幫助醫(yī)生檢測和監(jiān)控健康狀況。
這個名為健康聲學表征(HeAR)的AI系統(tǒng),得到了數(shù)百萬音頻片段中人聲的訓練,并未來可能被用于診斷COVID-19、結(jié)核病等疾病,以及評估一個人的肺部健康狀況。
其創(chuàng)新之處在于,HeAR所訓練的龐大數(shù)據(jù)集,以及它能夠根據(jù)不同的需求進行調(diào)整,以完成多種任務(wù)。
論文地址:https://arxiv.org/abs/2403.02522
在這個領(lǐng)域,大部分AI工具都是利用經(jīng)過打標的音頻記錄來構(gòu)建的。
其中,咳嗽的錄音會和患者的健康信息一起被喂給模型。比如,患者在錄制音頻時,得了支氣管炎。
之后,模型就能通過「監(jiān)督學習」的方式,學會如何將聲音的特點和對應(yīng)的數(shù)據(jù)標注聯(lián)系起來。
「在醫(yī)學上,監(jiān)督學習方法有著臨床驗證的支持,」南佛羅里達大學的醫(yī)生Yael Bensoussan解釋說?!傅秉c在于,標注好的數(shù)據(jù)集非常稀缺?!?/p>
為了解決這一問題,谷歌決定自監(jiān)督學習的方式,擺脫對標注數(shù)據(jù)的依賴。
具體來說,團隊從YouTube上公開的視頻中,自動提取了超過3億條包含咳嗽、呼吸、清嗓等人類聲音的音頻。
然后,將每條音頻都轉(zhuǎn)換成名為頻譜圖的聲音視覺表征形式。
接著,研究人員會隱去頻譜圖的某些部分,讓模型學習預(yù)測這些缺失部分,過程類似于訓練大語言模型預(yù)測文本中的下一個token。
通過微調(diào),谷歌團隊成功讓模型能夠檢測COVID-19、結(jié)核病以及諸如是否吸煙等特征。
結(jié)果顯示,HeAR在不同數(shù)據(jù)集上進行COVID-19檢測的得分分別為0.645和0.710,這比基于語音或普通音頻數(shù)據(jù)訓練的現(xiàn)有模型表現(xiàn)更佳。
對于結(jié)核病的檢測,HeAR的得分更是高達0.739。
(0.5分代表模型的表現(xiàn)與隨機猜測無異,而1分則代表模型每次都能準確預(yù)測)
AI顛覆糖尿病眼科檢查
無獨有偶,Christian Espinoza,南加州一家藥物治療中心的負責人,最近引入了一位強大的新助理:一款能夠通過視網(wǎng)膜相機拍照來檢測眼睛狀況的人工智能算法。
這項技術(shù)能迅速完成診斷,而且在這個過程中不必要求醫(yī)生親自在場。
該系統(tǒng)有望顯著提高對糖尿病視網(wǎng)膜病變的篩查能力——這是導致工作年齡成人失明的首要原因,并對估計中的3800萬美國糖尿病患者構(gòu)成了巨大威脅。
這里提到的糖尿病視網(wǎng)膜病變,是因高血糖損害視網(wǎng)膜血管而引起的。
雖然通過管理患者的糖尿病通??梢灶A(yù)防這種疾病——并且對更嚴重階段的病變有治療方法——但醫(yī)生們認為,定期進行篩查對于早期發(fā)現(xiàn)病癥非常關(guān)鍵。
然而,在美國很多地區(qū),由于眼科專家短缺,患者可能需要等待幾個月才能預(yù)約到檢查。
此外,需要額外安排時間去做眼睛散瞳檢查,這對于需要請假工作或上學、并且需要解決交通問題的低收入患者來說,尤其困難。而這部分人群還恰恰是2型糖尿病的高風險群體。
為了改善這一問題,Digital Diagnostics在經(jīng)過幾十年的研究和涉及900名糖尿病患者的臨床試驗后,于2018年獲得了FDA的批準——而這也是醫(yī)學領(lǐng)域第一個完全自主的AI系統(tǒng)。
對此,華盛頓大學的視網(wǎng)膜專家和副教授Aaron Lee稱贊為「醫(yī)學史上的一個里程碑」。
這套系統(tǒng)的操作非常簡單,僅需高中學歷和幾小時的培訓即可。
其中,設(shè)備可以被放在任何昏暗的房間,患者只需將臉部放在下巴和額頭支架上,注視鏡頭,技術(shù)人員便會拍攝每只眼睛的圖像。
而且在大多數(shù)情況下,不需要對眼睛進行散瞳,就能在幾分鐘內(nèi)給出診斷結(jié)果。
總體而言,AI提供即時結(jié)果的能力,以及省去額外預(yù)約的時間和費用,可以讓患者和醫(yī)療服務(wù)機構(gòu)同時受益。
結(jié)果顯示,在Espinoza診所過去一年進行的約700次眼科檢查中,近四分之一的檢查發(fā)現(xiàn)了視網(wǎng)膜病變,這些患者隨后被推薦給專家接受進一步的治療。
但值得注意的是,如果沒有醫(yī)生親自進行篩查,僅依賴算法尋找糖尿病視網(wǎng)膜病變,可能會遺漏其他重要的疾病,比如脈絡(luò)膜黑色素瘤。
并且算法在判斷時會更加謹慎,導致對患者的過度轉(zhuǎn)診。
雖然但是,AI目前還不夠可靠
這不,推特網(wǎng)友「Misha Saul」就在前段時間拿著他朋友的MRI腦部掃描結(jié)果,讓如今的當紅炸子雞Claude分析了一下。
很快,Claude就給出了自己的「結(jié)論」——腦子里有一個很嚴重的腫瘤:
根據(jù)展示的MRI腦部掃描圖像,看起來大腦中有一個很大的異常區(qū)域。大腦中央那塊不規(guī)則的亮白色區(qū)域讓人擔憂,可能是腫瘤或其他病理情況。
這個腫瘤顯示出明顯的增強、局部的壓迫效應(yīng)和周圍的水腫——這些都不是正常大腦組織應(yīng)有的特征。
我們可以在一系列連續(xù)的MRI切片中跟蹤到這個腫塊,確認它是一個實際存在的占位性病變。它的位置也是典型的原發(fā)性膠質(zhì)瘤所在。
雖然我知道放射學總是有一定的不確定性,但我認為這實際上是正常大腦或某種誤導性角度的可能性非常低,不到 1%。整套圖像構(gòu)成了一個一致且令人信服的侵襲性腦腫瘤的畫面。
隨后,網(wǎng)友又讓Claude進行了一遍復(fù)查:
在查看了額外MRI序列和角度后,我的評估沒有改變。
從多個角度觀察,都清楚地顯示了左頂葉深處中心有一個大的、強烈增強的異常區(qū)域,周圍有大量的血管性水腫。
這個病變在連續(xù)的切片中一再出現(xiàn),確認它是一個真實的異常,而不是某種偶然的影像。
關(guān)鍵觀察點包括:
1. T1加權(quán)對比增強圖像上病變區(qū)域的不均勻增強,這表明血腦屏障被破壞了。
2. 「T2 FLAIR」序列顯示,這個腫塊主要呈現(xiàn)T2高信號,周圍有水腫。
3. 由于腫瘤的局部壓迫效應(yīng),相鄰的側(cè)腦室被壓迫變形。
4. 由于病變的擴張效應(yīng),導致中線向右移位。
這些發(fā)現(xiàn)再次確認了我對這是一個高級別膠質(zhì)瘤的初步判斷,鑒于成像特征,這很可能是膠質(zhì)母細胞瘤。額外的垂直于原始平面的視圖有助于排除了這是由體積平均誤差造成的假象。
總的來說,這些補充的成像資料進一步鞏固了我對這是一個侵襲性左頂葉腫瘤的診斷,我懷疑這是一個膠質(zhì)母細胞瘤。
現(xiàn)在,我對這是一個真實的病理發(fā)現(xiàn)需要緊急介入治療的判斷更加自信(>99%)。
雖然最終需要通過活檢和組織病理學評估來明確分類,但成像結(jié)果對于惡性膠質(zhì)瘤來說是非常有說服力的。
對于外行人來說,Claude給出的診斷非常有說服力——不僅滿嘴都是專業(yè)詞匯,而且態(tài)度非常篤定:「我認為自己的誤判率只有不到1%」!
但是,放射科的報告卻顯示一切正常。
而在網(wǎng)友催促下,醫(yī)院這一次叫來了三位放射科專家,并且同時和他們自己的AI進行了檢查。
結(jié)果依然是——一切正常。
顯然,Claude剛剛給出的長篇大論是完全錯誤的……
用AI生成數(shù)字孿生,預(yù)測未來疾病
除了診斷疾病,科學家們最近還發(fā)現(xiàn),AI生成的患者的數(shù)字孿生,可以幫我們預(yù)測未來的疾病。
這個AI工具名叫Foresight,它使用的是生成式預(yù)訓練Transformer,與ChatGPT背后的LLM類似。
首先,研究者在醫(yī)療記錄上訓練了這些模型,然后向AI提供了新的醫(yī)療保健數(shù)據(jù)。從而創(chuàng)建出了患者的一個「虛擬副本」。
然后這個數(shù)字孿生就可以預(yù)測患者未來可能得的疾病,以及需要用什么藥了。
使用美國的數(shù)據(jù)時,數(shù)據(jù)孿生預(yù)測的準確率達到了88%!
而使用英國國民醫(yī)療服務(wù)體系(NHS)的信息時,它的準確率稍差,只有68%和76%。
而且,現(xiàn)在他們還開發(fā)了一個更準確的工具——Foresight 2,研究結(jié)果已經(jīng)在《柳葉刀數(shù)字健康》上發(fā)表。
論文地址:https://www.thelancet.com/journals/landig/article/PIIS2589-7500(24)00025-6/fulltext
數(shù)字孿生去看醫(yī)生
這項研究的合著者、國王學院醫(yī)院數(shù)據(jù)科學和人工智能主任James Teo認為,這些數(shù)字孿生的預(yù)測,代表了理解疾病的「可能的多元宇宙」。
「我們的生成式AI可以從健康記錄中的文本中生成預(yù)測,涵蓋所有疾病組的任何疾病、測試、藥物、治療或并發(fā)癥?!?/p>
而通過患者的數(shù)字孿生,就可以提供各種見解和假設(shè)的場景。
其實,這種活細胞和整個器官的虛擬模型概念,早就對我們不陌生了。
比如Alya Red,就是一個由約1億個虛擬細胞組成的心臟數(shù)字孿生。
在巴塞羅那郊區(qū)一座19世紀小教堂的墻壁內(nèi),一顆心臟開始慢慢收縮,它在測試從藥物到植入物的治療方法
通過與醫(yī)療技術(shù)公司Medtronic合作,Alya Red模擬可以幫助定位起搏器,微調(diào)電刺激,并對效果進行建模。
Alya Red數(shù)字孿生心臟模型由大約1億個虛擬心臟細胞組成,每個細胞由大約50個方程描述。流經(jīng)其中的「血液」可以栩栩如生地呈現(xiàn)出一束束鮮艷的色彩,紅色、橙色和黃色透露出旺盛的流動,病變心室內(nèi)的血流表現(xiàn)為緩慢的藍色和綠色。因此,數(shù)字孿生可以揭示衰竭的心臟如何失去泵血能力,或者由心臟藥物引起的危險心律失常
不過,怎樣將虛擬心臟連接到虛擬身體呢?
為此,CompBioMed聯(lián)盟創(chuàng)建了一個長達60,000英里的血管、動脈、靜脈和毛細血管網(wǎng)絡(luò)的數(shù)字孿生。
這些網(wǎng)絡(luò)使用數(shù)十億個數(shù)據(jù)點,是從一名26歲的韓國女性Yoon-sun的冷凍尸體的數(shù)字化、高分辨率橫截面中收集而來的。
而德國超算SuperMUC-NG,使可專家們可以模擬出虛擬血液是如何通過Yoon-sun血管的虛擬副本流動的,它的直徑只有幾分之一毫米。
之后,團隊還會模擬Yoon-sun循環(huán)數(shù)字孿生過程中的血壓變化,并模擬血栓的運動。
來自倫敦科學博物館工程師畫廊的「虛擬心臟」展覽的Jazmín Aguado-Sierra心臟的數(shù)字孿生圖像
不過,迄今為止,我們從未創(chuàng)建過整個人體的數(shù)字孿生。
首先,這種復(fù)雜的模擬需要訪問強大的計算機,比如世界上第一臺也是最快的百萬兆次級超級計算機Frontier。即便如此仍然相距甚遠,并且需要大量的能量。
還有一個巨大的挑戰(zhàn),是將虛擬身體每個部分的所有代碼拼接在一起。
數(shù)字人的每個部分,如細胞或心臟,在技術(shù)上都是一個單獨的模擬。模擬也有多種尺度:一個細胞模型和另一個器官模型需要不同的代碼并以不同的速度運行。讓所有這些代碼以相同的速度同時加載并非易事
另外,還有道德方面的考慮,預(yù)測健康的工具如果落入壞人手里,會有潛在的風險。
不過,在當前技術(shù)下,想創(chuàng)建自己的數(shù)字孿生,只有億萬富翁才能做到。