發(fā)布公測后的60天,ChatGPT吸引了10億用戶。
【資料圖】
2022年,全球醫(yī)療行業(yè)市場達5000億美元。
乍看之下,這兩個數(shù)字的關(guān)系有點遠。然而正如最近A16Z發(fā)布的文章里指出的:醫(yī)療是目前僅存的,還未被技術(shù)大規(guī)模改變的重要領(lǐng)域。而更易落地、有著超過10倍效率提升的AI技術(shù),就是這個突破口。
可以說,對ChatGPT背后的生成式模型來說,積累了海量優(yōu)質(zhì)數(shù)據(jù)、迫切需要降本增效的醫(yī)療行業(yè)很可能成為其最集中、來得也最快的爆發(fā)點。
硅星聞對話了硅谷投資人張璐,聊了聊生成式模型在醫(yī)療領(lǐng)域的巨大可能性及挑戰(zhàn)。
張璐是硅谷新一代領(lǐng)軍基金的代表人物,2022年被福布斯評選為全球華人精英Top 100 行業(yè)翹楚,2023年入選Business Insider美國最佳25名女性早期投資人及100 Women in Finance榜單,也是達沃斯世界經(jīng)濟論壇“全球青年領(lǐng)袖”。
2015年,張璐創(chuàng)立 Fusion Fund,現(xiàn)管理近4億美元資本,專注醫(yī)療和深科技領(lǐng)域投資。張璐帶領(lǐng)的投資團隊以斯坦福背景為主,匯聚了硅谷杰出企業(yè)家、投資人以及美國工程院院士等,已投資公司有多家上市和收購?fù)顺觥?/p>
醫(yī)療也許是生成式AI最合適的應(yīng)用窗口
對于大模型來說,優(yōu)質(zhì)、龐大的數(shù)據(jù)量是它能夠得以存在、不斷進化的最重要基礎(chǔ)之一。
而在這一點上,醫(yī)療領(lǐng)域一騎絕塵。
“在醫(yī)療行業(yè)中,數(shù)據(jù)基礎(chǔ)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)專業(yè)度都非常高。而生成式人工智能的出現(xiàn),也會幫助我們更快更好地將人工智能應(yīng)用在醫(yī)療領(lǐng)域推廣。”張璐表示。醫(yī)療領(lǐng)域是她創(chuàng)立的Fusion Fund的一個重要投資方向。
另一方面,醫(yī)療是關(guān)乎全人類健康、生存的重要行業(yè),從其龐大的市場規(guī)模、以及全球為醫(yī)療進步投入的大量人力、物力,不難看出,未來這個行業(yè)也會不斷有著精進技術(shù)、降本增效的需求。僅看美國市場,醫(yī)療行業(yè)的規(guī)模就達到了4000億美元。
兩相結(jié)合,醫(yī)療行業(yè)很可能成為生成式模型最重要的落地窗口。
從去年底開始吸引了全球關(guān)注的ChatGPT,將率先改變醫(yī)療領(lǐng)域中“非臨床”的部分:在《紐約時報》六月發(fā)布的報道中,詳細介紹了一位田納西的全科醫(yī)生如何在類似ChatGPT的AI助手的幫助下,將每天兩小時以上的醫(yī)療資料整理工作,縮減到20分鐘。
在張璐看來,目前生成式模型在醫(yī)療領(lǐng)域的各個垂直方向都有重大影響,包括數(shù)字化診斷、數(shù)字化治療、數(shù)字化生物學(xué),將帶來巨大產(chǎn)業(yè)創(chuàng)新及效能提升的機會,最終幫助解決醫(yī)療領(lǐng)域的“三A問題”,也就是accessibility(可得性)、affordable(低成本)、accuracy(高精度、個性化)。在此之外,值得關(guān)注的領(lǐng)域還包括藥物創(chuàng)新、臨床試驗等。
硅谷投資人、Fusion Fund創(chuàng)始人張璐
對張璐而言,這些領(lǐng)域中最令她興奮的是生成式人工智能在數(shù)字生物學(xué)的應(yīng)用,尤其是它與AlphaFold結(jié)合后,未來對于數(shù)字生物學(xué)及它包含的合成生物學(xué)的推動。合成生物學(xué)不僅在制藥領(lǐng)域有巨大的創(chuàng)新價值,同時在化工領(lǐng)域、食品領(lǐng)域也有非常廣泛的應(yīng)用?!巴ㄟ^生成人工智能和數(shù)字生物學(xué)的結(jié)合,可以幫助我們更快發(fā)掘定義新型蛋白質(zhì)的設(shè)計,提高準(zhǔn)確率和效率,從而對于藥物創(chuàng)新研發(fā)產(chǎn)生巨大的貢獻。”張璐表示。
今年早些時候,生物技術(shù)公司Insilico Medicine(Insilico)宣布已完成INS018_055階段II臨床試驗首次劑量投放,這是世界上首個使用生成式人工智能發(fā)現(xiàn)和設(shè)計的抗纖維化小分子抑制劑,現(xiàn)已開始第二階段臨床試驗。
其次,臨床實驗(clinical trial design)也有機會,包括如何設(shè)計不同的臨床實驗——也就是通過生成合成的數(shù)據(jù),去幫助挑選最合適的、最低成本的臨床實驗、挑選患者等;在這個過程中,生成式模型也可以用于進行模型模擬、測試用戶數(shù)據(jù)、合成多樣化臨床數(shù)據(jù)等。
過去人工智能已經(jīng)開始應(yīng)用于藥物發(fā)掘,然而一直沒有爆發(fā)。這是因為發(fā)掘?qū)用嫫鋵嵅⒎浅杀咀罡叩牡胤剑罡叩牡胤绞桥R床。
“畢竟臨床需要大量樣本,價格又非常高昂,導(dǎo)致很多藥廠在研發(fā)藥物上受到限制——如果疾病的病人數(shù)量不夠,可能就很難覆蓋臨床成本,藥廠也沒有動力進行開發(fā)。
“當(dāng)這兩個階段可以應(yīng)用生成式人工智能后,就會對藥物發(fā)掘帶來重要的改變:真正從根本上大規(guī)模降低藥物研發(fā)成本,推動新藥研發(fā)?!?/p>
除了這些新型的方向,生成式人工智能在人工智能驅(qū)動的個性化診斷、醫(yī)療影像層面等領(lǐng)域也有非常廣泛的應(yīng)用。比如張璐于數(shù)年前投資的Subtle Medical正是一個生成式AI應(yīng)用于醫(yī)療影像的典型范例,最近剛被CB Insights選入首個生成式AI全球50強榜單。通過深度學(xué)習(xí)技術(shù),深透醫(yī)療能夠完成包括MRI、PET等醫(yī)學(xué)圖像的增強,是醫(yī)療影像領(lǐng)域的首家生成式人工智能平臺,也開發(fā)了最早獲FDA、CE、NMPA等同時批準(zhǔn)的AI醫(yī)學(xué)影像產(chǎn)品。
Subtle Medical入選CB Insights Gen AI全球50強
醫(yī)療垂直行業(yè)的數(shù)據(jù)壁壘保護創(chuàng)新
不難看出,生成式人工智能正成為未來醫(yī)療領(lǐng)域的主要推動技術(shù)之一。在這樣的背景下,什么樣的競爭壁壘能夠讓企業(yè)高筑護城河?
“對大模型來說,數(shù)據(jù)是重中之重。而數(shù)據(jù)與數(shù)據(jù)之間,也有著不少差距,很可能對大模型的訓(xùn)練與應(yīng)用造成重大影響?!?張璐介紹道,“在目前階段,想要進一步優(yōu)化模型,數(shù)據(jù)的質(zhì)量比數(shù)據(jù)量更重要?!?/p>
比如Chat GPT的飛速進化,離不開全球用戶的大量數(shù)據(jù)訓(xùn)練;而對于醫(yī)療等垂直領(lǐng)域來說用專業(yè)的、行業(yè)專注的、特定的數(shù)據(jù)重新訓(xùn)練模型,才能讓模型更加準(zhǔn)確、高效、可靠。
正因此,對于在大模型領(lǐng)域的初創(chuàng)的公司或者說所有參與者來說,數(shù)據(jù)的質(zhì)量很可能會成為一個重要壁壘。
“尤其是人工智能在醫(yī)療領(lǐng)域應(yīng)用的公司,有沒有能力接觸最高質(zhì)量的數(shù)據(jù)、高質(zhì)量的數(shù)據(jù)庫,這非常關(guān)鍵。” 張璐表示。
“在醫(yī)療領(lǐng)域,創(chuàng)業(yè)團隊有自己獨特的data library,也就是各大行業(yè)數(shù)據(jù)、獨特的行業(yè)知識,才能修改和重新訓(xùn)練這個模型,進行優(yōu)化和調(diào)整,同時通過這個行業(yè)的特定的專業(yè)數(shù)據(jù)去保證模型的精準(zhǔn)性。在這個基礎(chǔ)之上,也就形成了一個比較強的技術(shù)和數(shù)據(jù)的壁壘。”
不難看出,在Fusion Fund的投資策略中,垂直領(lǐng)域應(yīng)用及獨特的海量高質(zhì)量數(shù)據(jù)都是重要的標(biāo)準(zhǔn)。
以她投資的Subtle Medical為例,他們具有很強的技術(shù)領(lǐng)先性,將技術(shù)應(yīng)用到整個加州的醫(yī)療系統(tǒng)里面,最優(yōu)質(zhì)的數(shù)據(jù)進行初始模型的訓(xùn)練。后續(xù)在大規(guī)模應(yīng)用過程中,找到了多個醫(yī)學(xué)影像模態(tài)的應(yīng)用場景、體現(xiàn)了AI技術(shù)的優(yōu)越性,并在美國、歐洲、亞洲大規(guī)模應(yīng)用,不斷提升模型質(zhì)量。
比如她早在五年前投資的Proscia, 這家公司專注于“AI讀片”,也就是通過AI來提升病理診斷的精確度,業(yè)務(wù)主要覆蓋腫瘤切片的影像學(xué)分析、數(shù)據(jù)整合和云共享。從2015年起, Proscia就創(chuàng)建了一個數(shù)字病理云平臺,使用計算機視覺來分析腫瘤的活檢切片和醫(yī)學(xué)影像,并為醫(yī)學(xué)專家提供每張切片中的病理數(shù)據(jù)。并在2017年將這項云技術(shù)跨界應(yīng)用于腫瘤病理分析,建立了腫瘤病理切片云數(shù)據(jù)庫。
再比如她此前投資的Huma.ai,有著眾多藥廠合作,給藥廠數(shù)據(jù)化人工智能工具,所以擁有大量藥廠內(nèi)部數(shù)據(jù)。如今,它不僅是生命科學(xué)和制藥行業(yè)第一個生成式人工智能平臺,兩年前就開始和Open AI合作,還與行業(yè)最頂尖的數(shù)家藥廠建立合作關(guān)系,直接幫助藥廠挖掘內(nèi)部價值。通過Huma.ai的工具,藥廠的科學(xué)家可以直接通過人工智能設(shè)計臨床實驗的方案去挖掘新藥特性。
近期,Huma.ai發(fā)布了生命科學(xué)及制藥行業(yè)的第一個生成式人工智能平臺??梢钥吹?,這個生成式人工智能平臺已經(jīng)有著優(yōu)秀服務(wù)質(zhì)量:可以直接詢問藥物臨床實驗的設(shè)計方案,它有能力給出非常精準(zhǔn)的答案。
數(shù)據(jù)隱私成挑戰(zhàn),然而仍舊蘊藏機遇
在機遇、壁壘之外,生成式人工智能在醫(yī)療領(lǐng)域面臨著隱私挑戰(zhàn),或者說所有的領(lǐng)域都是如此,只是醫(yī)療領(lǐng)域?qū)Υ烁用舾小?/p>
“很多醫(yī)療機構(gòu)非常擔(dān)心有l(wèi)iability(連帶責(zé)任),可能不太愿意分享數(shù)據(jù),這也會限制生成式人工智能在行業(yè)的應(yīng)用,這個時候就需要另外一個工具——Federated learning,聯(lián)邦學(xué)習(xí)。”張璐解釋道。
Federated learning(聯(lián)邦學(xué)習(xí))是一種算法,已經(jīng)開發(fā)出來很多年,特點是無需移動數(shù)據(jù),對方可以直接把模型放到這一數(shù)據(jù)上進行訓(xùn)練。訓(xùn)練完畢后再拿走模型,所以不需要犧牲數(shù)據(jù)的私,又能獲取數(shù)據(jù)價值,進行商業(yè)變現(xiàn)和數(shù)據(jù)分享。
“目前,聯(lián)邦學(xué)習(xí)正在快速應(yīng)用到醫(yī)療領(lǐng)域。比如醫(yī)院想把數(shù)據(jù)提供給第三方的公司,培訓(xùn)人工智能模型,但是傳輸數(shù)據(jù)可能會承擔(dān)風(fēng)險或者是隱私泄露的責(zé)任,如果使用了聯(lián)邦學(xué)習(xí),就意味著并未分享數(shù)據(jù),但實際上這些模型可以使用這些數(shù)據(jù)。” 張璐說道。
今年早些時候,NVIDIA發(fā)布了FLARE平臺,為企業(yè)提供了聯(lián)邦學(xué)習(xí)解決方案:一個強大、可擴展的聯(lián)邦學(xué)習(xí)基礎(chǔ)設(shè)施,使企業(yè)能夠更輕松地管理復(fù)雜的AI工作流程,往往包括大規(guī)模的機器學(xué)習(xí)(ML)模型的訓(xùn)練和部署。
“未來我們可以看到一個很好的前景,聯(lián)邦學(xué)習(xí)加生成式人工智能,幫助醫(yī)療領(lǐng)域的很多的大規(guī)模應(yīng)用快速推進?!睆堣幢硎尽!捌渲兄攸c是解決醫(yī)療系統(tǒng)的數(shù)據(jù)孤島問題——醫(yī)療系統(tǒng)有很多高質(zhì)量的數(shù)據(jù),但是卻都是相對孤立、獨立的。通過聯(lián)邦學(xué)習(xí),數(shù)據(jù)孤島問題得以解決,也能讓這些數(shù)據(jù)可以更好的被人工智能以及大語言模型所應(yīng)用。”
除此之外,她還指出,生成式人工智能目前面臨著高昂的算力及數(shù)據(jù)成本,未來很可能會出現(xiàn)很多新的技術(shù)在infrastructure(基礎(chǔ)設(shè)施)層面上來降低算力成本、數(shù)據(jù)成本。
“包括各大研究機構(gòu)也出了一些新的模式,這些用海量數(shù)據(jù)算培訓(xùn)出來的模型,再用少量的核心數(shù)據(jù)去優(yōu)化它?!北热鏜eta-AI template,希望不能自己建立針對影像的大型語言模型的公司,用他們的技術(shù)直接去做應(yīng)用。
不難看出,生成式模型作為工作提升的效率工具,仍舊有巨大的潛力。
“目前的生成式模型帶來的是非常高效好用的工具,然而它也必須要被人去使用。未來醫(yī)療領(lǐng)域,醫(yī)生護士都應(yīng)該要使用這種新型的工具——因為這是人類的本質(zhì),和其他生物比,人類最大的優(yōu)勢就在于會使用工具,可以說替代不是說技術(shù)替代人,而是說會使用新技術(shù)、會使用新工具的人,會替代那些不會使用人工智能工具的人。”張璐如此評論“AI代替人”的觀點。
她認為,AI將不斷幫助整個醫(yī)療系統(tǒng)完成效能提升,這一點也在她所投資的該領(lǐng)域企業(yè)中得到驗證。
比如說Fusion Fund旗下被投公司Synaptec,通過人工智能進行醫(yī)療代碼的自動化,節(jié)約醫(yī)生大量時間。
再比如說由成功連續(xù)創(chuàng)業(yè)者創(chuàng)立的Vectara,專注于通過大語言模型去做企業(yè)級的搜索,可以幫助大的公司直接在公司內(nèi)部的數(shù)據(jù)上運行大語言模型進行智能搜索。以及上文提到的Proscia,能通過AI讀片幫助醫(yī)生大大提升讀片分析效率,而非取代醫(yī)生。
“如今人工智能的發(fā)展真真正正驗證了它作為一個非常強大的工具去幫助醫(yī)療工作者提升效率效能的能力,未來持續(xù)幫助他們把時間花在最關(guān)鍵的步驟上。”
而這影響力還將繼續(xù)擴展,各個產(chǎn)業(yè)都可以通過它來進行工作效能提升。
“未來生成式人工智能會是一個基礎(chǔ)設(shè)施一樣的技術(shù)、一個非常高效的工具,可以預(yù)測到在這個基礎(chǔ)上會出現(xiàn)各類應(yīng)用,并探索各類模型優(yōu)化。在這個過程中,它的準(zhǔn)確性、應(yīng)用的效率性、成本的降低,都是創(chuàng)新關(guān)注的方向。”
隨著生成式人工智能帶來的一個非常大的突破和飛躍,這類“零代碼”的AI平臺會廣泛出現(xiàn)在人們的工作生活中。未來,許多擁有優(yōu)秀數(shù)據(jù)基礎(chǔ)的行業(yè)可能都會面臨人工智能的全面轉(zhuǎn)型:包括保險、物流、金融行業(yè)。
“生成式模型帶來了一個非常巨大的生態(tài),讓我們能夠看到全產(chǎn)業(yè)的人工智能的如何數(shù)字化轉(zhuǎn)型。而且我也相信,未來每個公司都多少要植入人工智能,它就像電力一樣,用電多與少取決于你需要多少,但是所有公司都會使用這樣的‘超級電力’,加速生產(chǎn)效率和生產(chǎn)力。”張璐表示。
關(guān)鍵詞: