預(yù)·見成都大模型
人工智能的發(fā)展如火如荼,正與千行百業(yè)融合,迸發(fā)新的科技力量。大模型作為人工智能競爭的關(guān)鍵,今年將踏入變現(xiàn)元年。
在這場產(chǎn)業(yè)競爭中,成都走在了前列。近3年,成都人工智能產(chǎn)業(yè)規(guī)模復(fù)合增長率超40%,“人工智能科技產(chǎn)業(yè)競爭力”排名全國第6。四川省今年把人工智能列為1號創(chuàng)新工程,作為省會城市的成都,更要進一步強擔當、搶先機。
2024人工智能大模型基準測試科創(chuàng)發(fā)展大會將在蓉舉辦。紅星資本局專訪成都多家AI大模型廠商,與他們探討人工智能趨勢中的“成都力量”。
2016年,成都盛世君聯(lián)生物技術(shù)有限公司創(chuàng)立。8年時間,盛世君聯(lián)搭建起三千億級多樣性的真實生物藥物庫,并在此基礎(chǔ)上創(chuàng)建干濕輪動迭代的大分子AI藥物研發(fā)平臺BioAI。
在藥物研發(fā)這一領(lǐng)域,AI大模型有何優(yōu)勢?又面臨怎樣的挑戰(zhàn)?
盛世君聯(lián)總經(jīng)理黃琛在接受紅星資本局采訪時表示,與傳統(tǒng)制藥相比,AI制藥效率更高,算出來的某些參數(shù)也更優(yōu)。黃琛認為,AI制藥擁有廣闊的發(fā)展前景,預(yù)計不久的將來就會實現(xiàn)突破。
AI制藥像發(fā)射火箭
模型是火箭,數(shù)據(jù)是燃料
紅星資本局:為何創(chuàng)建大分子AI藥物研發(fā)平臺?
黃?。哼^去的科學(xué)研究發(fā)現(xiàn)了很多靶點導(dǎo)致了疾病,藥物研發(fā)也都是基于表征或者靶點,那么怎么樣讓藥物結(jié)合到這些靶點?傳統(tǒng)生物制藥前期研發(fā)投入非常高,時間又很長,失敗率也很高。
所以我們就在想,能不能把已知的分子全部放到一個庫里去,當一個靶點來的時候,從這個庫里去篩選最優(yōu)分子結(jié)合這個靶點,這樣比盲目地尋找要高效得多。但是真實藥物庫的多樣性是有上限的,AI能夠建立虛擬藥物庫,理論上可以實現(xiàn)無邊界的生物藥物的發(fā)現(xiàn)甚至是創(chuàng)造。
我們最開始也是想去找一家AI公司來合作,但后來發(fā)現(xiàn)純計算團隊對于生物學(xué)、結(jié)構(gòu)學(xué)的理解不一樣,所以我們就用生物進化和結(jié)構(gòu)生物學(xué)邏輯自己研發(fā)了算法和模型,用我們的數(shù)據(jù)來訓(xùn)練模型。就跟發(fā)射火箭一樣,模型本身就是火箭,數(shù)據(jù)是燃料。現(xiàn)在我們把火箭做出來了,燃料可以也源源不斷自行生產(chǎn),從而實現(xiàn)模型迭代升級。我們建成了三千億級多樣性的大分子藥物庫,它的核心在于掌握大分子全合成技術(shù)。
紅星資本局:現(xiàn)在這個系統(tǒng)可以做到什么程度的智能化研發(fā)?
黃琛:目前已經(jīng)實現(xiàn)了五個大模塊的功能,分別是大分子藥物的篩選發(fā)現(xiàn)、大分子藥物的優(yōu)化、成藥性分析、藥物從頭設(shè)計、數(shù)據(jù)訂閱。例如藥物從頭設(shè)計,以前藥物都是從自然界已經(jīng)有的分子里面去找,但是有的有副作用,或者毒性高,對人體的免疫系統(tǒng)來說也是侵入式的。
我們就想找在自然界里面沒有的分子,從而設(shè)計一個非常精準的藥物。這個靶點就像是鎖一樣,目前只能從現(xiàn)有的鑰匙里面找一把相對能夠開鎖的鑰匙,但是如果能夠根據(jù)鎖的結(jié)構(gòu)去設(shè)計一把鑰匙,精準地開這個鎖,那豈不是更好?所以我們要做藥物設(shè)計,從頭設(shè)計這個藥物。
AI制藥效率更高,參數(shù)更優(yōu)
但在藥物發(fā)現(xiàn)和篩選上尚存不足
紅星資本局:與傳統(tǒng)實驗相比,AI制藥有何優(yōu)點?
黃?。旱谝唬蟠筇岣吡诵?。比如藥物的人源化這種項目,一些藥物是在老鼠、羊駝等動物身上免疫,產(chǎn)生的抗體用到人身上就不行,所以需要把動物基因敲除掉,還不能改變抗體的功能。用傳統(tǒng)實驗方法做,大概要2-3個月,但是用AI做,最快幾個小時,一天之內(nèi)就把它做完了。
第二,在藥物優(yōu)化領(lǐng)域,AI 算出來的功能指標要優(yōu)于傳統(tǒng)實驗室做出來的。傳統(tǒng)實驗都有人參與,只要有人,實驗過程就會發(fā)生不穩(wěn)定的情況,但是AI深度學(xué)習(xí)的項目做得越多越好。而且,AI往往能夠在人想不到的一些區(qū)域去做優(yōu)化,過去一年的商業(yè)項目的數(shù)據(jù)甚至優(yōu)于傳統(tǒng)實驗方法。
紅星資本局:與傳統(tǒng)實驗相比,AI制藥又有何不足?
黃?。涸谒幬锏膬?yōu)化上面,AI目前已經(jīng)有非常大的優(yōu)勢了,但是在藥物的發(fā)現(xiàn)和篩選上,AI還無法做到端對端。傳統(tǒng)實驗過程中,一個靶點過來以后,若要篩選藥物,直接在庫里面篩就行。但是現(xiàn)在的模型,AI還不能夠?qū)崿F(xiàn)給它一個靶點,它就幫你推薦一些候選藥物,模型還需要海量數(shù)據(jù)的深度學(xué)習(xí)和迭代。
另外,目前來說,AI還沒有被證明可以真正做到從藥物的發(fā)現(xiàn)、臨床試驗到應(yīng)用實踐,目前還沒完全走通這條路。目前純用AI設(shè)計的藥物,全球有40條管線已經(jīng)達到臨床二期,未來會不會有臨床三期的藥物出現(xiàn),便能證明AI是否可以設(shè)計藥物。
AI制藥面臨人才、成本等挑戰(zhàn)
紅星資本局:藥物研發(fā)的過程中,AI模型目前有哪些挑戰(zhàn)?
黃?。菏紫染褪侨瞬?。比如我們有兩個團隊,一個是生物學(xué)的團隊,一個是研究AI的團隊。最初,這兩個團隊互相都不理解,兩個團隊磨合大概用了一年時間?,F(xiàn)在好一點了,但是我們依然還缺乏這種復(fù)合型人才,我們要既懂計算,也懂生物的人才,由此要在兩個團隊之間做平衡。
第二就是成本。之前訓(xùn)練的幾個小模型,它的訓(xùn)練成本我們還能承受,但是我們現(xiàn)在正在做這個虛擬藥物庫,做到7萬億級的時候,我們就發(fā)現(xiàn)計算成本大幅提升,我們就會面臨算力的挑戰(zhàn),也就是將來有沒有足夠的算力支撐我們的虛擬藥物庫。
最后就是生產(chǎn)數(shù)據(jù)的周期。AI模型目前有很多,但是缺乏海量、高分辨率、自動帶標簽的數(shù)據(jù)來訓(xùn)練和驗證AI模型,所以如何加大數(shù)據(jù)生產(chǎn)成為最大的挑戰(zhàn),我們目前從庫中挖掘數(shù)據(jù)的速度還是很慢,每周10萬條,如果能夠?qū)崿F(xiàn)高通量的數(shù)據(jù)挖掘,將產(chǎn)生顛覆性的效果。
紅星資本局:您如何看待AI制藥的未來?
黃?。篈I制藥的未來是非常有前景的,我估計突破可能也就在這一兩年之內(nèi)了。所謂的突破,就是有一款A(yù)I設(shè)計的藥物進入臨床三期上市銷售,并且它的臨床效果遠遠優(yōu)于傳統(tǒng)的藥物。此外,AI制藥從研發(fā)到臨床的時間會大大縮短,AI制藥從2021年開始啟動,短短四年發(fā)展迅速,極大提高了藥物的研發(fā)效率,降低了研發(fā)成本,提高藥物進入臨床三期的比例,最終將推動實現(xiàn)AI設(shè)計藥物的落地應(yīng)用。
用戶評論