《火石深度研究報告》 第十期: 醫(yī)藥研發(fā)領(lǐng)域的人工智能應(yīng)用探討

2019-04-21 18:45:2612:44 451
聲音簡介

一、AI在醫(yī)健領(lǐng)域的應(yīng)用
       近年來,人工智能技術(shù)(AI)與醫(yī)療健康領(lǐng)域的融合不斷加深。AI在醫(yī)療領(lǐng)域有很多的應(yīng)用場景,主要包括語音錄入病歷、醫(yī)療影像輔助診斷、藥物研發(fā)、醫(yī)療機器人和個人健康大數(shù)據(jù)的智能分析等。隨著語音交互、文本識別、圖像識別等技術(shù)的逐漸成熟,AI的應(yīng)用場景越發(fā)多樣。


       藥物研發(fā)是AI技術(shù)應(yīng)用的重要場景之一。由于藥物研發(fā)要經(jīng)歷靶點的發(fā)現(xiàn)與驗證、先導(dǎo)化合物的發(fā)現(xiàn)與優(yōu)化、候選化合物的挑選及開發(fā)和臨床研究等多個階段。傳統(tǒng)的藥物研發(fā)耗時耗力,且成功率低。AI助力藥物研發(fā),可大大縮短藥物研發(fā)時間、提高研發(fā)效率并控制研發(fā)成本。


二、AI助力新藥研發(fā)的應(yīng)用場景
       目前制藥企業(yè)紛紛布局AI領(lǐng)域,主要應(yīng)用在新藥發(fā)現(xiàn)和臨床試驗階段,主要有以下六大應(yīng)用場景:


1.海量文獻信息分析整合
       對于藥物研發(fā)工作者來說,最讓他們頭疼的事如何去甄別每天產(chǎn)生的海量科研信息。而人工智能技術(shù)恰恰可以從這些散亂無章的海量信息中提取出能夠推動藥物研發(fā)的知識,提出新的可以被驗證的假說,從而加速藥物研發(fā)的過程。
       英國生物科技公司Benevolent Bio(隸屬于 Benevolent AI),利用技術(shù)平臺JACS(Judgment Augmented Cognition System),從全球范圍內(nèi)海量的學術(shù)論文、專利、臨床試驗結(jié)果、患者記錄等數(shù)據(jù)中,提取出有用的信息,發(fā)現(xiàn)新藥研發(fā)的蛛絲馬跡。
       2017年,借助JACS的分析能力,Benevolent Bio 標記了100個可用于治療肌萎縮性側(cè)索硬化癥(ALS)的潛在化合物,從中篩選出5個化合物。經(jīng)過英國謝菲爾德神經(jīng)轉(zhuǎn)化研究所的小鼠試驗,證實4個化合物在治愈運動神經(jīng)衰退方面確有療效。4/5的有效篩選率,這是研究人員之前從未想過的。
位于英國倫敦的BenevolentAI成立于2013年,是一家致力于AI技術(shù)開發(fā)和應(yīng)用的公司,是歐洲大的AI初創(chuàng)公司。他們的目標是建立人們期盼已久的“制藥企業(yè)2.0”,利用AI助力新藥開發(fā),降低臨床試驗的失敗率。自2013年以來,Benevolent AI已經(jīng)開發(fā)出24個候選藥物,且已經(jīng)有藥物進入臨床IIb期試驗階段。
        國際制藥巨頭之一的強生公司已經(jīng)與Benevolent AI達成合作協(xié)議,強生將一些已經(jīng)進入臨床階段的試驗藥物連帶一起特許給Benevolent AI,而Benevolent AI將利用人工智能系統(tǒng)來指導(dǎo)臨床試驗的進行和數(shù)據(jù)的收集。

2.化合物高通量篩選
       化合物篩選,是指通過規(guī)范化的實驗手段,從大量化合物或者新化合物中選擇對某一特定作用靶點具有較高活性的化合物的過程。而要從數(shù)以萬計的化合物分子中篩選出符合活性指標的化合物,往往需要較長的時間和成本。
        AI 技術(shù)可以通過對現(xiàn)有化合物數(shù)據(jù)庫信息的整合和數(shù)據(jù)提取、機器學習,提取大量化合物與毒性、有效性的關(guān)鍵信息,既避免了盲人摸象般的試錯路徑,還可以大幅提高篩選的成功率。
       典型代表是硅谷公司Atomwise。Atomwise公司成立于2012年,其核心產(chǎn)品為AtomNet是一種基于深度學習神經(jīng)網(wǎng)絡(luò)的虛擬藥物發(fā)現(xiàn)平臺。AtomNet就像一位人類化學家,使用強大的深度學習算法和計算能力,來分析數(shù)以百萬計的潛在新藥數(shù)據(jù)。目前,AtomNet已經(jīng)學會識別重要的化學基團,如氫鍵、芳香度和單鍵碳,同時該系統(tǒng)可以分析化合物的構(gòu)效關(guān)系,識別醫(yī)藥化學中的基礎(chǔ)模塊,用于新藥發(fā)現(xiàn)和評估新藥風險。


        AtomNet在抗腫瘤藥物、神經(jīng)系統(tǒng)疾病藥物、抗病毒藥物、抗寄生蟲藥和抗生素藥物的藥物篩選方面表現(xiàn)出色。例如,2015年AtomNet僅用一周模擬出2種有潛力用于埃博拉病毒治療的化合物。Atomwise正與全球知名藥企和大學院校進行合作,其中包括輝瑞、默克、abbvie和哈佛大學等。
類似于Atomwise ,現(xiàn)在有一系列人工智能公司專注于藥物分子篩選,包括Recursion Pharmaceuticals、BenevolentAI、TwoXAR、Cyclica和Reverie Labs等。

3.發(fā)掘藥物靶點
       現(xiàn)代新藥研究與開發(fā)的關(guān)鍵是尋找、確定和制備藥物靶點。靶點是指藥物在體內(nèi)的作用結(jié)合位點,包括基因位點、受體、酶、離子通道和核酸等生物大分子。
       典型代表是Exscientia公司,Exscientia與葛蘭素史克(GSK)在藥物研發(fā)達成戰(zhàn)略合作。Exscientia 通過AI藥物研發(fā)平臺為GSK的10個疾病靶點開發(fā)創(chuàng)新小分子藥物。
       Exscientia開發(fā)的AI系統(tǒng)可以從每個設(shè)計周期里的現(xiàn)有數(shù)據(jù)資源中學習,其原理與人類的學習方式相似,但AI在識別多種微妙變化以平衡藥效、選擇性和藥代動力學方面要更加高效。其AI系統(tǒng)完成新藥候選的時間和資金成本只需傳統(tǒng)方法的1/4。目前該公司與國際多家知名藥企形成戰(zhàn)略合作,包括強生、默克和賽諾菲等。

4.預(yù)測藥物分子動力學指標(ADMET)
       ADMET包括藥物的吸收、分配、代謝、排泄和毒性。預(yù)測ADMET是當代藥物設(shè)計和藥物篩選中十分重要的方法。過去藥物ADMET性質(zhì)研究以體外研究技術(shù)與計算機模擬等方法相結(jié)合,研究藥物在生物體內(nèi)的動力學表現(xiàn)。目前市場中有數(shù)十種計算機模擬軟件,包括ADMET Predicator、MOE、Discovery Studio和Shrodinger等。該類軟件現(xiàn)已在國內(nèi)外的藥品監(jiān)管部門、制藥企業(yè)和研究院所得到了廣泛應(yīng)用。
       典型的代表包括晶泰科技(XtalPi)、Numerate等。為了進一步提升ADMET性質(zhì)預(yù)測的準確度,已有生物科技企業(yè)探索通過深度神經(jīng)網(wǎng)絡(luò)算法有效提取結(jié)構(gòu)特征,加速藥物的早期發(fā)現(xiàn)和篩選過程。其中晶泰科技通過應(yīng)用人工智能高效地動態(tài)配置藥物晶型,能完整預(yù)測一個小分子藥物的所有可能的晶型,大大縮短晶型開發(fā)周期,更有效地挑選出合適的藥物晶型,減少成本。

5.病理生物學研究
       病理生物學(pathophysiology)是一門研究疾病發(fā)生、發(fā)展、轉(zhuǎn)歸的規(guī)律和機制的科學。病理生物學研究是醫(yī)藥研發(fā)的基礎(chǔ),至今許多疾病尚無治療方法,是由于在病理生物學研究方面沒有取得進展。
       肌萎縮側(cè)索硬化(ALS)是一種破壞性的神經(jīng)退行性疾病,發(fā)病機制至今不明。ALS的一個突出病理特征是,一些RNA結(jié)合蛋白(RNA binding proteins, RBPs)在ALS中發(fā)生突變或異常表達/分布。人類基因組中至少有1 542種RBPs,目前已發(fā)現(xiàn)17種RBPs與ALS相關(guān),除此以外,其他RBPs是否與ALS相關(guān)呢?


       典型案例是IBM公司開發(fā)的Watson系統(tǒng),通過閱讀了2 500萬篇文獻摘要,100萬篇完整論文和400萬專利文獻,并基于相關(guān)文獻的大量學習,建立了模型預(yù)測RBPs與ALS相關(guān)性。有研究者為了測試其模型的預(yù)測能力,首先將IBM Watson的知識庫限制在2013年之前的學術(shù)出版物上,并要求Watson使用這些可用的信息來預(yù)測與ALS相關(guān)的其他RBPs。在2013—2017年期間,Watson在對4個導(dǎo)致突變的RBPs給出了高度評價,證明了模型的有效性。而后,Watson對基因組中所有的RBPs進行篩選,并成功鑒定在ALS中改變的5種新型RBPs。

6.發(fā)掘藥物新適應(yīng)癥
       利用深入學習技術(shù),將臨床藥物與新的適應(yīng)癥相匹配。這樣可以繞過動物實驗和安全性實驗。
        例如,沙利度胺曾用來治療麻風病,后來研究人員發(fā)現(xiàn)其對多發(fā)性骨髓瘤具有療效。由于該藥物已經(jīng)積累了大量的安全性與劑量數(shù)據(jù),研究人員能夠繞過第一階段的安全性和劑量試驗。
        根據(jù)實驗結(jié)果,F(xiàn)DA在2012年批準沙利度胺治療多發(fā)性骨髓瘤。據(jù)彭博預(yù)測,這個過程總共花費了4 000~8 000 萬美元。如果從零開始,一個新藥所需的平均費用為20 億美元。


        典型代表為Lam Therapeutics、NuMedii、Healx和Insilico Medicine等人工智能公司,他們已經(jīng)在“老藥新用”這個領(lǐng)域進行了深度探索。


三、AI新藥研發(fā)公司
       中國在AI領(lǐng)域的論文發(fā)表數(shù)量位居全球第一。在醫(yī)學領(lǐng)域,我們在放射影像、病理、自然語言處理和智能語音錄入等領(lǐng)域的研究與歐美并駕齊驅(qū),但在AI+新藥研發(fā)領(lǐng)域,卻差距較大。


        2014年,晶泰科技創(chuàng)立于麻省理工學院校園。其核心總部位于深圳,并在北京、波士頓設(shè)有分部。晶泰科技目前已與多家世界頂級藥企與科研機構(gòu)建立深度合作,其藥物固相篩選與設(shè)計平臺是行業(yè)最先進的解決方案。憑借團隊的技術(shù)優(yōu)勢與項目廣闊的市場空間,晶泰科技已獲得騰訊、真格基金、峰瑞資本數(shù)千萬元的A輪投資,以及來自紅杉、Google、騰訊的數(shù)千萬美金B(yǎng)輪融資,成為全球AI+制藥領(lǐng)域獲得融資最高的創(chuàng)業(yè)公司之一。
        2018年12月,天津國際生物醫(yī)藥聯(lián)合研究院與北京天云大數(shù)據(jù)簽署戰(zhàn)略合作協(xié)議,雙方將在人工智能醫(yī)藥研發(fā)平臺建設(shè)領(lǐng)域聯(lián)手,為京津冀乃至全國提供服務(wù)。根據(jù)協(xié)議,雙方將共同建設(shè)人工智能醫(yī)藥研發(fā)平臺,立足京津地區(qū),為藥物研發(fā)等大健康行業(yè)創(chuàng)新發(fā)展賦能,致力于人工智能與大數(shù)據(jù)技術(shù)在醫(yī)藥行業(yè)內(nèi)的推廣和應(yīng)用。同時,雙方各自發(fā)揮優(yōu)勢,共同開展人工智能醫(yī)藥研發(fā)平臺的推廣工作,推動建立京津冀醫(yī)藥智能技術(shù)創(chuàng)新聯(lián)盟。


四、AI藥物研發(fā)領(lǐng)域的關(guān)鍵要素
       中國在AI藥物開發(fā)領(lǐng)域已經(jīng)開始起步,但遠未成熟,還有非常大發(fā)展空間。在筆者看來,我國進行AI藥物研發(fā)需要在人才培養(yǎng)、數(shù)據(jù)共享和商業(yè)模式創(chuàng)新等方面進行發(fā)力。
1.培養(yǎng)高端人工智能人才,探索跨學科人才合作機制。
       創(chuàng)業(yè)的競爭歸根結(jié)底是人才的競爭,這在人工智能領(lǐng)域表現(xiàn)得愈加明顯。在全球范圍內(nèi),大約有2.2萬名具有博士以上學歷的人工智能從業(yè)人員和研究人員,中國僅600名左右。國內(nèi)人工智能人才幾乎被幾大頭部企業(yè)壟斷,比如商湯有150多名人工智能博士,占比全國人工智能博士總數(shù)1/4。
數(shù)據(jù)顯示,未來中國人工智能人才缺口高達500萬,唯一的解決辦法就是成體系地培養(yǎng)人工智能人才。
       2018華為全聯(lián)接大會上,華為云推出了“沃土AI開發(fā)者計劃”,投入10億人民幣培養(yǎng)高校和研究所的AI人才,并與清華大學、中科院、中國科學技術(shù)大學、浙江大學等達成AI合作。
        2018年8月,商湯科技攜手香港中文大學、亞馬遜、南洋理工大學、悉尼大學聯(lián)合舉辦的首屆WIDER Face and Pedestrian Challenge 2018(簡稱:WIDER Challenge)挑戰(zhàn)賽,包括中科院計算所、微軟亞洲研究院、北京大學、卡耐基梅隆大學、香港大學以及雅虎、京東、曠視、科大訊飛、滴滴等科技公司參賽。
      此外,AI應(yīng)用于藥物研發(fā)需要若干個垂直領(lǐng)域的專家共同參與才能有所突破。既需要物理學家、化學專家、藥物學家、藥企研發(fā)高管,又需要人工智能科學家、云計算工程師等跨學科人才。通過在多個領(lǐng)域人才和經(jīng)驗的積累,整個團隊需要緊密合作,這樣才更容易獲得突破性的思路和好的成果。

2.建立研發(fā)數(shù)據(jù)標準體系,完善數(shù)據(jù)共享機制。
        AI藥物研發(fā)需要高質(zhì)量數(shù)據(jù)支持。國內(nèi)創(chuàng)新藥研發(fā)起步較晚,與國外相比,對于優(yōu)質(zhì)數(shù)據(jù)的積累還有一定差距。
       制藥產(chǎn)業(yè)的專業(yè)門檻高、鏈條長,加之國內(nèi)長期以來的“多頭管理”體制,造成了國內(nèi)的藥品數(shù)據(jù)極度割裂,標準不統(tǒng)一、數(shù)據(jù)孤島現(xiàn)象嚴重;另外,醫(yī)藥領(lǐng)域的監(jiān)管政策與機構(gòu)改革頻繁,造成歷史藥品數(shù)據(jù)銜接難度較大。這些都會導(dǎo)致醫(yī)藥數(shù)據(jù)統(tǒng)計在完整度和精準度上的不足,從而影響相關(guān)決策。
        當前國內(nèi)企業(yè)“大數(shù)據(jù)化”采取的一個路徑,便是以“專業(yè)人工+機器輔助”方式建立數(shù)據(jù)標準詞典(包括藥品、企業(yè)、靶點、疾病等),持續(xù)進行數(shù)據(jù)清洗、識別、匹配和挖掘算法,將市場上分散的數(shù)據(jù)全面重構(gòu),形成一系統(tǒng)標準數(shù)據(jù)模塊倉庫,根據(jù)用戶場景對數(shù)據(jù)模塊進行組合。比如國內(nèi)的醫(yī)藥魔方、米內(nèi)數(shù)據(jù)、藥渡等醫(yī)藥大數(shù)據(jù)服務(wù)公司。



五、小結(jié)
1.新藥研發(fā)存在環(huán)節(jié)多、研發(fā)費用高、研發(fā)周期長和研發(fā)成功率低等問題。
       新藥研發(fā)從上游到下游的幾個環(huán)節(jié)包括藥物靶標的確定,先導(dǎo)化合物的篩選,先導(dǎo)化合物的優(yōu)化和最終的臨床實驗。研發(fā)費用高、研發(fā)周期長、研發(fā)成功率低一直是壓在制藥企業(yè)身上的“三座大山”。
    塔夫茨藥物開發(fā)研究中心(Tufts Center for The Study of DrugDevelopment)的數(shù)據(jù)顯示:開發(fā)一種新藥的平均成本為 26 億美元;一種新藥上市的平均時間約為12 年;大約只有 10% 的候選藥物能從第一階段測試走向市場。德勤的數(shù)據(jù)顯示:2017 年,美國最大的生物制藥公司的投資回報率下降至3.2%。

2.AI技術(shù)的崛起,為新藥研發(fā)帶來了新方向。
       過去 20 年,計算機處理能力的持續(xù)快速增長,大量數(shù)據(jù)集的可用性和先進算法的開發(fā),大大推動了機器學習的發(fā)展。新藥研發(fā)領(lǐng)域數(shù)據(jù)密集,這讓人工智能有了用武之地。AI 不僅能夠挖掘出不易被發(fā)現(xiàn)的隱性關(guān)系,構(gòu)建藥物、疾病和基因之間的深層次關(guān)系。同時,可對候選化合物進行虛擬篩選,更快地篩選出具有較高活性的化合物,為后期臨床試驗做準備。
       目前,AI 在新藥研發(fā)領(lǐng)域主要應(yīng)用于靶點發(fā)現(xiàn)、化合物合成、化合物篩選、晶型預(yù)測、患者招募、優(yōu)化臨床試驗設(shè)計和藥物適應(yīng)癥開拓等場景。來自 Tech Emergence 的一份報告研究了所有行業(yè)的人工智能應(yīng)用,結(jié)果表明:人工智能可以將新藥研發(fā)的成功率從 12%提高到 14%,可以為生物制藥行業(yè)節(jié)省數(shù)十億美元。
       自2017年以來,AI在制藥領(lǐng)域的應(yīng)用可謂如火如荼,國際制藥巨頭紛紛入局AI開發(fā),用于提高新藥的研發(fā)效率。據(jù)統(tǒng)計,有100 多家初創(chuàng)企業(yè)在探索用 AI 發(fā)現(xiàn)藥物,傳統(tǒng)的大型制藥企業(yè)更傾向于與采用合作的方式,如阿斯利康與 Berg,強生與 Benevolent AI,默沙東與 Atomwise,武田制藥與 Numerate,賽諾菲和葛蘭素史克與 Exscientia,輝瑞與 IBM Watson 等。同時,AI應(yīng)用于新藥研發(fā)仍需面對人才短缺、數(shù)據(jù)標準化與共享機制、商業(yè)模式創(chuàng)新等諸多問題。
        在制藥和生命科學中,數(shù)據(jù)是AI的關(guān)鍵。AI被應(yīng)用于藥物研發(fā)的各個階段,但若是數(shù)據(jù)質(zhì)量不高,即便使用非??煽康乃惴?,也不會取得好結(jié)果,反而會浪費大量的資源和時間。鑒于此,IBM 曾在2016年斥資26億美元收購醫(yī)療數(shù)據(jù)公司Truven;羅氏曾在2018年以19億美金收購腫瘤大數(shù)據(jù)公司Flatiron Health的全部股份。也有專家表示,通過知識共享開展合作和提高已有數(shù)據(jù)的質(zhì)量比積累數(shù)據(jù)更為重要,關(guān)鍵是建立一套切實可行的數(shù)據(jù)標準,與風險利益共擔的數(shù)據(jù)分享機制。

3.AI和藥物開發(fā)的模式,主要包括AI研發(fā)外包、企業(yè)內(nèi)部組建AI研發(fā)部門,但每種模式都有各自的優(yōu)缺點。
       AI研發(fā)外包。由制藥公司提供特定的研究數(shù)據(jù)和生物靶點信息,然后由AI驅(qū)動的藥物發(fā)現(xiàn)初創(chuàng)公司依靠這些數(shù)據(jù)建立模型。一旦成功篩選出候選藥物,制藥公司會根據(jù)協(xié)議進行授權(quán)或自行擁有這種藥物。這種策略靈活性高且成本較低,但AI公司做為服務(wù)方需要獲取制藥公司整個藥物開發(fā)流程中最“隱私”的情報,因此,選擇合適的合作伙伴是重中之重。
       在企業(yè)內(nèi)部組建AI研發(fā)部門。在與外部積極合作的同時,制藥公司也在培養(yǎng)內(nèi)部AI專業(yè)技能,并建立數(shù)字基礎(chǔ)設(shè)施,以提高數(shù)據(jù)使用效率。這種方式的挑戰(zhàn)在于如何建立內(nèi)部專業(yè)的AI算法和自動化流程,以及高效的運算平臺。
       無論哪種模式,AI和藥物開發(fā)的結(jié)合,與其說是對IT技術(shù)人員的挑戰(zhàn),不如說更是對藥學人員的挑戰(zhàn)。一個運營良好的AI藥物發(fā)現(xiàn)團隊,應(yīng)該是能夠讓IT技術(shù)人員和藥學科學家保持溝通無障礙,彼此交流更明晰,清楚對方的意圖。





用戶評論

表情0/300
喵,沒有找到相關(guān)結(jié)果~
暫時沒有評論,下載喜馬拉雅與主播互動
猜你喜歡
火石深度研究報告

火石創(chuàng)造(杭州費爾斯通科技有限公司)成立于2015年,系國家高新技術(shù)企業(yè),浙江省健康大數(shù)據(jù)創(chuàng)新技術(shù)戰(zhàn)略聯(lián)盟發(fā)起和依托單位。以完善的產(chǎn)業(yè)數(shù)據(jù)和先進的算法模型為基礎(chǔ)...

by:火石創(chuàng)造2019

公司深度研究報告

聆聽好公司好文章,日積月累,厚積薄發(fā)。

by:頑石哥a

摩根大通研究報告

最新最熱的海外金融機構(gòu)咨詢搬運,原版全英文。

by:WoWu

上市公司研究報告

投資必看的投資研究報告

by:趨勢投資

神奇的火石寨|西北罕見的丹霞地貌

翻開歷史的畫卷,西吉作為關(guān)中門戶、邊陲咽喉,歷來為兵家所爭之地。戰(zhàn)國秦長城橫穿西吉境內(nèi)20公里。西夏王李元昊與北宋的好水川之戰(zhàn)、明軍與滿俊的石城之戰(zhàn)、聞名中外的...

by:欣闌

花生現(xiàn)貨市場研究報告

花生的概念花生,學名Arachishypogaea,中國早年以及日本稱其落花生。花生是被子植物門、雙子葉植物綱、豆目、豆科、蝶形花亞科、落花生屬的一年生草本植...

by:安古仔