今天的嘉賓是大模型公司月之暗面的創(chuàng)始人兼CEO楊植麟。
楊植麟是去年成立的這批國(guó)產(chǎn)大模型公司創(chuàng)始人中,最年輕的一位,也是學(xué)術(shù)、工作履歷和通用AI有最直接相關(guān)的一位。他畢業(yè)于清華和CMU,總計(jì)論文引用次數(shù)超過(guò)22000次。在人人喊PMF(產(chǎn)品/市場(chǎng)契合)、人人喊商業(yè)化的中國(guó)AI生態(tài)里,這位AI研究員出身的創(chuàng)始人倒不那么著急。
國(guó)產(chǎn)大模型中,月之暗面是最堅(jiān)定做to C、且只做to C的一家公司(于去年10月推出了智能助手Kimi),也是目前估值最高的一家中國(guó)大模型獨(dú)角獸(投后估值超過(guò)25億美元)。就在他們第三筆融資進(jìn)行的過(guò)程中,我和楊植麟聊了聊他過(guò)去一年創(chuàng)業(yè)故事。
這期節(jié)目由兩次訪談組成。我們主要的訪談是在2024年1月完成,不過(guò)過(guò)年期間,OpenAI重磅發(fā)布Sora,所以我們又在2月補(bǔ)充了一次訪談。由于楊植麟有大模型創(chuàng)業(yè)者和AI科學(xué)家的兩重身份,所以節(jié)目中包含了許多他對(duì)于AGI技術(shù)演進(jìn)的關(guān)鍵技術(shù)判斷。
我們的播客節(jié)目在騰訊新聞首發(fā),大家可以前往關(guān)注哦,這樣可以第一時(shí)間獲取節(jié)目信息和更多新聞資訊:)
02:51 站在巨大技術(shù)變革的開端:前面是延綿而未知的雪山
03:35 11年本科、17年收斂到大語(yǔ)言模型、和圖靈得主合作論文:楊植麟的學(xué)術(shù)之路
06:36 為什么AGI需要新組織?為什么科研機(jī)構(gòu)、巨頭的AI lab無(wú)法產(chǎn)生偉大系統(tǒng)?
10:24 全球化+AGI+很大用戶量的產(chǎn)品,最終可能是AGI的必要條件
11:07 我們不想做“中國(guó)的OpenAI”,但應(yīng)該學(xué)習(xí)OpenAI的技術(shù)理想主義
13:15 我在Google學(xué)習(xí)到的最重要一課:從無(wú)限的雕花中把自己釋放出來(lái)
16:25 作為博士怎么與圖靈獎(jiǎng)得主合作?和學(xué)術(shù)大佬合作與和資本大佬合作,哪個(gè)更難?
19:37 創(chuàng)業(yè)這一年時(shí)間軸:ChatGPT激活資本、人才變量,我在硅谷做了一筆精確計(jì)算
22:28 Timing很重要,第一筆融資的窗口很短,只有一個(gè)月
27:54 怎么搭建AGI團(tuán)隊(duì)?現(xiàn)在有80人
30:21 卡的問(wèn)題有很多back and forth,接下來(lái)一兩年不會(huì)成為很大瓶頸
32:13 為什么月之暗面做to C且只做to C?(long context與Kimi智能助手背后的技術(shù)產(chǎn)品思考)
37:39 你認(rèn)可說(shuō)“國(guó)產(chǎn)大模型公司去年追趕GPT-3.5,今年追趕GPT-4,沒有本質(zhì)差異”這種說(shuō)法嗎?——這句話是對(duì)的,但也是片面的
39:17 追趕GPT-4是國(guó)產(chǎn)大模型的必經(jīng)之路,但也要做非共識(shí)的新維度
40:53 不認(rèn)同2023年下半年大模型市場(chǎng)轉(zhuǎn)冷的判斷,我們下半年確實(shí)也完成了融資
42:57 登月第一步是長(zhǎng)文本,第二步呢?接下來(lái)會(huì)有兩個(gè)最重大的技術(shù)milestone
44:21 只有一個(gè)顛覆性的東西,才配得上AGI這三個(gè)字,否則我們今天說(shuō)的都沒意義
45:34 我對(duì)PMF、落地場(chǎng)景和應(yīng)用的看法(“應(yīng)用”不是個(gè)準(zhǔn)確的詞,聽起來(lái)更像目的——應(yīng)該既是手段、也是目的)
46:54 User的scaling和Model的scaling這兩件事應(yīng)該同時(shí)做,降維打擊發(fā)生過(guò)太多次
48:54 為什么開源追不上閉源?現(xiàn)在開源的方式和以前不一樣了,它本身還是中心化
49:48 AI不是這一兩年找到什么PMF,而是未來(lái)十年二十年能做什么改變世界
51:48 怎么對(duì)抗國(guó)內(nèi)的焦慮情緒?大模型創(chuàng)業(yè)中的長(zhǎng)短期平衡——如果沒有長(zhǎng)期,你會(huì)錯(cuò)過(guò)整個(gè)時(shí)代
57:41 回顧2023年的曲折、變量和預(yù)料之外
60:30 怎么看幾個(gè)市場(chǎng)上的幾個(gè)觀點(diǎn)(包括Yann LeCun、Geoffrey Hinton、陸奇)
62:25 現(xiàn)在的大模型公司配比:一半實(shí)驗(yàn)室,一半商業(yè)公司
64:20 怎么看大模型創(chuàng)業(yè)公司和巨頭的關(guān)系
68:05 以上是對(duì)楊植麟的第一次訪談,接下來(lái)是過(guò)完年后的第二次。這次我們重點(diǎn)聊了OpenAI重磅發(fā)布Sora的技術(shù)觀點(diǎn)和對(duì)2024年的全球大模型產(chǎn)業(yè)預(yù)測(cè)
68:24 Sora有多少在你的意料之中,多少在你的意料之外?
69:17 Sora解決掉的技術(shù)問(wèn)題:能在一個(gè)比較長(zhǎng)的時(shí)間窗口保持生成的一致性
69:40 Sora對(duì)于全球產(chǎn)業(yè)格局意義是什么?2024年大模型會(huì)有哪些新敘事?
71:57 視頻生成之前的關(guān)鍵技術(shù)瓶頸,更unified architecture(統(tǒng)一的架構(gòu))仍然沒有被解決
73:04 解讀OpenAI關(guān)于Sora報(bào)告:《Video generation models as world simulators》
74:30 怎么看Yann LeCun對(duì)生成式AI的新觀點(diǎn)(“通過(guò)生成像素對(duì)世界進(jìn)行建模是一種浪費(fèi),并且注定會(huì)失敗”)
77:45 Sora是視頻生成的GPT-3.5時(shí)刻
78:37 為什么不同模態(tài)放在同一個(gè)模型里那么難?Sora + GPT會(huì)出現(xiàn)什么?
80:40 兩個(gè)世界差得越來(lái)越遠(yuǎn)了嗎?
83:41 2024年的全球大模型產(chǎn)業(yè)預(yù)測(cè)
【更多信息】
本集首發(fā)于騰訊新聞
聯(lián)絡(luò)我們:微博@張小珺-Benita
更多信息歡迎關(guān)注公眾號(hào):張小珺
用戶評(píng)論
杠杠開始
William Cohen是principal scientist 這個(gè)詞翻譯成首席科學(xué)家有歧義 聽起來(lái)好像在最頂層 他現(xiàn)在帶5個(gè)研究員 上面到deep mind的ceo還有4層report 他同層的還有幾個(gè)也是這個(gè)title的 就是個(gè)層級(jí)職位而已 怎么翻譯準(zhǔn)確嗎 主任科學(xué)家比較好些
杠杠開始
男嘉公司網(wǎng)站在手機(jī)顯示不優(yōu)化啊 加油啊
杠杠開始
Claude 3發(fā)布了 月亮的背面到底什么樣
塞拉啦啦啦
都是朱嘯虎這種想法的話類似openAI這種技術(shù)變革永遠(yuǎn)不會(huì)出現(xiàn)在中國(guó)