和楊植麟聊大模型創(chuàng)業(yè)這一年：人類理想的增量、有概率的非共識(shí)和Sora

2024-03-01 20:12:3080:00 1435

聲音簡(jiǎn)介

今天的嘉賓是大模型公司月之暗面的創(chuàng)始人兼CEO楊植麟。

楊植麟是去年成立的這批國(guó)產(chǎn)大模型公司創(chuàng)始人中，最年輕的一位，也是學(xué)術(shù)、工作履歷和通用AI有最直接相關(guān)的一位。他畢業(yè)于清華和CMU，總計(jì)論文引用次數(shù)超過(guò)22000次。在人人喊PMF（產(chǎn)品/市場(chǎng)契合）、人人喊商業(yè)化的中國(guó)AI生態(tài)里，這位AI研究員出身的創(chuàng)始人倒不那么著急。

國(guó)產(chǎn)大模型中，月之暗面是最堅(jiān)定做to C、且只做to C的一家公司（于去年10月推出了智能助手Kimi），也是目前估值最高的一家中國(guó)大模型獨(dú)角獸（投后估值超過(guò)25億美元）。就在他們第三筆融資進(jìn)行的過(guò)程中，我和楊植麟聊了聊他過(guò)去一年創(chuàng)業(yè)故事。

這期節(jié)目由兩次訪談組成。我們主要的訪談是在2024年1月完成，不過(guò)過(guò)年期間，OpenAI重磅發(fā)布Sora，所以我們又在2月補(bǔ)充了一次訪談。由于楊植麟有大模型創(chuàng)業(yè)者和AI科學(xué)家的兩重身份，所以節(jié)目中包含了許多他對(duì)于AGI技術(shù)演進(jìn)的關(guān)鍵技術(shù)判斷。

我們的播客節(jié)目在騰訊新聞首發(fā)，大家可以前往關(guān)注哦，這樣可以第一時(shí)間獲取節(jié)目信息和更多新聞資訊：）

02:51 站在巨大技術(shù)變革的開端：前面是延綿而未知的雪山

03:35 11年本科、17年收斂到大語(yǔ)言模型、和圖靈得主合作論文：楊植麟的學(xué)術(shù)之路

06:36 為什么AGI需要新組織？為什么科研機(jī)構(gòu)、巨頭的AI lab無(wú)法產(chǎn)生偉大系統(tǒng)？

10:24 全球化+AGI+很大用戶量的產(chǎn)品，最終可能是AGI的必要條件

11:07 我們不想做“中國(guó)的OpenAI”，但應(yīng)該學(xué)習(xí)OpenAI的技術(shù)理想主義

13:15 我在Google學(xué)習(xí)到的最重要一課：從無(wú)限的雕花中把自己釋放出來(lái)

16:25 作為博士怎么與圖靈獎(jiǎng)得主合作？和學(xué)術(shù)大佬合作與和資本大佬合作，哪個(gè)更難？

19:37 創(chuàng)業(yè)這一年時(shí)間軸：ChatGPT激活資本、人才變量，我在硅谷做了一筆精確計(jì)算

22:28 Timing很重要，第一筆融資的窗口很短，只有一個(gè)月

27:54 怎么搭建AGI團(tuán)隊(duì)？現(xiàn)在有80人

30:21 卡的問(wèn)題有很多back and forth，接下來(lái)一兩年不會(huì)成為很大瓶頸

32:13 為什么月之暗面做to C且只做to C？（long context與Kimi智能助手背后的技術(shù)產(chǎn)品思考）

37:39 你認(rèn)可說(shuō)“國(guó)產(chǎn)大模型公司去年追趕GPT-3.5，今年追趕GPT-4，沒有本質(zhì)差異”這種說(shuō)法嗎？——這句話是對(duì)的，但也是片面的

39:17 追趕GPT-4是國(guó)產(chǎn)大模型的必經(jīng)之路，但也要做非共識(shí)的新維度

40:53 不認(rèn)同2023年下半年大模型市場(chǎng)轉(zhuǎn)冷的判斷，我們下半年確實(shí)也完成了融資

42:57 登月第一步是長(zhǎng)文本，第二步呢？接下來(lái)會(huì)有兩個(gè)最重大的技術(shù)milestone

44:21 只有一個(gè)顛覆性的東西，才配得上AGI這三個(gè)字，否則我們今天說(shuō)的都沒意義

45:34 我對(duì)PMF、落地場(chǎng)景和應(yīng)用的看法（“應(yīng)用”不是個(gè)準(zhǔn)確的詞，聽起來(lái)更像目的——應(yīng)該既是手段、也是目的）

46:54 User的scaling和Model的scaling這兩件事應(yīng)該同時(shí)做，降維打擊發(fā)生過(guò)太多次

48:54 為什么開源追不上閉源？現(xiàn)在開源的方式和以前不一樣了，它本身還是中心化

49:48 AI不是這一兩年找到什么PMF，而是未來(lái)十年二十年能做什么改變世界

51:48 怎么對(duì)抗國(guó)內(nèi)的焦慮情緒？大模型創(chuàng)業(yè)中的長(zhǎng)短期平衡——如果沒有長(zhǎng)期，你會(huì)錯(cuò)過(guò)整個(gè)時(shí)代

57:41 回顧2023年的曲折、變量和預(yù)料之外

60:30 怎么看幾個(gè)市場(chǎng)上的幾個(gè)觀點(diǎn)（包括Yann LeCun、Geoffrey Hinton、陸奇）

62:25 現(xiàn)在的大模型公司配比：一半實(shí)驗(yàn)室，一半商業(yè)公司

64:20 怎么看大模型創(chuàng)業(yè)公司和巨頭的關(guān)系

68:05 以上是對(duì)楊植麟的第一次訪談，接下來(lái)是過(guò)完年后的第二次。這次我們重點(diǎn)聊了OpenAI重磅發(fā)布Sora的技術(shù)觀點(diǎn)和對(duì)2024年的全球大模型產(chǎn)業(yè)預(yù)測(cè)

68:24 Sora有多少在你的意料之中，多少在你的意料之外？

69:17 Sora解決掉的技術(shù)問(wèn)題：能在一個(gè)比較長(zhǎng)的時(shí)間窗口保持生成的一致性

69:40 Sora對(duì)于全球產(chǎn)業(yè)格局意義是什么？2024年大模型會(huì)有哪些新敘事？

71:57 視頻生成之前的關(guān)鍵技術(shù)瓶頸，更unified architecture（統(tǒng)一的架構(gòu)）仍然沒有被解決

73:04 解讀OpenAI關(guān)于Sora報(bào)告：《Video generation models as world simulators》

74:30 怎么看Yann LeCun對(duì)生成式AI的新觀點(diǎn)（“通過(guò)生成像素對(duì)世界進(jìn)行建模是一種浪費(fèi)，并且注定會(huì)失敗”）

77:45 Sora是視頻生成的GPT-3.5時(shí)刻

78:37 為什么不同模態(tài)放在同一個(gè)模型里那么難？Sora + GPT會(huì)出現(xiàn)什么？

80:40 兩個(gè)世界差得越來(lái)越遠(yuǎn)了嗎？

83:41 2024年的全球大模型產(chǎn)業(yè)預(yù)測(cè)

【更多信息】

本集首發(fā)于騰訊新聞

聯(lián)絡(luò)我們：微博@張小珺-Benita

更多信息歡迎關(guān)注公眾號(hào)：張小珺

用戶評(píng)論

表情0/300

杠杠開始

William Cohen是principal scientist 這個(gè)詞翻譯成首席科學(xué)家有歧義聽起來(lái)好像在最頂層他現(xiàn)在帶5個(gè)研究員上面到deep mind的ceo還有4層report 他同層的還有幾個(gè)也是這個(gè)title的就是個(gè)層級(jí)職位而已怎么翻譯準(zhǔn)確嗎主任科學(xué)家比較好些

2024-03舉報(bào)回復(fù)贊

杠杠開始

男嘉公司網(wǎng)站在手機(jī)顯示不優(yōu)化啊加油啊