阿里360月之暗面角逐長文本 記者實測國內(nèi)大模型長文本哪家強

2024-03-26 17:39:0110:41 212
所屬專輯:貝殼財經(jīng)
聲音簡介

大模型應用Kimi智能助手火了,隨之“Kimi概念股”華策影視在3月20日至22日連續(xù)三天20%的漲停板。消息面上,其運營公司月之暗面3月18日宣布Kimi長上下文窗口技術突破至200萬字。

但200萬字并非大語言模型的極限。3月22日,阿里云旗下的通義千問宣布“重磅升級”,向所有人免費開放1000萬字的長文檔處理功能。3月23日凌晨,360智腦也宣布繼2月29日360AI瀏覽器開放100萬字長文本閱讀功能之后,500萬字長文本處理功能也即將入駐。

巨頭鏖戰(zhàn)為何選擇長文本,大模型長文本能力靠的是什么?3月24日至26日,新京報貝殼財經(jīng)記者采訪了多位大模型行業(yè)從業(yè)人員、學者,了解到大模型要實現(xiàn)長文本功能在算法和算力上都面臨著挑戰(zhàn),但在上線長文本功能上,通過調(diào)優(yōu)算法或者通過算力“大力出奇跡”甚至使用RAG,都可以打造出該體驗。

因此,貝殼財經(jīng)記者對目前支持上傳文檔分析的大模型進行了實測,包括Kimi、智譜清言、通義千問、文心一言、訊飛星火和360瀏覽器AI助手,發(fā)現(xiàn)目前雖然許多大模型都能夠分析文檔,但生成的內(nèi)容質(zhì)量良莠不齊,上傳文件大小或上傳文件格式也存在限制。

為何選擇長文本?長是否可保證“精”?

實際上,各個大模型對長文本的爭奪很早就開始了。百川智能、零一萬物等都曾以長文本領先業(yè)界為其宣傳噱頭,“可以上傳一部《三體》”“可上傳《百年孤獨》”。

不過,在實際應用上因長文本等功能率先在關注度上“脫穎而出”的還是月之暗面旗下的Kimi智能助手。根據(jù)七麥數(shù)據(jù),該APP在效率排名從1月14日的436名提升至3月19日的11名。2月份訪問量達到近300萬次,流量增長104.99%。分別位列AI產(chǎn)品國內(nèi)總榜Top3和全球增速榜Top1。其還引發(fā)了“Kimi概念股”的走紅。

對于長文本功能,月之暗面CEO楊植麟很早就提出了自己的設想,“通往通用人工智能的話,無損的長上下文將會是一個很關鍵的基礎技術。歷史上所有的模型架構(gòu)演進,本質(zhì)上都是在提升有效的、無損的上下文長度。上下文長度可能存在摩爾定律,但需要同時優(yōu)化長度和無損壓縮水平兩個指標,才是有意義的規(guī)?;??!?/p>

在他看來,長文本作為月之暗面“登月”的第一步,是新的計算機內(nèi)存,很本質(zhì),個性化并非通過微調(diào)實現(xiàn),上下文定義了個性化過程。楊植麟還認為,大模型的馬拉松剛開始,接下來會有更多差異化。

對于長文本功能,中國人民大學高瓴人工智能學院長聘副教授,曾主導研發(fā)算法生成人類史上第一本人工智能詩集《陽光失了玻璃窗》的宋睿華告訴貝殼財經(jīng)記者,長窗口在計算效率上有一些挑戰(zhàn),但技術進步也不是線性的,月之暗面解決掉一些性能上的問題,確實可以一下子做到很長。另外,和它專注做長窗口有關,其他一些模型可能覺得那么長沒有太多需求。

不過,隨著Kimi的持續(xù)火爆,越來越多的大模型也開始了長文本領域的“軍備競賽”:3月18日至23日,Kimi和通義千問、360AI瀏覽器先后宣布將支持200萬、1000萬以及500萬字的長文本功能。其中,Kimi和360AI瀏覽器的相關功能處于內(nèi)測和“即將推出”狀態(tài),而通義千問已經(jīng)可以直接支持1000萬字的文檔上傳了。

對此,新京報貝殼財經(jīng)記者將一部400萬字左右的網(wǎng)絡小說《詭秘之主》TXT文檔上傳至了通義千問,并對其提出了問題,通義千問很快做出了回復,不過其內(nèi)容并非百分之百準確,如其在回答中搞混了該小說中“途徑”和“序列”的區(qū)別,不過對于一些重點問題還是給出了正確的回答。

而記者將同樣的文檔上傳至Kimi智能助手和360AI瀏覽器,則發(fā)現(xiàn)該文檔字數(shù)超過了Kimi的字數(shù)限制,Kimi只能閱讀前4%的內(nèi)容,不過其回答得更加詳細。而360AI瀏覽器則不支持上傳TXT或Word格式,只支持上傳PDF格式。

3月24日,某大模型廠商研究機構(gòu)負責人告訴新京報貝殼財經(jīng)記者,長文本的挑戰(zhàn)在算法上主要是要加大訓練參數(shù)規(guī)模的問題,大模型的本質(zhì)是算概率,長文本的學習主要依靠對復雜文本的概率模型變化,所以為了保證效率算法調(diào)優(yōu)是關鍵,當然如果算法搞不定也可依靠算力大力出奇跡,因此大廠通過“堆資源”的方式很快就能挑戰(zhàn)Kimi的長文本功能。

有AI大模型的用戶表示,長文本功能在許多場景都極具吸引力,如從冗長的公司財報中找到有價值的信息、上傳自己撰寫的小說尋求修改意見、總結(jié)會議紀要內(nèi)容等,但對于一些對內(nèi)容準確度要求高的工作,大模型還只能起到輔助作用,畢竟由于AI生成本身的“幻覺”問題,難保不會出現(xiàn)數(shù)據(jù)錯誤,因此還需要人最后再檢查一遍。

實測長文本能力:總結(jié)書籍、財報各有千秋 遺忘問題難解

貝殼財經(jīng)記者發(fā)現(xiàn),目前大多數(shù)大模型已經(jīng)支持文本上傳功能,例如對于12萬字左右的PDF格式《中國移動有限公司2023年年度報告》,文心一言、360AI瀏覽器、Kimi、訊飛星火均可以進行分析,而智譜清言可以上傳但顯示“本次回答已被終止”,通義千問也可以上傳但顯示“由于當前的交互模式限制,我無法直接訪問或解析PDF文件內(nèi)容。”

記者橫向比較財報分析內(nèi)容發(fā)現(xiàn),當要求“根據(jù)財報文檔分析中國移動業(yè)績情況,以及其營收的主要增長點”時,大部分模型都給出了最重要的營收和凈利潤數(shù)據(jù),不過在分析營收增長點時,不同的大模型側(cè)重點也不同,如Kimi側(cè)重于個人市場、家庭市場、政企市場的營收,文心一言和訊飛星火均側(cè)重于無線上網(wǎng)業(yè)務、有線寬帶業(yè)務的營收,360則泛泛提到了營收正在增長。

而對于8萬字的Word格式《牛津通識讀本》,上述大模型中除360AI瀏覽器不支持該格式上傳外,其余大模型均可以進行內(nèi)容總結(jié)和分析,其中總結(jié)的內(nèi)容大同小異。

對于長文本能力的測試,AI科學家、硅谷創(chuàng)業(yè)者賈揚清認為,從嚴謹科研的角度,目前大海撈針的benchmark已經(jīng)無法準確評價算法的優(yōu)勢。他認為,可以寫一份從1到9999的數(shù)列,并隨機在中間調(diào)換兩個數(shù)字的位置,然后讓大模型來尋找順序錯亂的一個,“目前還沒有找到穩(wěn)定能成功的大模型”。

對此,貝殼財經(jīng)記者準備了包含從1到999順序排列數(shù)字的一行Word文檔,并將其中569和568兩個數(shù)字的順序?qū)φ{(diào),結(jié)果發(fā)現(xiàn)上述大模型中,360AI瀏覽器和通義千問無法解析內(nèi)容,訊飛星火先顯示只能“數(shù)”到527后表示沒有兩個順序不同的數(shù)字,而Kimi則“一口咬定”順序不同的數(shù)字是21和22以及999和1000。只有智譜清言和文心一言給出了正確的答案。

對于大模型的長文本能力,有致力于云廠商AI生態(tài)合作的從業(yè)者對貝殼財經(jīng)記者表示,其實很多AI可以做成怎么樣,看學術論文就能看到方法,但確實要實現(xiàn)方法不是人人都能做到,做到的效果也未必都一致,并不一定是越長越好,“現(xiàn)在宣傳的長文本并不等于該公司有那么長文本的模型。對用戶界面就是上傳個PDF之類的,并不能看出背后的模型的能力。不排除是用RAG或其他方式打造出來的體驗?!?/p>

在采訪中,有多位AI從業(yè)者認為,目前,長文本能力或可以成為大模型公司吸引市場關注,贏得競爭的路徑之一,不過要做好“長”“準”、成本三者之間的平衡,還需要不斷摸索。

記者聯(lián)系郵箱:luoyidan@xjbnews.com

用戶評論

表情0/300
喵,沒有找到相關結(jié)果~
暫時沒有評論,下載喜馬拉雅與主播互動
猜你喜歡
反面角色

愛在點滴之間蔓延,一座城承載著太多的回憶,甜蜜亦或痛苦,流轉(zhuǎn)于時空之中,許多人在愛恨之間彷徨。愛情雖是兩個人的互生情愫,難度卻等同于你我的曲高和寡,孤獨感始終如...

by:華語音樂

阿里里

有美人兮,見之不忘,一日不見兮,思之如狂。

by:華語音樂

阿里局

這是一部鮮為人知的阿里巴巴早期創(chuàng)業(yè)史。作者憑一人之力,前后采訪了數(shù)十人,歷經(jīng)兩年多的調(diào)研、訪談、資料收集,歷時一年多的寫作,全景式揭開了奠定阿里巴巴的基石——中...

by:社群空間站蔣蔣

阿里傳:這是阿里巴巴的世界

你只知道阿里巴巴故事的中國部分,而這本書會完整呈現(xiàn)故事的全部。波特?埃里斯曼是阿里巴巴創(chuàng)業(yè)時期為數(shù)不多的外國高管。他于2000~2008年在阿里巴巴擔任副總裁,...

by:啟辰說過要聽話

阿里鐵軍《阿里局》讀書分享

一段被忽略多年、淹沒在主流視角之外的隱秘創(chuàng)業(yè)史,一群銷員年輕人的成長故事。

by:實用哲學

拳王阿里

入門級英語聽力材料

by:英語主播Charlie

阿里影說家

用于展示學員日常訓練的音頻

by:聽友78848236

阿里巴巴

我們還能相信馬云嗎?阿里巴巴還能重拾輝煌嗎?

by:自身規(guī)律老K

阿里元老張璞:阿里巴巴創(chuàng)業(yè)干貨

阿里巴巴一次次創(chuàng)造奇跡的故事,大家已經(jīng)都很熟悉了。但從親歷者的角度,講述阿里巴巴在一次次的困境中,員工如何面對挑戰(zhàn),管理層如何掙扎決策,才有了呈現(xiàn)在大眾面前的一...

by:量子教育官方