Kimi爆火,國產大模型突然開始“卷”長文本。
接連兩日,阿里巴巴、360等互聯(lián)網大廠相繼官宣1000萬字、500萬字的長文本處理能力,另有消息稱,百度也將開放長文本能力,文字范圍會在200萬字-500萬字。
一場圍繞著Kimi的“圍剿戰(zhàn)”正在上演。
在上述已經官宣具備長文本能力的三款明星產品上,就目前公測版本而言,新浪科技分別做了三個樣本試驗:在總結《三體2:黑暗森林》和《未來簡史》時,Kimi只能解讀52%和66%文本內容,而另兩家分別達到100%解讀。這也意味著,在最常見的解讀小說、暢銷書環(huán)節(jié),目前Kimi并沒有優(yōu)勢,甚至在某些功能上與大廠大模型仍有差距。
有AI大模型行業(yè)投資人向新浪科技直言,“長文本在技術圈里并不稀奇,并沒有想象中那么難”。此前受限于長文本對算力消耗極大且成本較高,導致入局者較少,“資本關注,現在不得不入局開卷”。
此外他透露,目前Kimi投放廣告的獲客成本約在10元,如果算上拉新后用戶問答互動產生的算力成本,每個用戶的獲客成本達到12-13元。根據第三方平臺的下載量預估,近一個月來,Kimi在蘋果端和安卓端的日均下載量為17805。按此計算,Kimi每天的獲客成本將燒掉至少20萬元。
長文本解析,哪家強?
事實上,長文本處理這項技術也許并不稀缺。在短時間內,阿里和360相繼宣布開放這一功能,就可佐證。
根據阿里巴巴官方消息,阿里通義千問向所有人免費開放1000萬字的長文檔處理功能,成為全球文檔處理容量第一的AI應用。幾小時后,360宣布智腦正式內測500萬字長文本處理功能,該功能入駐360AI瀏覽器。
就目前公測版本而言,Kimi、360、阿里,誰的長文本處理能力更強?新浪科技分別進行了三組試驗:
樣本一:暢銷書《未來簡史》;
樣本二:暢銷書《三體2:黑暗森林》;
樣本三:Sora英文論文《大型視覺模型背景、技術、局限性和機遇綜述》。
(Kimi總結《三體2:黑暗森林》,只能閱讀52%)
(通義千問總結《三體2:黑暗森林》)
(360瀏覽器AI助手總結《三體2:黑暗森林》)
簡要總結:在實驗一和實驗二中,Kimi僅能解讀前兩者52%和66%文本內容,從文本解讀的完成度上明顯落后兩者;解析內容層面,三者都有各自的總結,360增設了摘要和思維導圖等能力。
此外,在聯(lián)網搜索等方面,Kimi所展現出的能力也存在一定局限。
引爆A股,有何過人之處?
不過毫無疑問的是,“月之暗面”仍然是當下最炙手可熱的AI企業(yè)。從資方背景來看,包括阿里、紅杉中國、小紅書、美團等在內的頂級互聯(lián)網巨頭加持,更是讓這家剛A輪的AI科技企業(yè),增添了許多神秘。
除了頭部互聯(lián)網產業(yè)資本一直看好外,目前月之暗面?zhèn)涫荜P注還有三方面原因:
第一,公司創(chuàng)始團隊年輕且富才學。公司創(chuàng)始人楊植麟為中國35歲以下NLP領域引用最高的研究者,Transformer-XL和XLNet兩篇論文的第一作者,兩者均為大語言模型領域的核心技術。公司另外兩位聯(lián)合創(chuàng)始人周昕宇和吳育昕也在大模型道路上探索多年。
第二,Kimi作為一款由初創(chuàng)企業(yè)打造的產品,快速獲得了市場關注,日活不斷逼近豆包、文心一言等大廠產品。據華福AI互聯(lián)網團隊公布數據,截至今年3月3日,Kimi小程序+網頁+App用戶日活90.38萬人,相較于豆包網頁+App日活268萬人,和文心一言網頁+App日活233萬人,差距正不斷縮小。
第三,去年10月,Kimi發(fā)布時僅能夠支持20萬字的無損上下文輸入,但半年后,公司近期再次宣布內測支持200萬字的無損上下文輸入能力,短期內文本處理能力提升10倍,技術迭代進展飛快。
一系列“振奮人心”的消息沖擊下,Kimi儼然成為ChatGPT之后國內最值得關注的現象級AI產品,因此也迎來了A股市場的熱捧。近日,A股與Kimi存在關聯(lián)關系的華策影視(10.040, -1.02, -9.22%)、掌閱科技(33.130, 0.64, 1.97%)、中廣天擇(38.880, -3.71, -8.71%)、海天瑞聲(87.190, -5.52, -5.95%)等多只個股漲停。
然而,Kimi的技術突破,與A股市場Kimi關聯(lián)企業(yè)的市值暴漲真的存在關聯(lián)嗎?答案也許是否定的。
在與新浪科技溝通中,便有金融行業(yè)從業(yè)者表示,Kimi概念股暴漲,“本質就是股市炒概念的套路,沒有太多底層邏輯性!痹谒磥,“券商研究員基本的操作就是找熱點,然后把一些消息釋放出去,讓散戶抄起來,然后機構退出賺錢,自己則從中獲得對沖基金的派點,就是這么一個邏輯!
對于Kimi所擅長的長文本處理能力,另有某國內知名大模型創(chuàng)企投資人李良(化名)對新浪科技表示,“長文本這個東西在技術圈并不稀奇,大家想做就能做!钡珵槭裁创蠹叶疾蛔瞿兀坷盍嫉慕忉屖,“最根本的原因還是長文本對算力消耗極大,成本太高了,目前入局也是不得已的選擇”。
大模型投資人:商業(yè)模式仍是最大問題
在李良看來,“從傳播定位角度來看,一個產品只抓住一個點去宣傳,確實更容易深入人心,讓人家記住,現在大模型可以拿出來宣傳主要就是長文本和多模態(tài)理解,kimi更側重長文本,因此也更容易被外界關注到!钡S著后續(xù)互聯(lián)網大廠們開始發(fā)力長文本處理,Kimi的情況,可能會因此變差。
他進一步解釋道,“Kimi能夠提供的長文本處理能力,通義千問、360智腦等競爭對手其實也能夠提供,因此只要這些大廠一天不收費,那這類產品就收不了錢,所以它就只能一直虧錢虧下去,這是我們從投資人角度看到它商業(yè)模式最大的一個問題。”
“可能你給它一本小說,讓它去概括一下,它就得花5-10元,但你卻沒付錢給它。”李良指出,“目前Kimi投放廣告獲客成本約在10元左右,如果算上拉新后用戶問答互動產生的算力成本,每個用戶的獲客成本可能達到12-13元!
據七麥數據下載量預估,近一個月來,Kimi 在App Store日均下載量5445,在安卓端全渠道日均下載量12360,合計日均下載量為17805。按此計算,Kimi每天在安卓+iOS端獲客成本便將達21.366萬-23.147萬。如果再加上網頁及小程序等其他渠道獲客增長,Kimi每月的獲客成本不在小數。
“如果Kimi一直持續(xù)這樣的模式,卻找不到新的創(chuàng)收渠道,這樣的做法無異于‘燒錢賺吆喝’!崩盍纪嘎叮霸谠轮得娼讷@得的10億美元融資中,其中第一期交割的8億美元融資中,阿里領投了7.9億美元融資,其中有6億美元是必須放在共管賬號中,必須消耗阿里云相關服務的!
“如果他們后續(xù)無法創(chuàng)造能夠盈利的商業(yè)模式,最終的宿命,可能也就是被并購成為阿里的一部分。”李良猜測道。