當(dāng)?shù)貢r(shí)間7月18日,OpenAI正式推出新一代入門級(jí)別人工智能模型“GPT-4o mini”,稱這款新模型是“功能最強(qiáng)、性價(jià)比最高的小參數(shù)模型”,旨在服務(wù)更廣泛的客戶群體。這也意味著開(kāi)發(fā)人員如今有了一種輕量級(jí)且廉價(jià)的工具,讓他們能夠以更低的成本構(gòu)建AI應(yīng)用程序。
外媒報(bào)道中稱,目前,GPT-4o mini模型的應(yīng)用程序編程接口支持文本和視覺(jué),未來(lái)將支持文本、圖像、視頻和音頻的輸入和輸出。
更重要的是,最新的GPT-4o mini比GPT-4o便宜了96% ~97%,比起GPT-3.5 Turbo也要便宜60%~70%。正因如此,隨著GPT-4o mini上架,GPT-3.5Turbo的歷史使命到此結(jié)束。OpenAI還表示,GPT-4o mini是首個(gè)使用其全新安全策略“指令層級(jí)”的AI模型。
對(duì)于為何未能更早推出“小而精”的AI模型,OpenAI的API產(chǎn)品負(fù)責(zé)人Olivier Godement表示,這純粹是優(yōu)先級(jí)的問(wèn)題,隨著時(shí)間的推移,OpenAI注意到開(kāi)發(fā)人員越來(lái)越渴望使用較小的模型,這也讓公司決定投入資源開(kāi)發(fā)GPT-4o mini。
近日,OpenAI正式推出“GPT-4o mini”,稱這款新模型是“功能最強(qiáng)、性價(jià)比最高的小參數(shù)模型”,旨在服務(wù)更廣泛的客戶群體。圖為OpenAI首席執(zhí)行官阿爾特(10.500, 0.00, 0.00%)曼。 視覺(jué)中國(guó)(11.040, 0.00, 0.00%)圖
同級(jí)別價(jià)位最低
據(jù)OpenAI,GPT- 4o mini的API價(jià)格將會(huì)是15美分/100萬(wàn)Tokens輸入,以及60美分/100萬(wàn)Tokens輸出。上下文窗口依然是12.8萬(wàn)個(gè)Tokens,知識(shí)截至日期為2023年10月。公司拒絕透露新模型的參數(shù)量大小,僅表示與市面上類似的AI小模型處于同一個(gè)級(jí)別。
作為對(duì)比,GPT-4o的百萬(wàn)Tokens輸入和輸出價(jià)格分別是5美元和15美元,之前的入門款模型GPT-3.5 Turbo定價(jià)分別是0.5美元和1.5美元。這就是說(shuō),最新的“迷你模型”的價(jià)格比GPT-4o便宜了96%~97%,比起GPT-3.5 Turbo也要便宜60%~70%。正因如此,隨著GPT-4o mini上架,GPT-3.5 Turbo的歷史使命到此結(jié)束。
根據(jù)Artificial Analysis的統(tǒng)計(jì),GPT-4o mini已經(jīng)達(dá)到美國(guó)AI公司主流“小模型”里面價(jià)格最低的位置,比起Anthropic、谷歌的同類型競(jìng)品都要便宜一截。
OpenAI稱,最新的GPT-4o mini從18日起向ChatGPT的免費(fèi)用戶以及ChatGPT Plus和ChatGPT Team的訂閱用戶開(kāi)放,并將在其后一周向ChatGPT Enterprise用戶開(kāi)放。GPT-4o mini將取代ChatGPT中的舊模型GPT-3.5 Turbo。
OpenAI 表 示 ,GPT- 4o mini目前在聊天偏好上的表現(xiàn)優(yōu)于GPT-4,在大規(guī)模多任務(wù)語(yǔ)言理解測(cè)試(MMLU)中的得分為82%。MMLU是一個(gè)文本智能和推理基準(zhǔn),用于評(píng)估語(yǔ)言模型的能力。MMLU分?jǐn)?shù)越高,越能表明該模型可以更好地理解和使用各種領(lǐng)域的語(yǔ)言,從而增強(qiáng)現(xiàn)實(shí)世界的應(yīng)用。
而在這項(xiàng)測(cè)試中,同為小參數(shù)模型的谷歌Gemini Flash得分為77.9%,Claude Haiku得分為73.8%。在更大參數(shù)的模型中,GPT-3.5在這項(xiàng)測(cè)試中的得分為70%,GPT-4o得分為88.7%,谷歌Gemini Ultra據(jù)稱取得了有史以來(lái)最高分(90%)。
值得注意的是,研究人員對(duì)像MMLU這樣的基準(zhǔn)測(cè)試持謹(jǐn)慎態(tài)度,因?yàn)椴煌镜墓芾矸绞铰杂胁煌,因此不同模型的得分難以比較。還有一個(gè)問(wèn)題是,模型的數(shù)據(jù)庫(kù)中可能有這些答案,也就是說(shuō)可以作弊,而且通常沒(méi)有第三方評(píng)估人員參與這個(gè)過(guò)程。
入局小模型的背后
外媒報(bào)道中稱,GPT- 4o mini的推出也是OpenAI推動(dòng)“多模態(tài)”(multimodality)技術(shù)發(fā)展努力的一部分,多模態(tài)指的是在一個(gè)大模型中提供多種類型的AI生成媒體,如文本、圖像、音頻和視頻。
不僅如此,這一全新小模型也承載著幫助OpenAI走入更廣泛的客戶群體的期望。OpenAI在今年早些時(shí)候的最新一輪融資過(guò)后,估值已經(jīng)超過(guò)800億美元。雖然是全球生成式AI領(lǐng)域估值最高的“獨(dú)角獸”,但OpenAI仍面臨壓力:一方面要保持其在生成式AI市場(chǎng)的領(lǐng)先地位;另一方面,由于其在AI基礎(chǔ)設(shè)施上投入了大量資金以構(gòu)建和訓(xùn)練模型,因此還要想方設(shè)法盈利。
GPT-4o mini為開(kāi)發(fā)人員提供一種輕量級(jí)且廉價(jià)的工具,讓他們能夠開(kāi)發(fā)出所有的應(yīng)用程序和工具。相對(duì)而言,GPT-4這種更大、更昂貴的模型是他們無(wú)法負(fù)擔(dān)得起的。此前,許多開(kāi)發(fā)人員選擇轉(zhuǎn)向Claude 3 Haiku或Gemini 1.5 Flash。
而且,GPT-4o mini是首個(gè)使用OpenAI全新安全策略“指令層級(jí)”的AI模型。這種方法的目的是使AI系統(tǒng)優(yōu)先處理某些指令——例如來(lái)自公司的指令。
OpenAI的API產(chǎn)品負(fù)責(zé)人Olivier Godement在接受媒體采訪時(shí)解釋了為何該公司未能更早推出“小而精”的AI模型,他說(shuō),這純粹是優(yōu)先級(jí)的問(wèn)題,因?yàn)镺penAI專注于創(chuàng)建更大、更好的模型,如GPT-4,這需要大量的人力和計(jì)算資源。隨著時(shí)間的推移,OpenAI注意到開(kāi)發(fā)人員越來(lái)越渴望使用較小的模型,因此公司認(rèn)為現(xiàn)在是投入資源開(kāi)發(fā)GPT-4o mini的時(shí)機(jī)。
“我們的使命是使用最前沿技術(shù)、構(gòu)建最強(qiáng)大、最有用的應(yīng)用程序,我們當(dāng)然希望繼續(xù)做前沿模型,推動(dòng)技術(shù)進(jìn)步!監(jiān)penAI的API產(chǎn)品負(fù)責(zé)人Olivier Godement在接受媒體采訪時(shí)說(shuō):“但我們也希望擁有最好的小模型,我認(rèn)為它會(huì)非常受歡迎!
“我認(rèn)為GPT-4o mini真正體現(xiàn)了OpenAI讓AI更加普及的使命。如果我們希望AI惠及世界的每一個(gè)角落,每一個(gè)行業(yè),每一個(gè)應(yīng)用,我們必須讓AI更加實(shí)惠!盙odement說(shuō)道。
目前,金融科技初創(chuàng)公司Ramp已經(jīng)使用GPT-4o mini構(gòu)建了一個(gè)工具,可以提取收據(jù)上的費(fèi)用數(shù)據(jù)。用戶無(wú)須費(fèi)力地瀏覽文本框,只需上傳一張收據(jù)的圖片,該模型就會(huì)進(jìn)行分類。
電子郵件客戶端Superhuman也對(duì)GPT-4o mini進(jìn)行了測(cè)試,并用它創(chuàng)建了一個(gè)自動(dòng)建議郵件回復(fù)的功能。