據(jù)科技媒體The Information報道,OpenAI神秘“草莓”項目,計劃最早今年秋季推出!
上個月,OpenAI的內(nèi)部團隊被曝出正開發(fā)的“草莓”(Strawberry)項目,目的是增強OpenAI的模型的推理能力,處理復(fù)雜科學(xué)和數(shù)學(xué)問題的能力,讓大模型不僅能生成查詢答案,還能提前規(guī)劃,以便自主、可靠地瀏覽互聯(lián)網(wǎng),進行OpenAI 定義的“深度研究”。
奧特曼曾強調(diào),今后AI發(fā)展的關(guān)鍵將圍繞推理能力展開。
推理能力史上最強!正為新一代旗艦?zāi)P吞峁┯?xùn)練數(shù)據(jù)
而這個“草莓”項目的前身是Q*算法模型,Q*能夠解決棘手的科學(xué)和數(shù)學(xué)問題。而數(shù)學(xué)是生成式AI發(fā)展的基礎(chǔ),如果AI模型掌握了數(shù)學(xué)能力,將擁有更強的推理能力,甚至可以解決從未見過的數(shù)學(xué)問題或者自發(fā)解決變成問題,與人類智能相媲美。而這一點也是目前的大語言模型還無法做到的。
據(jù)悉,推出“草莓”項目被認為是OpenAI爭奪AI領(lǐng)域霸主地位的關(guān)鍵一步,旨在為解決多步驟任務(wù)的代理產(chǎn)品做貢獻。
不過,報道同時指出,OpenAI的前景還有部分取決于其目前正在開發(fā)的、代號為Orion的新旗艦大模型。該模型將在去年年初推出的旗艦大模型GPT-4的基礎(chǔ)上有所優(yōu)化,目前市面上的大模型性能水平幾乎和GPT-4持平。
據(jù)知情人士向The Information透露,OpenAI正在使用更大版本的“草莓”生成提供給Orion的訓(xùn)練用數(shù)據(jù),這種由AI生成的訓(xùn)練數(shù)據(jù)也被稱作“合成數(shù)據(jù)(synthetic)”,有望幫助OpenAI提升獲取高質(zhì)量數(shù)據(jù)的能力。
代理初創(chuàng)公司Minion AI的首席執(zhí)行官、GitHub Copilot的前首席架構(gòu)師Alex Graveley表示,使用Strawberry生成更高質(zhì)量的訓(xùn)練數(shù)據(jù)可以幫助OpenAI減少其模型產(chǎn)生的錯誤數(shù)量,也就是所謂的AI幻覺。