1 月 27 日消息,OpenAI 近日發(fā)布新聞稿,在更新 GPT-4 Turbo 預(yù)覽模型之外,還下調(diào) API 調(diào)用價格,優(yōu)化現(xiàn)有模型性能,并發(fā)布全新嵌入性模型。
OpenAI 今天一口氣宣布了 5 個新模型,包括兩個文本嵌入模型、升級的 GPT-4 Turbo 預(yù)覽版和 GPT-3.5 Turbo、一個審核模型。
更新 GPT-4 Turbo 預(yù)覽模型
OpenAI 根據(jù)開發(fā)者對早期預(yù)覽版的反饋,發(fā)布了 gpt-4-0125-preview 預(yù)覽模型,重點修復(fù)了模型的“變懶”情況,能更徹底地完成代碼生成等任務(wù)。
新預(yù)覽版還改善了對非英語生成問題的支持,引入“gpt-4-turbo-preview”模型別名,可自動指向最新的預(yù)覽版。
OpenAI 還計劃在未來幾個月內(nèi)全面推出帶有視覺功能的 GPT-4 Turbo。
定價更低的新嵌入模型
OpenAI 還引入了兩種新的嵌入模式,一種是體積更小、效率更高的 text-embedding-3-small 模型,另一種是體積更大、功能更強的 text-embedding-3-large 模型。
嵌入(embedding)是表示自然語言或代碼等內(nèi)容中概念的數(shù)字序列。機器學(xué)習(xí)模型和其他算法通過嵌入,可以更容易理解內(nèi)容之間的關(guān)聯(lián),也更容易執(zhí)行聚類或檢索等任務(wù)。
ChatGPT 和 Assistants API 中的知識檢索等應(yīng)用,以及許多檢索增強生成(RAG)開發(fā)工具都使用到了嵌入這個概念。
text-embedding-3-small
相比較 2022 年 12 月發(fā)布的 text-embedding-ada-002 模型,text-embedding-3-small 性能和效率大幅提升。
性能方面,text-embedding-3-small 在多語言檢索常用基準(MIRACL)的平均得分從 31.4% 提高到 44.0%,而英語任務(wù)常用基準(MTEB)的平均得分從 61.0% 提高到 62.3%。
定價方面,text-embedding-3-small 的定價是 text-embedding-ada-002 的五分之一,從每 1k token 0.0001 美元降至 0.00002 美元。
text-embedding-3-large
text-embedding-3-large 是 OpenAI 新推出的性能最佳的模型。將 text-embedding-ada-002 與 text-embedding-3-large 進行比較:在 MIRACL 上,平均得分從 31.4% 提高到 54.9%,而在 MTEB 上,平均得分從 61.0% 提高到 64.6%。
text-embedding-3-large 的價格為每 1k token 售價 0.00013 美元。
原生支持 shortening
允許開發(fā)人員以降低存儲和計算需求來換取一定的準確性。簡單地說,保持主旨不變的情況下,shortening 就像從一個復(fù)雜的標簽中去掉一些不那么重要的細節(jié)。
GPT-3.5 Turbo
在 API 領(lǐng)域,GPT-3.5 Turbo 同樣表現(xiàn)不俗。在執(zhí)行各類任務(wù)時,它不僅能夠提供比 GPT-4 更低的成本,還能保證更快的執(zhí)行速度。
因此,對于那些付費用戶來說,此次輸入價格下調(diào) 50%、輸出價格下調(diào) 25% 無疑是一大利好。
具體來說,新的輸入價格定格在每 1k token 價格為 0.0005 美元,而輸出價格則為每 1k token 價格為 0.0015 美元。