首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 云計算 >> 正文

GPT的狂飆進(jìn)化,離不開這種底層能力

2023年3月16日 15:49  CCTIME飛象網(wǎng)  

飛象網(wǎng)訊 3月15日凌晨,OpenAI 發(fā)布了多模態(tài)預(yù)訓(xùn)練大模型 GPT-4。GPT-4 實現(xiàn)了以下幾個方面的飛躍式提升:圖片輸入和識別能力;文字輸入限制提升至 2.5 萬字;回答準(zhǔn)確性顯著提高;能夠生成歌詞、創(chuàng)意文本,實現(xiàn)風(fēng)格變化。時隔6個月,ChatGPT以它強(qiáng)大的進(jìn)化能力,再次震驚業(yè)界。

16日下午,百度基于文心大模型技術(shù)推出的生成式AI對話產(chǎn)品“文心一言”也橫空出世,“中國版ChatGPT”來了!

ChatGPT是自然語言處理(NLP)下的AI大模型,通過大算力、大規(guī)模訓(xùn)練數(shù)據(jù)突破AI瓶頸。2022年11月,OpenAI推出ChatGPT,ChatGPT基于GPT-3.5,使用人類反饋強(qiáng)化學(xué)習(xí)技術(shù),將人類偏好作為獎勵信號并微調(diào)模型,實現(xiàn)有邏輯的對話能力。根據(jù)《瞭望》新聞周刊3月報道,OpenAI為了讓ChatGPT的語言合成結(jié)果更自然流暢,使用了45TB的數(shù)據(jù)、近1萬億個單詞來訓(xùn)練模型,訓(xùn)練一次的成本高達(dá)千萬美元,一個月的運營成本需要數(shù)百萬美元。

我們在關(guān)注GPT落地場景的同時,也在思考影響GPT未來發(fā)展的各個因素。其中,云計算在GPT(Generative Pre-trained Transformer)技術(shù)發(fā)展中起到了至關(guān)重要的作用,“云”提供的計算資源、網(wǎng)絡(luò)連接、數(shù)據(jù)存儲和管理等方面的優(yōu)勢,使得GPT能夠更快、更準(zhǔn)確地生成自然語言文本,不斷推動著自然語言處理技術(shù)的進(jìn)步和發(fā)展。

1. 大規(guī)模算力

云計算提供了強(qiáng)大、彈性擴(kuò)展的計算資源,這對于GPT的訓(xùn)練和生成文本過程是至關(guān)重要的。GPT的訓(xùn)練需要使用大規(guī)模的計算資源,包括CPU、GPU、TPU等。云計算底層的數(shù)據(jù)中心可以提供高性能的計算機(jī)和硬件設(shè)備,并且可以進(jìn)行優(yōu)化,提高計算資源的利用率,從而加速GPT的訓(xùn)練和生成速度。同時,云計算也可以提供強(qiáng)大的并行計算能力,將多個計算任務(wù)同時分配到不同的計算節(jié)點中進(jìn)行計算,提高訓(xùn)練效率和速度。

2. 數(shù)據(jù)存儲

云計算提供了可靠的數(shù)據(jù)存儲和備份機(jī)制,這可以保證GPT的預(yù)訓(xùn)練數(shù)據(jù)、模型參數(shù)和生成的文本數(shù)據(jù)都得到充分的保護(hù)和管理;防止數(shù)據(jù)丟失或被損壞。同時,還可以提供數(shù)據(jù)安全和隱私保護(hù)服務(wù),確保GPT的數(shù)據(jù)安全和隱私得到充分的保護(hù)。

3. 網(wǎng)絡(luò)帶寬

云計算可以提供高速的網(wǎng)絡(luò)帶寬和存儲設(shè)備來支持GPT的訓(xùn)練和推理。GPT模型的訓(xùn)練和推理需要大量的數(shù)據(jù)傳輸和存儲,而云可以提供高速的網(wǎng)絡(luò)帶寬和存儲設(shè)備來支持模型的訓(xùn)練和推理。這可以顯著提高GPT算力的效率和性能。

4. 電力供應(yīng)

在GPT訓(xùn)練中,電力是一個不可或缺的因素。這是因為GPT模型需要通過大規(guī)模的計算和數(shù)據(jù)傳輸來進(jìn)行訓(xùn)練和推理,這些計算和數(shù)據(jù)傳輸需要大量的能量。因此,云計算基礎(chǔ)設(shè)施的電力供應(yīng)對于GPT的算力和效率具有決定性的影響。

云計算的核心即為通過云端提供海量算力,從這個角度來說,采用云基礎(chǔ)設(shè)施就有了跑通AI算力、AI大模型和生成式AI應(yīng)用的入場券。UCloud作為國內(nèi)領(lǐng)先的云計算廠商,也成為了GPT入口處的鋪路人。

從GPT訓(xùn)練需要的大規(guī)模算力來看,UCloud在國家“東數(shù)西算”樞紐自建的烏蘭察布云基地提供了GPU高性能計算產(chǎn)品,上線了NVIDIA的A100、V100S等諸多推理顯卡,以及AMD的高性能計算顯卡MI100,滿足不同用戶在多場景下的GPU加速需求;同時,基于IB網(wǎng)絡(luò)環(huán)境的多節(jié)點高性能計算集群,更好匹配超高計算性能,實現(xiàn)多節(jié)點間無損通信,滿足用戶多節(jié)點并行計算的場景需求。針對大模型AI訓(xùn)練場景,推出高功率、高配置的算力集群。集群的服務(wù)器搭載8張80G顯存的A100顯卡、配有128C的CPU以及1.5T的大內(nèi)存,節(jié)點間通過無損的IB網(wǎng)絡(luò)連接,可滿足大規(guī)模分布式訓(xùn)練需求。此外,基于A100 Ampere架構(gòu)下MIG切分特性,最多可切分7個實例,可滿足不同的算力需求。

烏蘭察布云基地的金翼UXZone專區(qū)提供基于NVIDIA A800和Mellanox Infiniband網(wǎng)絡(luò)的GPU集群方案,根據(jù)客戶的大模型需求定制專屬資源池,并提供IB網(wǎng)絡(luò)、GPU服務(wù)器的監(jiān)控和運維管理服務(wù)。

UCloud烏蘭察布云基地部署了新一代歸檔存儲產(chǎn)品US3。US3在國內(nèi)首次采用高密JBOD機(jī)型和SMR盤,并采用自研存儲架構(gòu)實現(xiàn)該技術(shù)落地,單位機(jī)架的存儲容量提升5.375倍,磁盤數(shù)量增加59%,單塊磁盤存儲空間提升150%。產(chǎn)品可以兼容SMR、CMR盤、雙活高可用、支持上下電的IO調(diào)度、EC的靈活配置和磁盤故障自動發(fā)現(xiàn)。US3相較標(biāo)準(zhǔn)存儲降低近80%的存儲成本,與市場同類產(chǎn)品相比降低近30%成本,可為GPT需要的海量語料數(shù)據(jù)進(jìn)行存儲和備份,提供更具性價比的備份方案。

烏蘭察布具有豐富、可靠的電力資源。UCloud優(yōu)刻得的烏蘭察布云基地獲得了國家A級/等保三級資質(zhì)認(rèn)證,可用性高達(dá)99.99%,可以保障GPT模型的訓(xùn)練和推理不受電力資源不足的限制,保障模型訓(xùn)練和推理的穩(wěn)定性和持續(xù)性,提高其分析效率和性能。此外,烏蘭察布電力價格相對較低,在此基礎(chǔ)上,UCloud采用多種節(jié)能環(huán)保技術(shù),最大限度來降低數(shù)據(jù)中心PUE值,可為GPT模型訓(xùn)練和推理降低30%-50%的運營成本。

統(tǒng)一管理的云計算基礎(chǔ)設(shè)施還為GPT提供了更加安全、穩(wěn)定的訓(xùn)練環(huán)境。UCloud烏蘭察布云基地采用WEB應(yīng)用防火墻UWAF、DDoS攻擊防護(hù) UDDoS、主機(jī)入侵檢測 UHIDS等一系列安全防護(hù)產(chǎn)品,實現(xiàn)全方位的安全防護(hù)。運維人員實行7*24*365安全運維保障,保護(hù)AI模型和數(shù)據(jù)的安全,幫助用戶解決各種問題和挑戰(zhàn)。

通過可靠的電力供應(yīng)、大規(guī)模的計算資源、高速的網(wǎng)絡(luò)連接、更具性價比的數(shù)據(jù)存儲備份方案,UCloud優(yōu)刻得的云計算基礎(chǔ)設(shè)施可以為ChatGPT模型的訓(xùn)練和推理提供強(qiáng)有力的支持,促進(jìn)其在各個領(lǐng)域探索發(fā)展和應(yīng)用。

針對大規(guī)模訓(xùn)練或通用AI訓(xùn)練場景,UCloud優(yōu)刻得還推出了A800 GPU服務(wù)器預(yù)售。

編 輯:高靖宇
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張云明:大部分國家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動 共筑信息保障堤壩
2023MWC上海世界移動通信大會
中國5G商用四周年
2023年中國國際信息通信展覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像