首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 頭條資訊 >> 正文

百川智能發(fā)布超千億大模型Baichuan3,中文評測超GPT-4

2024年1月29日 13:29  CCTIME飛象網(wǎng)  

飛象網(wǎng)訊 1月29日午間消息,百川智能宣布發(fā)布超千億參數(shù)的大語言模型Baichuan 3。在 CMMLU、GAOKAO 和 AGI-Eval 等評測中,Baichuan 3 號稱在中文任務(wù)上超越了 GPT-4。

據(jù)介紹,百川智能在 Baichuan 3 訓練過程中提出了“動態(tài)數(shù)據(jù)選擇”、“重要度保持”以及“異步 CheckPoint 存儲”等多種技術(shù)手段及方案,穩(wěn)定訓練時間達到一個月以上,故障恢復時間不超過 10 分鐘。

百川智能官方表示,Baichuan 3 還突破“迭代式強化學習”技術(shù),進一步提升了語義理解和生成能力,在詩詞創(chuàng)作的格式、韻律、表意等方面進行了提升,對于宋詞這種格式多變,結(jié)構(gòu)深細、韻律豐富的高難度文體,生成的內(nèi)容亦能工整對仗、韻腳和諧,讓每個人都能創(chuàng)作出詠物、寄思的五言律詩、七言絕句,寫下的言志、抒情的“沁園春”、“定風波”。

據(jù)介紹,面向醫(yī)療行業(yè),百川智能在模型預訓練階段構(gòu)建了超過千億Token的醫(yī)療數(shù)據(jù)集,該數(shù)據(jù)集涵蓋了從理論到實際操作,從基礎(chǔ)理論到臨床應用等各個方面的醫(yī)學知識,確保了模型在醫(yī)療領(lǐng)域的專業(yè)度和知識深度。在對邏輯推理能力及專業(yè)性要求極高的MCMLE、MedExam等權(quán)威醫(yī)療評測上的中文效果同樣超過了GPT-4。

編 輯:高靖宇
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張云明:大部分國家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動 共筑信息保障堤壩
2023MWC上海世界移動通信大會
中國5G商用四周年
2023年中國國際信息通信展覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復制、鏡像