在11月4日舉辦的2021騰訊數(shù)字生態(tài)大會(huì)云原生專(zhuān)場(chǎng)上,騰訊云聯(lián)合中國(guó)信通院率先在國(guó)內(nèi)重磅發(fā)布了《降本之源-云原生成本管理白皮書(shū)》(簡(jiǎn)稱(chēng)白皮書(shū)),基于騰訊云在業(yè)內(nèi)最大規(guī)模的Kubernetes 實(shí)踐經(jīng)驗(yàn),系統(tǒng)性呈現(xiàn)云原生成本優(yōu)化方法論和最佳實(shí)踐路徑。
騰訊云容器產(chǎn)品總經(jīng)理鄒輝表示:“Kubernetes 是云原生技術(shù)棧的核心,騰訊云原生經(jīng)過(guò)多年的技術(shù)積累以及眾多騰訊內(nèi)外部復(fù)雜業(yè)務(wù)考驗(yàn)已經(jīng)步入非常成熟的階段。TKE 目前擁有國(guó)內(nèi)最大規(guī)模的 Kubernetes 集群以及業(yè)界最好的 Kubernetes 成本優(yōu)化實(shí)踐;目前TKE運(yùn)行著 900 萬(wàn)+個(gè)Pod ,管理了數(shù)千萬(wàn) CPU 核;同時(shí)我們大規(guī)模在騰訊內(nèi)部核心業(yè)務(wù)中應(yīng)用了成本優(yōu)化技術(shù),CPU 利用率最高提升了3倍;在騰訊外部,小紅書(shū)80%的業(yè)務(wù)都跑在TKE上,成本降低了40%!
當(dāng)前,越來(lái)越多的企業(yè)開(kāi)始擁抱云計(jì)算,但隨著用云程度的加深,云資源浪費(fèi)的問(wèn)題也變得越發(fā)明顯。白皮書(shū)指出,彈性按需是云原生的資源利用優(yōu)勢(shì),但如果資源配置策略設(shè)置不合理可能會(huì)導(dǎo)致資源的浪費(fèi)。此外,云原生資源利用的計(jì)量方式如果不夠靈活,會(huì)使得企業(yè)難以準(zhǔn)確調(diào)控用云成本,因此,企業(yè)在應(yīng)用云原生架構(gòu)之后,需要考慮如何管理、優(yōu)化和使用云原生服務(wù)來(lái)進(jìn)一步提升業(yè)務(wù)的數(shù)字化轉(zhuǎn)型效。
基于豐富的海量應(yīng)用服務(wù)經(jīng)驗(yàn),騰訊云原生在內(nèi)部和外部都有著成熟的資源優(yōu)化方法論。在內(nèi)部,騰訊云采用資源利用率成熟度模型,通過(guò)四個(gè)階段對(duì)業(yè)務(wù)進(jìn)行容器化,最終實(shí)現(xiàn)利用率達(dá)到60~70%。在外部,騰訊云推出了容器產(chǎn)品“成本大師”,從成本洞察、成本優(yōu)化、成本運(yùn)營(yíng)三個(gè)層面來(lái)協(xié)助企業(yè)做更好的成本管理。
據(jù)介紹,成本大師具有全鏈路的成本優(yōu)化能力,能夠精確智能的進(jìn)行成本洞察,一分鐘發(fā)現(xiàn)資源浪費(fèi),并提供8種彈性策略組合,滿足任意場(chǎng)景的彈性需求,而全構(gòu)混部是業(yè)內(nèi)首家云上支持CPU/GPU的混部產(chǎn)品,覆蓋騰訊千萬(wàn)核資源規(guī)模。核心能力 qGPU,是強(qiáng)隔離的 GPU 虛擬化技術(shù),該技術(shù)在業(yè)內(nèi)首次實(shí)現(xiàn)了GPU算力、顯存和故障的強(qiáng)隔離,支持算力精細(xì)切分共享和多優(yōu)先級(jí)混部, GPU利用率最高可提升230%。
《降本之源-云原生成本管理白皮書(shū)》正是騰訊基于內(nèi)外云原生成本管理最佳實(shí)踐,并結(jié)合行業(yè)優(yōu)秀案例,提出的一套體系化的云原生成本優(yōu)化方法論和最佳實(shí)踐路徑。旨在幫助企業(yè)改善用云成本,充分發(fā)揮云原生的效能和價(jià)值。
此外,白皮書(shū)中,騰訊云還通過(guò)對(duì)數(shù)十個(gè)客戶的詳細(xì)訪談,了解到在企業(yè)實(shí)際成本管理中存在的焦點(diǎn)問(wèn)題,并基于資源利用率的現(xiàn)狀和挑戰(zhàn),整理出企業(yè)使用的“成本洞察”、“成本優(yōu)化”、“成本運(yùn)營(yíng)”三階段云原生成本管理模型。
成本洞察即團(tuán)隊(duì)需要定義一致的標(biāo)簽和命名空間來(lái)改善分配,基于多維度(如云產(chǎn)品、環(huán)境、業(yè)務(wù)線)的資源和成本的可視化分析,能夠幫助團(tuán)隊(duì)有效地建立起相應(yīng)的問(wèn)責(zé)機(jī)制,并根據(jù)獲取到的實(shí)時(shí)數(shù)據(jù)快速制定優(yōu)化方案及措施。
成本優(yōu)化是對(duì)云資源規(guī)格、數(shù)量的調(diào)整,也包含了對(duì)業(yè)務(wù)的架構(gòu)優(yōu)化、以及通過(guò)彈性能力和資源混部等手段提升資源利用率。主要方案包括:設(shè)置合適的資源請(qǐng)求,通過(guò)動(dòng)態(tài)調(diào)度解決資源碎片的問(wèn)題,提高裝箱率。通過(guò)彈性和混部做到按需使用;對(duì)于固定資源池,對(duì)負(fù)載峰值在不同時(shí)段的在線應(yīng)用、在離線應(yīng)用進(jìn)行混部,做到分時(shí)復(fù)用;針對(duì) GPU 資源,實(shí)現(xiàn)資源的池化和共享。
成本運(yùn)營(yíng)則是鼓勵(lì)企業(yè)從組織、文化、流程等方面建設(shè)成本運(yùn)營(yíng)體系,根據(jù)目標(biāo)持續(xù)不斷調(diào)整和優(yōu)化。具體方案包括:建立成本優(yōu)化團(tuán)隊(duì),推動(dòng)成本優(yōu)化意識(shí),數(shù)據(jù)驅(qū)動(dòng)成本優(yōu)化,在流程中考察成本以及量化成本優(yōu)化交付的業(yè)務(wù)價(jià)值。
白皮書(shū)圍繞該模型,并結(jié)合企業(yè)實(shí)際落地情況提供成本管理的最佳實(shí)踐,幫助企業(yè)上云、云原生改造時(shí)兼顧成本優(yōu)化,助力數(shù)字化轉(zhuǎn)型。
此外,白皮書(shū)還收錄了騰訊內(nèi)外部10余個(gè)企業(yè)降本實(shí)踐案例。將包括作業(yè)幫、云集、QQ瀏覽器、騰訊廣告等企業(yè)或業(yè)務(wù)上云遇到的成本挑戰(zhàn)及降本實(shí)踐全方位呈現(xiàn),為其他企業(yè)運(yùn)維減負(fù)提供了詳實(shí)的參考。
除了《云原生成本管理白皮書(shū)》,針對(duì)容器的安全難題,騰訊云容器服務(wù)TKE還聯(lián)合騰訊安全云鼎實(shí)驗(yàn)室,發(fā)布了《騰訊云容器安全白皮書(shū)》。白皮書(shū)對(duì)騰訊云容器用戶進(jìn)行了深入的調(diào)研和走訪,同時(shí)結(jié)合長(zhǎng)期以來(lái)的容器安全運(yùn)營(yíng)實(shí)踐,詳細(xì)梳理并分析了容器環(huán)境所面臨的安全威脅和挑戰(zhàn),并介紹了騰訊云在云原生容器安全建設(shè)上的思路、方案以及實(shí)踐,希望以這樣的方式共同推動(dòng)云原生安全的發(fā)展。這也是國(guó)內(nèi)首次大規(guī)模的對(duì)容器環(huán)境安全現(xiàn)狀進(jìn)行的分析總結(jié)。
據(jù)介紹,騰訊云一直致力于在云原生領(lǐng)域?yàn)橛脩籼峁└、更穩(wěn)定、更安全的云原生服務(wù)。在云原生產(chǎn)品的設(shè)計(jì)和實(shí)現(xiàn)之初,就充分融入了安全性的設(shè)計(jì)和考慮,使云原生系統(tǒng)天然具備安全特性,使安全成為像計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)一樣的基礎(chǔ)能力,助力用戶實(shí)現(xiàn)應(yīng)用系統(tǒng)的云原生化,并且持續(xù)的保障其安全穩(wěn)定的運(yùn)行。