隨著數(shù)據(jù)中心、網(wǎng)格計(jì)算、超級(jí)計(jì)算、云計(jì)算等技術(shù)與概念的興起,IT行業(yè)正經(jīng)歷著從商業(yè)模式、技術(shù)架構(gòu)到管理運(yùn)營(yíng)等各方面的巨大變革。與之相應(yīng),云管理技術(shù)也開(kāi)始進(jìn)入了人們的視線(xiàn),相關(guān)的話(huà)題也變得越來(lái)越熱門(mén)。而從用戶(hù)需求、技術(shù)特征和功能組成來(lái)看,云管理在目前階段主要是數(shù)據(jù)中心的管理。數(shù)據(jù)中心管理關(guān)注重點(diǎn)資源和業(yè)務(wù)的整合、可視化和虛擬化,而云管理關(guān)注重點(diǎn)按需分配資源和云的收費(fèi)運(yùn)營(yíng);數(shù)據(jù)中心管理相關(guān)的經(jīng)驗(yàn)與技術(shù)很多已較成熟,而云管理的相關(guān)技術(shù)尚在摸索與發(fā)展中。我們認(rèn)為,數(shù)據(jù)中心管理未來(lái)的發(fā)展方向與目標(biāo)將是云管理。
如何進(jìn)行云管理?現(xiàn)階段需要關(guān)注哪些內(nèi)容?從淘寶、騰訊等國(guó)內(nèi)云計(jì)算應(yīng)用先行者的IT建設(shè)和管理中,或許能夠獲得啟迪。
先行者眼中的云管理
日均4億次的網(wǎng)頁(yè)訪(fǎng)問(wèn)量、日均交易額6億元、全年交易額達(dá)2000億元,……,這就是亞洲最大的網(wǎng)上交易平臺(tái)——淘寶網(wǎng)。在這些驚人數(shù)字的背后支撐的IT基礎(chǔ)設(shè)施,則是分布在杭州及全國(guó)的8個(gè)數(shù)據(jù)中心的上萬(wàn)臺(tái)服務(wù)器、上千臺(tái)網(wǎng)絡(luò)設(shè)備以及運(yùn)行著上百種應(yīng)用。對(duì)淘寶而言,未來(lái)的云計(jì)算服務(wù)模式是“B2C+C2C+網(wǎng)絡(luò)營(yíng)銷(xiāo)+云租用服務(wù)”,是對(duì)現(xiàn)有業(yè)務(wù)的繼承和發(fā)展,因此首先要對(duì)現(xiàn)有的IT基礎(chǔ)設(shè)施(尤其是數(shù)據(jù)中心)進(jìn)行整合,而相應(yīng)的云管理就是對(duì)數(shù)據(jù)中心和底層基礎(chǔ)設(shè)施進(jìn)行整合管理。具體說(shuō)來(lái)有三個(gè)層面:
設(shè)備層面。需要實(shí)現(xiàn)對(duì)大容量設(shè)備(上萬(wàn)臺(tái)服務(wù)器和網(wǎng)絡(luò)設(shè)備)的管理,同時(shí)要考慮物理上分布式部署、邏輯上統(tǒng)一的管理需求;
業(yè)務(wù)層面。需要實(shí)現(xiàn)在同一個(gè)平臺(tái)中實(shí)現(xiàn)對(duì)IT和IP設(shè)備的融合,可以從業(yè)務(wù)的角度對(duì)網(wǎng)絡(luò)進(jìn)行管理,也可以從性能和流量的角度對(duì)業(yè)務(wù)進(jìn)行監(jiān)控和優(yōu)化;
服務(wù)層面。需要提供運(yùn)維服務(wù)方面的支持,幫助IT部門(mén)向規(guī)范化、可審計(jì)的服務(wù)運(yùn)營(yíng)中心轉(zhuǎn)變。
總的來(lái)說(shuō),淘寶目前涉及的云管理實(shí)際上就是數(shù)據(jù)中心的管理,按照基礎(chǔ)設(shè)施管理->上層業(yè)務(wù)和流量分析->IT服務(wù)運(yùn)維的次序,整合好各種資源,包括設(shè)備、應(yīng)用、流量、服務(wù)等,為將來(lái)建立虛擬化資源池、對(duì)外提供云服務(wù)打下基礎(chǔ)。
與淘寶類(lèi)似,現(xiàn)階段騰訊的云管理也同樣集中在對(duì)底層數(shù)據(jù)中心基礎(chǔ)設(shè)施的管理。除了關(guān)注資源整合之外,騰訊更進(jìn)一步地關(guān)注資源的虛擬化和自動(dòng)化。這包括兩方面:首先是對(duì)虛擬化資源(包括虛擬網(wǎng)絡(luò)設(shè)備、虛擬主機(jī)等)的管理,能夠查看這些虛擬資源的狀態(tài);其次是對(duì)資源池各種資源的自動(dòng)化管理,能夠?qū)ξ锢碣Y源和虛擬資源進(jìn)行配置?偠灾,先整合資源,再進(jìn)行資源的虛擬化和自動(dòng)化,這些就是騰訊對(duì)現(xiàn)階段云管理的要求。
云管理從數(shù)據(jù)中心開(kāi)始——數(shù)據(jù)中心管理解決方案
從淘寶和騰訊這兩個(gè)案例可以看出,目前的云管理還處在初級(jí)階段,實(shí)質(zhì)上是數(shù)據(jù)中心管理,其主要需求為資源的整合、虛擬化、自動(dòng)化等。而傳統(tǒng)網(wǎng)管采用的是以設(shè)備管理為核心的FCAPS網(wǎng)管模型,各種管理工具之間不易融合,很難滿(mǎn)足數(shù)據(jù)中心各種靈活易變的業(yè)務(wù)模型和管理需求。新的數(shù)據(jù)中心管理平臺(tái)應(yīng)該采用面向服務(wù)架構(gòu)(SOA)的設(shè)計(jì)思想,融合并統(tǒng)一管理資源、業(yè)務(wù)、運(yùn)維這三大數(shù)據(jù)中心組成要素,通過(guò)按需裝配功能組件與相應(yīng)的硬件設(shè)備配合,形成直接面向客戶(hù)應(yīng)用需求的一系列整體解決方案,從而為數(shù)據(jù)中心的各種關(guān)鍵業(yè)務(wù)系統(tǒng)提供支撐。
如圖1所示為數(shù)據(jù)中心管理解決方案概貌,其主要包括四個(gè)部分。
首先,數(shù)據(jù)中心管理需要提供端到端、大容量、可視化的基礎(chǔ)設(shè)施整合管理方案。
數(shù)據(jù)中心除了傳統(tǒng)的網(wǎng)絡(luò)、安全設(shè)備外,還存在存儲(chǔ)、服務(wù)器等設(shè)備,這要求對(duì)常見(jiàn)的網(wǎng)管功能進(jìn)行重新設(shè)計(jì),包括拓?fù)、告警、性能、面板、配置等,以?shí)現(xiàn)對(duì)基礎(chǔ)設(shè)施的整合管理。在底層協(xié)議方面,需要將傳統(tǒng)的SNMP網(wǎng)絡(luò)管理協(xié)議和WMI、JMX等其他管理協(xié)議進(jìn)行整合,以同時(shí)支持對(duì)IP設(shè)備和IT設(shè)備的管理。
在軟件架構(gòu)方面,需要考慮上萬(wàn)臺(tái)設(shè)備對(duì)管理平臺(tái)性能的沖擊,因此必須采用分布式的架構(gòu)設(shè)計(jì),讓管理平臺(tái)可以同時(shí)運(yùn)行在多個(gè)物理服務(wù)器上,實(shí)現(xiàn)管理負(fù)載的分擔(dān)。
另外,數(shù)據(jù)中心所在的機(jī)房、機(jī)架等也需要進(jìn)行管理,這些靠傳統(tǒng)物理拓?fù)涞乃阉魇撬巡怀鰜?lái)的,需要考慮增加新的可視化拓?fù)涔芾砉δ,讓管理員可以查看如分區(qū)、樓層、機(jī)房、機(jī)架、設(shè)備面板等視圖,方便管理員從各個(gè)維度對(duì)數(shù)據(jù)中心的各種資源進(jìn)行管理。
其次,數(shù)據(jù)中心管理需要提供虛擬化、自動(dòng)化的管理方案。
傳統(tǒng)的管理軟件只考慮物理設(shè)備的管理,對(duì)于虛擬機(jī)、虛擬網(wǎng)絡(luò)設(shè)備等虛擬資源無(wú)法識(shí)別,更不要說(shuō)對(duì)這些資源進(jìn)行配置。然而,數(shù)據(jù)中心虛擬化和自動(dòng)化是大勢(shì)所趨,虛擬資源的監(jiān)控、部署與遷移等需求,將推動(dòng)數(shù)據(jù)中心管理平臺(tái)進(jìn)行新的變革。
對(duì)于虛擬資源,需要考慮在拓?fù)洹⒃O(shè)備等信息中增加相關(guān)的技術(shù)支持,使管理員能夠在拓?fù)鋱D上同時(shí)管理物理資源和虛擬化資源,查看虛擬網(wǎng)絡(luò)設(shè)備的面板,以及虛擬機(jī)的CPU、內(nèi)存、磁盤(pán)空間等信息。其次加強(qiáng)是對(duì)各種資源的配置管理能力,能夠?qū)ξ锢碓O(shè)備和虛擬設(shè)備下發(fā)網(wǎng)絡(luò)配置,建立配置基線(xiàn)模板,定期自動(dòng)備份,并且支持虛擬網(wǎng)絡(luò)環(huán)境(VLAN、ACL、QoS等)的遷移和部署,滿(mǎn)足快速部署、業(yè)務(wù)遷移、新系統(tǒng)測(cè)試等不同場(chǎng)景的需求。
再次,數(shù)據(jù)中心管理需要提供面向業(yè)務(wù)的應(yīng)用管理和流量分析方案。
數(shù)據(jù)中心存在著各種關(guān)鍵業(yè)務(wù)和應(yīng)用,如服務(wù)器、操作系統(tǒng)、數(shù)據(jù)庫(kù)、Web服務(wù)、中間件、郵件等,對(duì)這些業(yè)務(wù)系統(tǒng)的管理應(yīng)該遵循高可靠的原則,采用agentless無(wú)監(jiān)控代理的方式進(jìn)行監(jiān)控,盡量不影響業(yè)務(wù)系統(tǒng)的運(yùn)行。
在可視化方面,為便于實(shí)現(xiàn)IP與IT的融合管理,需要將網(wǎng)絡(luò)管理與業(yè)務(wù)管理的功能進(jìn)行對(duì)接,拓?fù)鋱D上不光可以顯示設(shè)備信息,也可以顯示服務(wù)器菜單運(yùn)行業(yè)務(wù)及詳細(xì)性能參數(shù)。另外,數(shù)據(jù)中心帶來(lái)了新的業(yè)務(wù)模型,如1:N(一臺(tái)服務(wù)器運(yùn)行多個(gè)業(yè)務(wù))、N:1(多臺(tái)服務(wù)器運(yùn)行同一個(gè)業(yè)務(wù))和N:M(不同業(yè)務(wù)間的流量模型),這些業(yè)務(wù)對(duì)于數(shù)據(jù)中心的流量帶來(lái)了很大的沖擊,有可能會(huì)造成流量瓶頸,影響業(yè)務(wù)運(yùn)行。
因此可以對(duì)諸如流量分析軟件進(jìn)行改進(jìn),提供基于NetFlow/NetStream/sFlow等流量分析技術(shù)的分析功能,并通過(guò)各種可視化的流量視圖,對(duì)業(yè)務(wù)流量中的接口、應(yīng)用、主機(jī)、會(huì)話(huà)、IP組、7層應(yīng)用等進(jìn)行分析,從而找出瓶頸,規(guī)劃接口帶寬,滿(mǎn)足用戶(hù)對(duì)內(nèi)部業(yè)務(wù)進(jìn)行持續(xù)監(jiān)控和改進(jìn)的流量分析需求。
另外,數(shù)據(jù)中心管理還需要提供可控、可審計(jì)、可度量的運(yùn)維管理方案。
對(duì)于負(fù)責(zé)運(yùn)行數(shù)據(jù)中心的企業(yè)IT部門(mén)經(jīng)常遇到以下問(wèn)題:
Ø IT部門(mén)的工作量難以衡量與評(píng)估;
Ø 故障處理有較大的隨意性,出現(xiàn)問(wèn)題后難以找到責(zé)任人與處理辦法;
Ø 技術(shù)人員的流動(dòng)增大IT管理難度,只有依賴(lài)經(jīng)驗(yàn)豐富的老管理人員,新人一時(shí)無(wú)法接手管理;
Ø IT部門(mén)的成本不好控制,投入產(chǎn)出的效果不明顯。
因此,必須考慮引入運(yùn)維管理,參考IT服務(wù)管理的最佳實(shí)踐——ITIL管理模型,結(jié)合企業(yè)內(nèi)部的人員、技術(shù)、流程和其他條件,通過(guò)用戶(hù)服務(wù)平臺(tái)、資產(chǎn)庫(kù)、知識(shí)庫(kù)等工具,對(duì)常見(jiàn)的故障處理流程、配置變更流程等進(jìn)行梳理和固化,加強(qiáng)服務(wù)響應(yīng)能力,及時(shí)總結(jié)相關(guān)經(jīng)驗(yàn),提高IT部門(mén)的服務(wù)交付能力與服務(wù)支持能力。
結(jié)束語(yǔ)
云計(jì)算是IP技術(shù)與IT技術(shù)兩大領(lǐng)域的結(jié)合體,因此云管理不僅需要從底層資源的角度出發(fā)來(lái)保障業(yè)務(wù)和性能,也要從業(yè)務(wù)和性能的角度出發(fā)來(lái)優(yōu)化網(wǎng)絡(luò)。這意味著對(duì)云的管理需要采用全新的管理模型和靈活的功能架構(gòu),并且充分考慮基礎(chǔ)設(shè)施、技術(shù)趨勢(shì)、業(yè)務(wù)運(yùn)行、運(yùn)維服務(wù)等各種管理要素,建立一個(gè)標(biāo)準(zhǔn)化、開(kāi)放式、易擴(kuò)展、可聯(lián)動(dòng)的統(tǒng)一智能管理平臺(tái),實(shí)現(xiàn)資源、業(yè)務(wù)、運(yùn)維融合聯(lián)動(dòng)的精細(xì)化管理。
隨著云的建設(shè)重點(diǎn)從數(shù)據(jù)中心向公共云、私有云、混合云等不同類(lèi)型云的運(yùn)營(yíng)過(guò)渡,相應(yīng)的管理任務(wù)也從對(duì)數(shù)據(jù)中心的管理轉(zhuǎn)變?yōu)閷?duì)云的管理。從現(xiàn)在的“看云不是云”,到未來(lái)的“看云還是云”,這是一個(gè)過(guò)程。云管理的最佳路徑是從數(shù)據(jù)中心管理開(kāi)始,對(duì)底層資源進(jìn)行整合,并通過(guò)虛擬化和自動(dòng)化進(jìn)行調(diào)配,最終向云服務(wù)過(guò)渡。只要從實(shí)際出發(fā),在實(shí)踐中對(duì)數(shù)據(jù)中心管理不斷進(jìn)行完善,自然而然的就能迎來(lái)真正實(shí)用的云管理解決方案。