近年來,整個IT世界發(fā)生巨大變化,主要體現(xiàn)在4個方面:一是膨脹的數(shù)據(jù),整個世界產(chǎn)生的數(shù)據(jù)正在極速增長;二是互聯(lián)網(wǎng)的移動化,移動設(shè)備正以令人驚訝的速度快速增長和普及;三是計算系統(tǒng)的云化,計算機和數(shù)據(jù)已經(jīng)從原來的存儲模式搬遷、轉(zhuǎn)移到兩個端點—云和移動終端;四是社交媒體應(yīng)用,企業(yè)更愿意將成果通過社交媒體傳遞給受眾。
從網(wǎng)絡(luò)的角度看,現(xiàn)有網(wǎng)絡(luò)完全沒有跟上新的IT運營模式,現(xiàn)階段的網(wǎng)絡(luò)在業(yè)內(nèi)被稱為傳統(tǒng)的網(wǎng)絡(luò)架構(gòu),其架構(gòu)縝密,通過不同的網(wǎng)絡(luò)設(shè)備商來供應(yīng)網(wǎng)絡(luò)設(shè)備,他們之間遵循互通性。對于網(wǎng)絡(luò)管理而言,傳統(tǒng)網(wǎng)絡(luò)架構(gòu)存在很多的私有網(wǎng)絡(luò)管理工具,甚至網(wǎng)絡(luò)供應(yīng)商提供的應(yīng)用程序接口也屬于私有協(xié)議,這種情況對于擁有幾十臺、幾百臺甚至上千臺設(shè)備的企業(yè)來說,其維護難度無疑是巨大的。此外,當(dāng)企業(yè)需要推出新應(yīng)用時,這種舊有網(wǎng)絡(luò)架構(gòu)的上線進度也是困難且緩慢的。
因此,構(gòu)建一套新型的應(yīng)用開發(fā)和維護一體化模式的需求非常迫切,企業(yè)需要從系統(tǒng)運維到系統(tǒng)擴展,再到系統(tǒng)補丁等整個環(huán)節(jié),都能實現(xiàn)一體化運維,提高現(xiàn)有工作效率,及時快速地開發(fā)新應(yīng)用,提高傳遞給用戶的速度,以及降低成本。
下一代網(wǎng)絡(luò)運維技術(shù)的發(fā)展趨勢
下一代網(wǎng)絡(luò)以SDN/NFV化、云化、智能化為主要趨勢。隨著網(wǎng)絡(luò)轉(zhuǎn)型深入,現(xiàn)網(wǎng)已經(jīng)采用并將更多地采用大量計算機技術(shù),這些技術(shù)最適宜采用集約化、精細(xì)化的監(jiān)控維護方式。
網(wǎng)絡(luò)系統(tǒng)作為一個大規(guī)模、復(fù)雜、分布式的軟硬件系統(tǒng),其運維受到越來越多的重視,相應(yīng)的運維體系也逐步豐富,逐漸出現(xiàn)了NetDevOps理念:將研發(fā)、測試、運維等流程連接起來。而容器技術(shù)更是從底層重構(gòu)了運維,連接了開發(fā)、測試、部署、運行和監(jiān)控等全流程,進一步推動了運維體系從工具化走向平臺化、自動化和智能化方向。
第一,由“面向設(shè)備”轉(zhuǎn)向“面向服務(wù)”。從以前單純面向網(wǎng)絡(luò)、面向網(wǎng)元設(shè)備的運行維護管理方式,逐漸向業(yè)務(wù)實現(xiàn)、業(yè)務(wù)保證、業(yè)務(wù)計量以及面向客戶的方向發(fā)展。
第二,由分散式維護作業(yè)走向相對集中式、高度集中式。目前,國內(nèi)外企業(yè)對于網(wǎng)絡(luò)運維管理的規(guī)劃、建設(shè)都采用高度集中的方式,即“集中監(jiān)控、集中維護、集中管理”。其主要原因在于可以將分散的技術(shù)力量集中到網(wǎng)絡(luò)管理中心和設(shè)備維護中心(也有將網(wǎng)管和維護合設(shè)為網(wǎng)管維護中心),由此提高運行維護效率,提高網(wǎng)絡(luò)運行質(zhì)量,同時保持?jǐn)?shù)據(jù)(包括局?jǐn)?shù)據(jù)、軟件版本數(shù)據(jù)、網(wǎng)絡(luò)資源數(shù)據(jù)、網(wǎng)絡(luò)運行質(zhì)量數(shù)據(jù)、設(shè)備性能數(shù)據(jù)等)的一致性,從而提高企業(yè)的核心競爭力。
第三,由單純追求網(wǎng)絡(luò)質(zhì)量(QoS)轉(zhuǎn)向注重用戶感知(QoE)的網(wǎng)絡(luò)。
第四,從粗放式管理轉(zhuǎn)向集約化、精細(xì)化管理。
下一代網(wǎng)絡(luò)運維技術(shù)和理念體系
如圖所示,DevOps的理念為開發(fā)和運維以及QA應(yīng)該是一體的,DevOps就是三者的交集。
Networking + DevOps = NetDevOps
網(wǎng)絡(luò)和DevOps之間的需求是相互的,網(wǎng)絡(luò)最注重的是正常運行時間,而DevOps的最終目標(biāo)是持續(xù)交付。因此二者的相輔相成變得至關(guān)重要,DevOps需要網(wǎng)絡(luò)來保障更新的可交付性,采用NetDevOps可以促進網(wǎng)絡(luò)應(yīng)用與DevOps同樣的規(guī)則和邏輯,實現(xiàn)可復(fù)制和自動化的任務(wù)。
微服務(wù)
微服務(wù)是近幾年提出的概念,它通過將應(yīng)用解耦成多個服務(wù)的方式來改善其模塊化程度,使其更容易被理解、開發(fā)、測試和部署,更適用于小團隊快速迭代式協(xié)作開發(fā)。同時,每個服務(wù)也能夠采用不同的技術(shù),便于持續(xù)進化。最近,微服務(wù)配置管理、容器化部署、自動化測試、微服務(wù)治理、微服務(wù)監(jiān)控、安全、故障容忍等領(lǐng)域也受到越來越多的關(guān)注。
容器優(yōu)化與實踐
過去幾年間,以 Docker 為核心的容器技術(shù)在持續(xù)進化,以其構(gòu)建、分發(fā)和部署的簡易性成為 IT 基礎(chǔ)架構(gòu)中的關(guān)鍵技術(shù)。容器技術(shù)通過標(biāo)準(zhǔn)化運行環(huán)境的方式來連接了應(yīng)用的研發(fā)、測試和運維。它簡單、輕量,具備很強的可移植性,能更高效地利用資源,還能夠有效地解決軟件依賴問題,提高研發(fā)效率,降低研發(fā)成本,因此產(chǎn)業(yè)界也持續(xù)通過容器來優(yōu)化其軟件發(fā)布流程,對已有應(yīng)用進行容器化。
未來,在容器標(biāo)準(zhǔn)化、容器安全、容器網(wǎng)絡(luò)、容器存儲特別是對數(shù)據(jù)庫等有狀態(tài)服務(wù)的支持等方面還存在很大的改進空間,容器的可管理性及易用性也需要進一步提升。
容器編排與管理
隨著Docker等容器技術(shù)的廣泛應(yīng)用,容器編排和管理也受到了越來越多的關(guān)注,涌現(xiàn)出了諸于 Kubernetes、Apache Mesos、Docker Swarm Mode 等優(yōu)秀的開源生態(tài)和解決方案。它們試圖將目前以資源為中心的管理方式過渡到以應(yīng)用為中心的管理方式,并且試圖對應(yīng)用的基礎(chǔ)構(gòu)成組件(例如配置、服務(wù)、負(fù)載均衡等)進行標(biāo)準(zhǔn)化,從而獲得更好的可管理性。私有或公有的容器云也越來越多,越來越成熟,用戶體驗越來越好,從而顯著降低遷移成本。
當(dāng)然,在大規(guī)模的實踐中,在灰度發(fā)布、資源調(diào)度、隔離性、運維監(jiān)控、日志等方面仍有待進一步成熟和標(biāo)準(zhǔn)化,在混和云環(huán)境支持、跨云服務(wù)遷移、安全性等方面仍然面臨著困難和挑戰(zhàn)。
自動化運維
隨著虛擬化和容器化等技術(shù)的出現(xiàn),運維管理的復(fù)雜度和難度大大增加,因此必須通過專業(yè)化、標(biāo)準(zhǔn)化和流程化的手段來實現(xiàn)運維的自動化,使其能夠?qū)Σ渴稹⑴渲、監(jiān)控、告警等進行一站式處理,實現(xiàn)資源和流程的標(biāo)準(zhǔn)化統(tǒng)一化、應(yīng)用運行狀態(tài)可視化管理,提升運維質(zhì)量,降低運維成本。
智能化運維
隨著監(jiān)控范圍的不斷擴大,網(wǎng)絡(luò)系統(tǒng)產(chǎn)生的數(shù)據(jù)具備多樣性、多維性和非結(jié)構(gòu)化等特點。由于同業(yè)務(wù)數(shù)據(jù)可能存在相關(guān)性,而傳統(tǒng)的手動分析處理方式效率低且成本高,隨著大數(shù)據(jù)和人工智能的興起,越來越多的智能分析算法也應(yīng)用于運維領(lǐng)域。它們通過分析運維系統(tǒng)本身所擁有和產(chǎn)生的海量數(shù)據(jù),在問題定位、流量預(yù)測、輔助決策、智能報警和自動故障恢復(fù)等方面發(fā)揮較大的作用,從而進一步降低運維成本。
運維基礎(chǔ)架構(gòu)
運維基礎(chǔ)架構(gòu)涵蓋網(wǎng)絡(luò)、機器、機房、機架等的管理,涉及基礎(chǔ)資源、機架設(shè)計和交付、網(wǎng)絡(luò)架構(gòu)設(shè)計、操作系統(tǒng)、系統(tǒng)軟件、環(huán)境交付等方向。
運維監(jiān)控
監(jiān)控是網(wǎng)絡(luò)系統(tǒng)運維中保障核心業(yè)務(wù)穩(wěn)定可用的重要環(huán)節(jié),它涵蓋網(wǎng)絡(luò)、主機、業(yè)務(wù)、應(yīng)用、性能等方面,涉及快速的故障通知,精準(zhǔn)的故障定位和性能分析診斷等。當(dāng)前比較流行并且在業(yè)界廣泛應(yīng)用開源的監(jiān)控軟件包括Nagios、Cacti、Zabbix、Ganglia等。
隨著基礎(chǔ)設(shè)施變得更加動態(tài),監(jiān)控不但需要關(guān)心單個節(jié)點的運行狀態(tài),更要關(guān)心整個應(yīng)用的健康狀態(tài),全鏈路追蹤等技術(shù)出現(xiàn)并得到廣泛應(yīng)用。
運維安全
在網(wǎng)絡(luò)系統(tǒng)SDN/NFV化的背景下,網(wǎng)絡(luò)應(yīng)用逐漸虛擬化,并往云中遷移,傳統(tǒng)的邊界變得越來越模糊,安全也有了新的發(fā)展趨勢。過去的安全技術(shù)是以防御為主,采用傳統(tǒng)防火墻、入侵防御系統(tǒng)等。
現(xiàn)在,除了對傳統(tǒng)的安全措施進行加強之外,還會在開發(fā)流程中引入威脅建模,自動安全掃描、安全功能性測試等安全實踐,從而降低安全風(fēng)險,縮短安全問題的反饋周期。同時,安全也從事先預(yù)防轉(zhuǎn)向為持續(xù)檢測和快速響應(yīng),通過對攻擊行為的持續(xù)檢測,對安全事件進行快速響應(yīng),從而大幅降低損失。