B輪融資獲得SIG、英特爾投資的5000萬(wàn)美元,A輪融資金額就達(dá)數(shù)千萬(wàn)人民幣,華云數(shù)據(jù)究竟以什么吸引了如此多投資方的興趣。抱著這個(gè)疑問(wèn),筆者來(lái)到了風(fēng)景優(yōu)美的無(wú)錫,在華云數(shù)據(jù)的本部走訪了該公司的架構(gòu)與資源部副總裁郭曉。
架構(gòu)與資源部副總裁 郭曉
是云化還是吞噬
沒(méi)有電商強(qiáng)大的資源,藍(lán)芒(華云數(shù)據(jù)前身)只是國(guó)內(nèi)IDC圈中普通的一員。同時(shí),當(dāng)時(shí)藍(lán)芒的道路也并不平坦,比如眾所周知的“藍(lán)芒事件”。然而,在2010年成立公司后,當(dāng)下華云數(shù)據(jù)已經(jīng)擁有二百多位員工,技術(shù)研發(fā)人員上百位,更獲得了兩筆巨額的融資。而這一切都基于華云數(shù)據(jù)的云化之道,或者是“吞噬”之路。
CSDN:請(qǐng)介紹一下自己和華云數(shù)據(jù)?
郭曉:從廈門(mén)來(lái)無(wú)錫一年多的時(shí)間,華云剛過(guò)來(lái)時(shí)只有六七個(gè)人,當(dāng)下已發(fā)展為二百多人的公司。之前公司總部在廈門(mén),也就是由藍(lán)芒轉(zhuǎn)至當(dāng)下的華云數(shù)據(jù)。我從2005年4月大學(xué)畢業(yè)就加入了藍(lán)芒,所有工作經(jīng)驗(yàn)也都是圍繞著IDC相關(guān),主導(dǎo)了《藍(lán)芒虛擬主機(jī)管理系統(tǒng)》、國(guó)內(nèi)唯一支持企業(yè)提供商用CDN服務(wù)的《藍(lán)芒CDN管理系統(tǒng)》、《藍(lán)芒智能DNS管理系統(tǒng)》、在IDC中最早通過(guò)電信研究院測(cè)評(píng)的《藍(lán)芒工信部備案系統(tǒng)企業(yè)端》以及當(dāng)下IaaS等多個(gè)項(xiàng)目。
CSDN:請(qǐng)談?wù)勅A云數(shù)據(jù)從IDC到云的過(guò)渡?
郭曉:那個(gè)時(shí)候IDC業(yè)務(wù)已經(jīng)很不好做,整個(gè)IDC圈只有不到15%的毛利,流水達(dá)幾十個(gè)億的主機(jī)商,在售價(jià)不到千萬(wàn)美金時(shí)也就出售了。當(dāng)時(shí)華云數(shù)據(jù)可以說(shuō)是痛下決心,將大客戶轉(zhuǎn)給了世紀(jì)互聯(lián),并在三個(gè)月時(shí)間內(nèi)完成90%主機(jī)租用用戶向云端遷移。OpenStack等開(kāi)源技術(shù)的出現(xiàn)降低了IDC圈云化的門(mén)檻,我們?nèi)A云數(shù)據(jù)也是從開(kāi)源項(xiàng)目做起,之后才在調(diào)度層面、網(wǎng)絡(luò)層面、存儲(chǔ)層面轉(zhuǎn)向自主研發(fā),當(dāng)時(shí)的云計(jì)算服務(wù)的各個(gè)環(huán)節(jié)基本上都是使用開(kāi)源項(xiàng)目打造,不是從底層做起,比如寫(xiě)出KVM、Xen、VMware、Hyper-V等,而是重寫(xiě)資源的調(diào)度層,結(jié)合在藍(lán)芒多年的IDC運(yùn)維經(jīng)驗(yàn)做出符合國(guó)內(nèi)IDC用戶使用習(xí)慣的云主機(jī)產(chǎn)品。
其中有個(gè)時(shí)間點(diǎn)是2010年左右,IDC托管業(yè)務(wù)已非常不景氣,把大客戶轉(zhuǎn)到世紀(jì)互聯(lián)后我們的IDC托管用戶已減少到了100個(gè)機(jī)柜。其實(shí)那個(gè)時(shí)候大規(guī)模做云計(jì)算并不是最好時(shí)機(jī),用戶的接受度非常低。
在2009至2010年期間,我們?cè)谔嵘浦鳈C(jī)的功能和易用性上做了很多工作,當(dāng)時(shí)的難點(diǎn)在于沒(méi)有任何參考對(duì)象。而在2010年發(fā)布1.0版本后,提供的云主機(jī)控制面板已經(jīng)幾乎配備了所有主流功能,比如快速重裝操作系統(tǒng),自助重置操作系統(tǒng)密碼,自助防火墻等。這段時(shí)間運(yùn)營(yíng)商的機(jī)柜、帶寬、IP地址全面在漲價(jià),我們認(rèn)為云服務(wù)的轉(zhuǎn)型已成必然趨勢(shì)。為了鼓勵(lì)用戶轉(zhuǎn)到云端,當(dāng)時(shí)我們也算是“連哄帶騙”吧,許以用戶免費(fèi)時(shí)間,承諾較高的故障賠償,但是這些都可以從云化后資源采購(gòu)成本上找回來(lái),而用戶也切實(shí)的獲得了利益。同時(shí),為了保護(hù)用戶的數(shù)據(jù)安全,每天都進(jìn)行一個(gè)冷備份,之后又實(shí)現(xiàn)了基于分布式存儲(chǔ)的災(zāi)備等。在得到了廣大客戶認(rèn)可后,用十幾個(gè)的機(jī)柜支撐了近2000用戶,因此也得到了投資方的重視。
從成立公司至今,華云數(shù)據(jù)的策略一直以IDC云化為主,因?yàn)槲覀兩钪?dāng)下IDC供應(yīng)商收益的慘淡。圍繞這個(gè)方面進(jìn)行開(kāi)發(fā),通過(guò)資源調(diào)度系統(tǒng)將各個(gè)小的主機(jī)商聯(lián)合起來(lái),形成一個(gè)龐大的服務(wù)器集群;诘乩砦恢玫牟煌,許多用戶都可以就近選擇來(lái)獲得一個(gè)較低的延時(shí)。同時(shí),對(duì)于不符合標(biāo)準(zhǔn)的主機(jī)商,我們也提供了一系列云化的方案,讓其擁有自己的云產(chǎn)品。除技術(shù)之外,做云計(jì)算還有運(yùn)營(yíng)和服務(wù),而我們?nèi)A云數(shù)據(jù)給自己評(píng)價(jià)也是“云計(jì)算領(lǐng)域最了解IDC,IDC里最會(huì)做云計(jì)算開(kāi)發(fā)”的公司。
CSDN:在華云數(shù)據(jù)的介紹中我們有看到“15+城市”、“20+數(shù)據(jù)中心”、“10000+”物理服務(wù)器集群,這個(gè)數(shù)字有多少是云化而來(lái)?
郭曉:全部都是云化來(lái)的,目前華云的業(yè)務(wù)全部都是圍繞云計(jì)算來(lái)開(kāi)展,IDC的業(yè)務(wù)已經(jīng)放著自然萎縮,而且華云數(shù)據(jù)已經(jīng)有了自建數(shù)據(jù)中心計(jì)劃,可能會(huì)在2015年完成一個(gè)數(shù)據(jù)中心計(jì)劃,地點(diǎn)就在江蘇省內(nèi),預(yù)期可以支撐上百萬(wàn)臺(tái)云主機(jī)服務(wù)。
CSDN:在IDC云化過(guò)程中,華云數(shù)據(jù)對(duì)這些機(jī)房的標(biāo)準(zhǔn)是什么?一般著重強(qiáng)調(diào)哪幾個(gè)方面?
郭曉:其實(shí)我們對(duì)機(jī)房的要求并不高,因?yàn)樵诩夹g(shù)上我們所有的設(shè)備都是有熱備的,個(gè)別的硬件損壞,熱備設(shè)備會(huì)很快自動(dòng)替換上去。受影響的云主機(jī)用戶只會(huì)感覺(jué)到業(yè)務(wù)中斷了一小段時(shí)間,對(duì)于使用我們HA方案云主機(jī)用戶或者云存儲(chǔ)用戶,則感受不到業(yè)務(wù)中斷。
吞噬道路上的技術(shù)保障及架構(gòu)衍變
對(duì)比百度、阿里、騰訊這些自建云計(jì)算數(shù)據(jù)中心的公司,華云數(shù)據(jù)需要做更多的努力,比如不同Hypervisor虛機(jī)的異構(gòu)調(diào)度、基于不同虛機(jī)調(diào)度策略調(diào)優(yōu)等,這里我們從技術(shù)的角度上走進(jìn)華云數(shù)據(jù)。
CSDN:據(jù)說(shuō)分布式存儲(chǔ)開(kāi)發(fā)之前有個(gè)小插曲,可否詳細(xì)談?wù)劊?/B>
郭曉:2013年10月份,這是華云深圳節(jié)點(diǎn)的一個(gè)故事,因?yàn)橛脖P(pán)批次的質(zhì)量問(wèn)題,在深圳機(jī)房中,一臺(tái)磁盤(pán)陣列柜上突然出現(xiàn)5塊硬盤(pán)在6小時(shí)內(nèi)連續(xù)發(fā)生故障。這種情形,不管你是做RAID 10還是RAID 5,都無(wú)法保持服務(wù)正常運(yùn)行。為了保證用戶數(shù)據(jù)安全,在事情發(fā)生后,我們立刻斷掉了存儲(chǔ)陣列的電源,防止數(shù)據(jù)再被破壞。同時(shí)聯(lián)系了廠商和專業(yè)的數(shù)據(jù)恢復(fù)公司,讓99.9%的數(shù)據(jù)得以完整恢復(fù)。最后,只有3個(gè)用戶的數(shù)據(jù)完整受到了影響,但是關(guān)鍵在于服務(wù)停了大約一周。因此,在2013年底,我們提早推出了分布式存儲(chǔ),就是針對(duì)這一問(wèn)題。
CSDN:那么推出分布式存儲(chǔ)后,現(xiàn)在的服務(wù)可用率又是什么樣的情況?
郭曉:在分布式存儲(chǔ)中,我們使用了1備3的機(jī)制,同一個(gè)數(shù)據(jù)會(huì)保存3個(gè)副本,這樣可以顯著的提高系統(tǒng)整體的IO吞吐率,能達(dá)到數(shù)倍的效果。同時(shí),將文件徹底打散后,也就是條帶化處理,大幅度的提高了冗余,即使壞4到5臺(tái)服務(wù)器都不會(huì)影響數(shù)據(jù)安全,也更有利于故障轉(zhuǎn)移。當(dāng)然在開(kāi)源技術(shù)的使用上,我們做了大量代碼級(jí)的調(diào)優(yōu),比如OpenStack,我們已經(jīng)無(wú)法升級(jí)到社區(qū)版本,只是單純使用它做為中間件調(diào)度KVM的Hypervisor,其中包括了大量的代碼重寫(xiě)。在分布式塊存儲(chǔ)方面,代碼級(jí)的調(diào)優(yōu)有一些,但是資源調(diào)度上的調(diào)優(yōu)更多,還有就是選擇最匹配的硬件。所有的數(shù)據(jù)在其他數(shù)據(jù)中心做一份冷備份(24小時(shí)),因此,即使有大面積災(zāi)難發(fā)生,用戶最多也只會(huì)丟失十幾個(gè)小時(shí)的數(shù)據(jù)。其實(shí),在分布式存儲(chǔ)上,最優(yōu)硬件組合也是真正的挑戰(zhàn),比如使用什么樣的網(wǎng)卡,使用多少SSD硬盤(pán)或者多少Flash卡作為緩存,使用多少線程、多少主頻的CPU等。
CSDN:您提到SSD,在SSD的使用上,可否詳細(xì)的說(shuō)說(shuō)?
郭曉:現(xiàn)階段我們主要使用Flash卡做冷熱數(shù)據(jù)分離和HDD的Cache,來(lái)加速IO,IOPS有著比較大的提升,這個(gè)是我們大多數(shù)云主機(jī)的標(biāo)配。目前整個(gè)云計(jì)算市場(chǎng)價(jià)格戰(zhàn)趨勢(shì)明顯,從公司運(yùn)營(yíng)層面考慮,SSD的容量?jī)r(jià)格比還不夠完美,因此我們接下來(lái)雖然會(huì)推出純SSD產(chǎn)品,但是只會(huì)應(yīng)用在中高端云主機(jī)上。
CSDN:你提到華云數(shù)據(jù)只用OpenStack中的KVM管理,OpenStack也很難大規(guī)模使用,可否可以詳細(xì)說(shuō)說(shuō)?
郭曉:華云是在2013年初才開(kāi)始嘗試深入接觸Openstack,我們的技術(shù)人員在測(cè)試環(huán)境中部署了完整的Openstack,使用了全部已有組件,閱讀了Openstack的全部代碼,同時(shí)我們也對(duì)比了IBM基于Openstack的SCE+,IBM和我們當(dāng)時(shí)都判斷Openstack不適合大規(guī)模的發(fā)展。在我們的實(shí)驗(yàn)環(huán)境下,物理服務(wù)器數(shù)量到了一定程度的時(shí)候(不超過(guò)100臺(tái)),整個(gè)網(wǎng)絡(luò)性能將大幅度下降。當(dāng)然,我們也看到從Grizzly到Havana再到icehouse,Openstack一直在提升這方面的性能,也許有一天我們會(huì)大規(guī)模的使用Openstack。但是目前階段,我們還是以自主開(kāi)發(fā)為主。
CSDN:可否可以做一些SDN方面的相關(guān)分享?
郭曉:目前我們做的是軟件級(jí)的SDN,提供了包括SLB、vFirewall、VLAN等功能、整個(gè)系統(tǒng)可以做的很靈活,但是對(duì)計(jì)算節(jié)點(diǎn)服務(wù)器的計(jì)算性能開(kāi)銷很大,目前我們正在接觸一些SDN硬件的廠商,測(cè)試他們的產(chǎn)品,也歡迎有合作意向的廠商能聯(lián)系我。
CSDN:對(duì)于華云數(shù)據(jù)當(dāng)下的資源復(fù)用度能達(dá)到多少?
郭曉:華云數(shù)據(jù)現(xiàn)在復(fù)用的是CPU和帶寬,內(nèi)存與存儲(chǔ)空間我們不會(huì)復(fù)用。華云會(huì)實(shí)時(shí)監(jiān)控CPU和帶寬的工作情況,確保它不會(huì)影響到用戶的體驗(yàn),其中帶寬的復(fù)用度平均在10倍以上。同時(shí),基于對(duì)某此資源有特定需求的用戶,我們也可以提供獨(dú)享的環(huán)境滿足他的需求,但是價(jià)格上面肯定和普通的用戶不一樣。
CSDN:剛有說(shuō)到備份,華云數(shù)據(jù)的災(zāi)備具體是什么樣的?
郭曉:我們每天0點(diǎn)都會(huì)進(jìn)行一次完整備份,這個(gè)備份會(huì)放到其他機(jī)房以應(yīng)對(duì)突發(fā)災(zāi)難。而在年底,我們會(huì)推出云備份,這是一個(gè)熱的備份,可以達(dá)到故障轉(zhuǎn)移效果,這將是一個(gè)增量備份。當(dāng)然,不管是異地冷備份,或者是云備份都是收費(fèi)的,默認(rèn)免費(fèi)的是同一數(shù)據(jù)中心的冷備份。
CSDN:關(guān)于政府對(duì)數(shù)據(jù)監(jiān)控,國(guó)內(nèi)的政策是什么樣的?
郭曉:每個(gè)ISP都必須安裝違規(guī)數(shù)據(jù)監(jiān)控系統(tǒng),接入資源管理系統(tǒng)和備案系統(tǒng),這個(gè)系統(tǒng)24小時(shí)與工信部的系統(tǒng)對(duì)接,政府可以隨時(shí)下達(dá)某個(gè)關(guān)鍵詞過(guò)來(lái),然后ISP系統(tǒng)入庫(kù)、監(jiān)控并返回相關(guān)數(shù)據(jù)給主管部門(mén)。華云數(shù)據(jù)的這一套系統(tǒng)已經(jīng)開(kāi)發(fā)出來(lái),是一朵合規(guī)的云,相信在兩三年后大家都會(huì)與政府對(duì)接。其實(shí)政府采集的數(shù)據(jù)不是很敏感,只會(huì)收集類似URL等信息。
CSDN:關(guān)于數(shù)據(jù)遷出華云數(shù)據(jù)服務(wù)器上,是否有什么門(mén)檻?
郭曉:在華云數(shù)據(jù),不管是數(shù)據(jù)接入還是移出都是免費(fèi)的,完全不存在綁定。同時(shí),華云數(shù)據(jù)現(xiàn)在正在開(kāi)發(fā)一個(gè)工具,可以一鍵將應(yīng)用鏡像到用戶的本地。當(dāng)然在數(shù)據(jù)接入上,無(wú)論是華云數(shù)據(jù),還是其他國(guó)內(nèi)供應(yīng)商,都提供了遷入的技術(shù)支持,不過(guò)華云也提供全自動(dòng)的遷移工具,幫助用戶把業(yè)務(wù)從物理服務(wù)器移到云端。