運營商的大數(shù)據(jù)有價值毋容置疑,筆者在《PK BAT大數(shù)據(jù)?談?wù)勥\營商大數(shù)據(jù)的價值》一文中有詳細的闡述,但當前面對的挑戰(zhàn)不少。
“為什么公司擁有這么多大數(shù)據(jù),好像對于內(nèi)部經(jīng)營的改善還不多!”
“對外價值變現(xiàn)的收入還不怎么夠看,什么原因呢?”
“建立了大數(shù)據(jù)平臺,采集了很多數(shù)據(jù),投資什么時候回本呢?”
當然可以有很多的理由,諸如組織、機制、流程、人才等等原因,老生常談了,特別是安全像達摩克利斯劍一樣懸在胸前。
但除了外部客觀因素,也需要思考一下,是否也有內(nèi)生的原因?當前的運營商新增大數(shù)據(jù)的質(zhì)量真的經(jīng)受得住市場的檢驗嗎?
在運營商內(nèi)部經(jīng)營中,似乎賬單、用戶、訂購、話單老的小數(shù)據(jù)仍然是分析的主要數(shù)據(jù),也是營銷的主要依賴數(shù)據(jù),諸如位置、上網(wǎng)、社交、信令等很多大數(shù)據(jù)似乎“名不符實”, 實際用的還比較少,什么原因呢?
當然有推廣培訓(xùn)的因素,但筆者還認為有更重要的原因,即這些大數(shù)據(jù)的“原生價值”有限,只有經(jīng)過加工,比如建模,才能讓這些數(shù)據(jù)發(fā)揮出真正的價值。
舉個例子,說運營商的上網(wǎng)數(shù)據(jù)有價值,那運營商上網(wǎng)的原始記錄是怎樣的呢?這里以http為例:
這個冰冷的URL對于網(wǎng)絡(luò)性能分析可能有價值,比如可以統(tǒng)計京東APP的流量啥的, 但與結(jié)構(gòu)化的ARPU、MOU等能直接用于營銷的小數(shù)據(jù)相比,業(yè)務(wù)人員似乎沒有什么手段去獲得這個URL承載的信息或知識。
高喊著運營商DPI數(shù)據(jù)有價值沒有意義,談DPI被HTTPS也有點杞人憂天,運營商需要用工匠的精神去挖掘出這些數(shù)據(jù)的潛力,這些數(shù)據(jù)就如浮在海面上的冰山,你只看到了10%,90%都沉在下面,然后束手無策:
互聯(lián)網(wǎng)公司跟運營商也是有合作的,他們對于DPI數(shù)據(jù)是非?粗氐模R上能拿去變現(xiàn),差距在哪里呢? 當然有渠道的因素,但不僅于此。
很大的差距就在于數(shù)據(jù)加工能力,一般有兩個層面的含義,解析和建模,解析是把原生的數(shù)據(jù)加工成可以使用的結(jié)構(gòu)化業(yè)務(wù)信息,建模是基于這個信息再去挖掘出知識,以下統(tǒng)一稱為建模能力。
筆者總結(jié)了運營商大數(shù)據(jù)需要具備的五個核心建模能力,社交網(wǎng)絡(luò)、序列模式、空間建模、內(nèi)容挖掘及在線推薦,這對于運營商未來的內(nèi)外規(guī);儸F(xiàn)至關(guān)重要。
當前運營商最大的變現(xiàn)應(yīng)用,逃不過用戶信息的驗真及基于位置的客流、旅游、公安等等,這些都還是淺層次的應(yīng)用。
客戶的應(yīng)用一旦深入,很多運營商大數(shù)據(jù)應(yīng)用的底層數(shù)據(jù)的質(zhì)量恐怕會面臨挑戰(zhàn),現(xiàn)在有不少的應(yīng)用場景由于數(shù)據(jù)的原因而無法推進,比如上海迪士尼樂園關(guān)于位置數(shù)據(jù)精度的要求,雖然商業(yè)前景極其廣闊,但其對于數(shù)據(jù)的要求卻是及其嚴苛的,這個在未來激烈的市場競爭中會成為常態(tài),現(xiàn)在能賺錢的并不代表客戶一直愿意為你買單,筆者常常想,換成我是客戶,我會為這些產(chǎn)品買單嗎,運營商產(chǎn)品給我到底帶來了什么價值?
想到了炒股總有虧有賺的,最終的贏家似乎還是價值投資者,不求一時但求長遠,運營商也許需要一步一個腳印,用厚重來打造出自己的大數(shù)據(jù)優(yōu)勢,以下五個建模能力也許能支撐起運營商大數(shù)據(jù)的未來。
1、社交網(wǎng)絡(luò)
運營商以前的營銷都是基于個人的營銷,隨著家庭市場、政企市場、簇群市場的崛起,運營商未來必將以群體營銷為一個核心,今天跟杭分的一個同事交流,給了我一個啟示,未來所有的流量營銷可能都要以家庭為單位,你必須知道每個人的家庭關(guān)系,才能對于家庭成員進行精細的分析,才能得到新的群體營銷機會。
政企也許也這樣,你必須找到集團的關(guān)鍵人物,才能進行一次營銷,客戶經(jīng)理縱有通天的本領(lǐng),你也不知道新的集團什么時候產(chǎn)生,什么時候有新的營銷機會,你總是滯后的,也許,社交網(wǎng)絡(luò)可以幫到他。
業(yè)界用的很成熟的PageRank,運營商似乎也沒怎么用,仍然用交往圈大小來粗獷的判斷一個用戶的影響力, 關(guān)系和影響力也未在運營商的營銷中占據(jù)一個位置,能否改變一下用通信arpu判斷用戶價值的方式?
在對外變現(xiàn)中,客戶已經(jīng)有家庭,朋友,同事方面的標簽要求了,未來這類需求將會越來越多。
簇群營銷一定會茁壯成長,換終端,用戶更愿意相信身邊朋友的推薦和建議,看視頻,我其實更關(guān)注朋友們在追蹤啥,這些,對于運營商都是機會,因為維系著一張最硬的社交網(wǎng)絡(luò),這張網(wǎng)絡(luò)的價值不僅僅是以前的通信價值,未來的社交價值將越來越大。
2、序列模式
運營商傳統(tǒng)營銷中基于ARPU、流量等進行規(guī)則限制的營銷都屬于靜態(tài)營銷,丟失了大量有價值的時間信息,比如月末流量飽和度高和月初流量飽和度高反映了不同的需求,但營銷中可能仍然一視同仁,因為尋找頻繁序列需要一定的建模技能。
中國移動的天盾反欺詐系統(tǒng)正是通過信令的時間序列建模精準的進行了欺詐的識別和攔截,天盾只是一個簡單的案例,運營商還有位置序列、通話序列、上網(wǎng)序列、短信序列以及這些序列的組合,基于這些序列運營商可以挖掘到更有價值的信息,比如曾經(jīng)在某個地市的位置序列中發(fā)現(xiàn)固定的人群的遷移規(guī)律,序列代表了一種生活規(guī)律,也許,商機就蘊藏在這些序列中,有待于運營商去挖掘。
3、空間建模
運營商當前80%的商業(yè)變現(xiàn)估計是基于位置數(shù)據(jù)創(chuàng)造的吧,但運營商的空間能力可遠不止于此。
隨著運營商變現(xiàn)的深入,商業(yè)驅(qū)動著運營商會去做位置精度的持續(xù)提升,從基于基站的幾百米到MR的幾十米再到幾米,當前浙江移動的位置精度已經(jīng)到了商場級別了,位置精度的提升也帶來了產(chǎn)品能力的提升,如下圖所示:
位置是理解客戶的一把鑰匙,新零售創(chuàng)新的一個抓手,運營商最為寶貴的數(shù)據(jù)財富,將隨著精度的提升創(chuàng)造無限的應(yīng)用場景。
4、內(nèi)容挖掘
運營商的原生DPI價值不大,但通過網(wǎng)址解析、爬蟲和文本挖掘,就可以讓DPI數(shù)據(jù)產(chǎn)生巨大的價值,這是毋容置疑的,以下圖一是爬蟲邏輯,圖二是爬取的示意,圖三是獲得的知識庫示意。
從DPI中的URL可以獲得有效的爬蟲網(wǎng)址,通過爬蟲獲得知識庫信息,這將能真實的反應(yīng)是否是用戶點擊了某部電影,某首歌曲,某本書等等, URL的解析能力和知識庫的規(guī)模決定了運營商DPI數(shù)據(jù)的價值。
如果獲得的是文本信息,可以采取文本挖掘技術(shù),比如信息抽取,文本摘要、文本聚類和文本分類等,從而構(gòu)建出用戶的內(nèi)容偏好,以下是一個示例:
從數(shù)據(jù)的角度看,運營商管道是不是啞了不是由互聯(lián)網(wǎng)說了算,而是由運營商的建模能力決定,諸如電商https影響很大,但這個世界很大,并不是僅僅只有電商,互聯(lián)網(wǎng)的長尾效應(yīng)還是很長的。
但內(nèi)容挖掘涉及的技術(shù)很多,爬蟲系統(tǒng)得靠自己建,知識庫建立需要較大的人力投入和維護成本,自然語言處理+搜索也不是那么容易搞定,對于運營商挑戰(zhàn)實在有點大,但運營商一定要堅持做這個,從管道中逼真的還原用戶的行為,這個才是未來。
5、在線推薦
隨著新零售口號的響起,線上線下融合也將在運營商刮起旋風(fēng),運營商強大的線下能力逐步要為線上引流了,線上的大數(shù)據(jù)最大價值就是推薦吧,智能推薦技術(shù)將是運營商必須掌握的建模技術(shù)。
這個領(lǐng)域門檻不是很高,但起步也并不容易,浙江移動的咪咕愛看是個視頻APP,推薦大家下載使用,經(jīng)常有流量優(yōu)惠和贈送,性價比很高哦,近期上線的猜你喜歡欄目采用的推薦引擎是如下四個模型的綜合:
習(xí)慣了線下目標用戶群用經(jīng)驗規(guī)則取數(shù)的業(yè)務(wù)人員,從線下轉(zhuǎn)到線上,除了營銷渠道發(fā)生了變化,推薦方式也有了巨大改變,要相信智能推薦技術(shù)會比人工經(jīng)驗好,這是為互聯(lián)網(wǎng)公司證明了的,只要迭代次數(shù)夠多,模型就能實現(xiàn)千人千面,這一點,要向互聯(lián)網(wǎng)公司學(xué)習(xí),人工選擇的熱門推薦當然也不錯,但機器學(xué)習(xí)推薦是有長尾效應(yīng)的,比如亞馬遜假如總是向我推薦最熱門的書籍就沒啥意義了。
五大數(shù)據(jù)模型,是筆者認為運營商進一步提升自身數(shù)據(jù)價值要去努力的方向,它是基于運營商特有數(shù)據(jù),綜合采用爬蟲、社交網(wǎng)絡(luò)、搜索、推薦、自然語言處理等技術(shù)才能打造出來的,正如互聯(lián)網(wǎng)公司花了很大代價去做ID-MAPPIN1NG一樣,這些都是核心能力,需要運營商以工匠的精神去傾力打造。