PPT干貨丨傅一平:運營商的大數(shù)據(jù)變現(xiàn)實踐

數(shù)據(jù)觀
傅一平
3月29日,由東湖大數(shù)據(jù)發(fā)起、數(shù)據(jù)觀作為合作媒體參與的大數(shù)據(jù)百人會·線上沙龍第9期活動圓滿結束,浙江移動大數(shù)據(jù)中心傅一平博士就《運營商大數(shù)據(jù)變現(xiàn)實踐》主題與大家分享了數(shù)據(jù)利用的心得與經驗,帶來了兩個多小...

3月29日,由東湖大數(shù)據(jù)發(fā)起、數(shù)據(jù)觀作為合作媒體參與的大數(shù)據(jù)百人會·線上沙龍第9期活動圓滿結束,浙江移動大數(shù)據(jù)中心傅一平博士就《運營商大數(shù)據(jù)變現(xiàn)實踐》主題與大家分享了數(shù)據(jù)利用的心得與經驗,帶來了兩個多小時的精彩直播演講。運營商擁有龐大且具有絕對話語權的數(shù)據(jù)資源、數(shù)據(jù)儲備,關于對數(shù)據(jù)利用的心得與經驗,傅一平先生圍繞浙江移動的平臺能力、數(shù)據(jù)管理、數(shù)據(jù)能力、標簽能力、產品服務這5大內容深入淺出地做出描述。十足的干貨、通俗易懂的表達方式,專業(yè)的視角和獨到的解讀吸引了3326人次在線觀摩學習。以下附文字干貨及完整版PPT,本次沙龍錄音內容以第一人稱整理。

?以下為文字干貨

1、運營商的平臺能力

2004年我進入浙江移動,3年前開始從事大數(shù)據(jù)相關的工作,推動了浙江移動大數(shù)據(jù)變現(xiàn)工作的開展,浙江移動在大數(shù)據(jù)變現(xiàn)過程中碰到了很多問題,我們在實踐和探索中也總結出了一些經驗,今天與大家分享一下。

數(shù)據(jù)變現(xiàn)我不能直接去談商務模式,因為商務模式依賴于我們平臺、數(shù)據(jù)和標簽能力。運營商的平臺能力分為五橫一縱,從數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)訪問到數(shù)據(jù)應用,還有管理平臺,這是一個標準架構?;ヂ?lián)網公司的大數(shù)據(jù)平臺架構可以與其作一定的映射,當前,浙江移動從這五個方面也初具雛形。

浙江移動經過兩期系統(tǒng)的建設,采用了非常多樣的技術組件,底層用的是華為的BDI,中間的處理層用的是hadoop,有商用的,也有開源的版本,大家可以看到里面有3個應用集群,中間我們使用的是MPP,MPP用來做我們的報表,主要是融合、復雜以及交叉的分析,當然我們也采用了ASTER的數(shù)據(jù)挖掘庫,它提供了一些現(xiàn)成挖掘的API,計算速度比較快,流處理的話我們使用的是IBM STREAM,海量數(shù)據(jù)處理方面很不錯。往上一層我們主要是做讀寫分離的,有Oracle、HBASE、KV數(shù)據(jù)庫,為應用層提供支撐。

運營商如果想對外變現(xiàn),它必須具備像阿里云一樣方便駐戶進駐的能力,它的平臺能力應該是所見即可得的,浙江移動大數(shù)據(jù)平臺可以在一周內實現(xiàn)合作伙伴的入駐并實現(xiàn)全方位的開放,當前外部合作伙伴已經超過30個,當然這僅僅是起步的階段,“我方搭臺、對方唱戲”的這種模式對平臺來講是必不可少的,很多公司如果沒有多駐戶的開通能力,變現(xiàn)是不大可行的。

2、運營商的數(shù)據(jù)管理

數(shù)據(jù)管理每個公司需要,浙江移動這些年做起來艱巨,我這里提煉了對數(shù)據(jù)管理非常核心的幾點,也是在實際中碰到的:①二級互動,你的數(shù)據(jù)必須與源系統(tǒng)打通,源系統(tǒng)變動時,大數(shù)據(jù)平臺所有相關的數(shù)據(jù)字典都應該變動,這能解決兩張皮的問題。②因為大數(shù)據(jù)平臺組件很多,你的數(shù)據(jù)管理平臺必須讓所有的技術組件對你開放,就比如說我們采用的華為BDI的產品,我就必須讓他開放所有BDI的元數(shù)據(jù)接口,這樣整個公司的數(shù)據(jù)管理體系才是一體的,否則你就斷了條胳膊,你做的數(shù)據(jù)分析都無法貫通,這是大家在引入技術組件特別要注意的。③數(shù)據(jù)建模,強調數(shù)據(jù)標準化和可視化,你所有的建模都應該是基于規(guī)范的,你所有表的命名都應該有自己的規(guī)則,這樣整個公司所有大家看到的數(shù)據(jù)是一致的,所有的合作伙伴都能共享標準化的數(shù)據(jù)。當然數(shù)據(jù)管理也是一種追求,你一個小公司搞一個元數(shù)據(jù)產品其實沒有必要,假如公司做大了,你做數(shù)據(jù)管理成本會非常高,因此必須要通過系統(tǒng)化、透明化的方式來管理,不做的代價是數(shù)據(jù)知識沒有積累和傳承。

數(shù)據(jù)管理雖然做了很多規(guī)范,但所有的規(guī)范都應該納入系統(tǒng)中,這樣才能保證你所有的系統(tǒng)數(shù)據(jù)管理規(guī)范都能在系統(tǒng)中落地,不然靠人去推動,基本上你的數(shù)據(jù)管理系統(tǒng)是會失敗的。數(shù)據(jù)管理用后向模式去做不是性價比高的方式,你必須做成前向,在開發(fā)的過程中就應該把數(shù)據(jù)管理工作嵌入進去,數(shù)據(jù)管理跟每個開發(fā)、需求、測試人員息息相關,這是我們多年數(shù)據(jù)管理中深刻的體會。

數(shù)據(jù)管理平臺很難通用化,無論是通訊行業(yè)、金融行業(yè),由于本身的垂直行業(yè)特點,你的數(shù)據(jù)管理平臺必須符合你垂直行業(yè)特點,想單靠一套數(shù)據(jù)管理平臺來做成每個行業(yè)是很難成功的,這是我觀點。而且數(shù)據(jù)管理平臺非常強調運營,它需要這個平臺不停地迭代,相對而言它對定制化的要求很高,同時,我們的數(shù)據(jù)管理平臺在大數(shù)據(jù)時代要適配所有的技術組件,要能屏蔽技術細節(jié),對上提供透明化,可視化的訪問和開發(fā)能力。

浙江移動的數(shù)據(jù)是非常豐富的,它提供1600種數(shù)據(jù)類型、300個融合模型.10萬個客戶標簽以及上百個API,運營商只有把基礎設施建好了才能為我們的客戶提供更快更好的數(shù)據(jù)服務。

3、運營商的數(shù)據(jù)能力

運營商做數(shù)據(jù)變現(xiàn),它的核心差異化的競爭優(yōu)勢就是數(shù)據(jù)的差異化能力,離開了差異化的能力,你說運營商去做變現(xiàn)和互聯(lián)網公司競爭也不大現(xiàn)實,因為我們在人才、薪酬、機制、流程各個方面處于全面的落后,還是需要利用我們差異化的能力去在市場上進行探索和競爭,這也是迫不得已。

浙江移動擁有6000萬的客戶,每個月手機上網的數(shù)據(jù)是1.5萬億條,通話記錄每個月是100億次,位置軌跡每個月是1500億條,寬帶記錄每個月是10萬億條,現(xiàn)在的集群規(guī)模是1400+,集群規(guī)模與互聯(lián)網公司比有一定差距,我們也在努力。

運營商最核心的數(shù)據(jù)有八個方面通信、支出、社交、上網、身份、位置、時序、終端,當然還有外部數(shù)據(jù),以前運營商是不太重視的,比如大眾點評網數(shù)據(jù)、天貓品牌、京東商城、淘寶數(shù)據(jù)等,在對外變現(xiàn)的時候,你會發(fā)現(xiàn)爬取這類數(shù)據(jù)實際上對運營商非常重要。

我們現(xiàn)在通過通話數(shù)據(jù)可以把所有的社交關系認出來,父母、親人、朋友所有的社交人脈路徑都能找出來而且非常準;另外運營商的通訊機制保障了你每次通話、上網所有的終端行為都會上傳運營商網絡,數(shù)據(jù)質量也很好,終端市場報告由運營商來出示非常有說服力,因為所有的數(shù)據(jù)都是活的也是及時的;還有黃頁數(shù)據(jù),任何用戶比如打一個電話是黃頁數(shù)據(jù)的話,你就可以知道這個用戶的需求,對于精準營銷非常重要;當然我們運營商還有和教育的數(shù)據(jù),比如我們想知道成績好孩子的家長有什么樣的特性,運營商可以做這樣的分析報告,我們通過校園通這類行業(yè)應用產品大概能知道所有的學校、家長、教師、學生的信息,基于這些信息可以給出分析結果,未來前景巨大。

運營商的數(shù)據(jù)有四個特點:完整性、連續(xù)性、多維性、整合性。完整性是指比如京東的數(shù)據(jù)、淘寶的數(shù)據(jù)實際上運營商都有,也許沒有那么詳細,但可以擁有任何一家的互聯(lián)網公司的數(shù)據(jù);連續(xù)性是指我們每天生活在時空中,要么在線下要么在線上,運營商所有的數(shù)據(jù)都有,比如線下你所有的位置數(shù)據(jù)運營商有,線上你所有上網數(shù)據(jù)也有,基于線上線上再加用戶屬性,運營商可以完整連續(xù)的刻畫;多維性是指運營商擁有時間、空間和用戶多種屬性數(shù)據(jù),相對可以實施降維打擊,通過時空交叉驗證可以把模型做的非常準;整合性的意思是運營商擁有號碼、IMEI、IDFA、COOKIE幾乎所有的用戶ID,所有ID信息整合在一起可以實現(xiàn)全數(shù)據(jù)的關聯(lián),這也是運營商的巨大優(yōu)勢。

至于大家非常關心的HTTPS,我不太在意,HTTPS現(xiàn)在呈擴大的趨勢跟流量劫持有一定關系,主要還是因為互聯(lián)網為了保證它自身利益,從數(shù)據(jù)的角度來講,即使HTTP最后僅有20%可開采,對運營商也足夠了來構建自己的用戶畫像了,況且現(xiàn)在很多數(shù)據(jù)還沒有開采,應對HTTPS的重要程度遠遠低于運營商對自身數(shù)據(jù)采集解析的要求,沒必要杞人憂天;另外APP協(xié)議成千上萬,HTTP整個流量占比也不超過30%吧,再者運營商有巨大的資源,完全可以利用資源去換取內容知情權,比如騰訊大小王卡,給你免費定向流量,用資源換取內容知情權,再通過全內容為你提供增值服務,這個套路很多公司都在做,我們運營商要做在當下。

如果搞過搜索、爬蟲、自然語言看來這個天眼用戶偏好檢索系統(tǒng)就知道它想干什么,實際上百度做的就是通過輸入關鍵詞它能找到所有的信息,運營商能做的是我輸入一個關鍵詞它能找到所有相關的用戶,因為百度是沒有用戶的,而運營商擁有所有的用戶,比如我輸入足球關鍵詞,我可以把五千萬用戶對足球的偏好進行排序,大家可以想象未來運營商變現(xiàn)的空間有多大。

運營商雖然擁有數(shù)據(jù),但我不能說就等于抱著金礦或原油,運營商的數(shù)據(jù)開采的代價非常大,運營商現(xiàn)在的數(shù)據(jù)以通訊數(shù)據(jù)為主,必須要“去電信化”才能在生態(tài)中生存,否則你數(shù)據(jù)直接去賣也賣不了幾個錢,還有運營商賣原始數(shù)據(jù)實際上等同“殺雞取卵”,安全上不可取也不可持續(xù),運營商要變現(xiàn)必須從建模中發(fā)現(xiàn)數(shù)據(jù)的價值,這也是當下變現(xiàn)的軟肋,因為我們基礎建模能力還很弱。

4、運營商的標簽

運營商正在從傳統(tǒng)通信畫像向真正的客戶畫像轉變,在事件標簽中,我們可以把家人、親戚、工作伙伴及行業(yè)通話信息串起來,我們有所有的線下事件、線上事件、專題事件,比如前段時間的云棲大會把所有事件記錄下來以便對專門的用戶進行專項分析,別看云棲大會這兩年很熱鬧,我們分析過兩年的會議數(shù)據(jù),用戶連續(xù)參加兩年云棲大會的比例極低。

用戶社會畫像看起來與運營商的數(shù)據(jù)沒多大關系,但恰恰是基于運營商的數(shù)據(jù)可以做出來,包括職業(yè)、人生階段甚至家庭等等,都能判斷出來。而位置標簽無論是常駐位置、工作位置、事件出行、移動軌跡,不管是連續(xù)還是靜態(tài)的都是可以抓取以作用戶分析,當然有人會提這涉及到用戶的隱私,我們所有的信息處理時是去隱私化的,主要是用來做特征分析,大家不用擔心信息安全的問題,互聯(lián)網公司其實一樣,他拿著用戶所有的交易信息來做特征分析,但絕不會把清單型數(shù)據(jù)透露給外面,這是我們秉承的原則。上網行為中,無論是APP的使用、網頁訪問、使用時間序列很有價值,以此可以判斷用戶的偏好,為用戶更好的服務,這個互聯(lián)網公司做的比較多,運營商正處在起步階段。

5、運營商的產品體系

現(xiàn)在我們的產品體系很豐富,有客流、選址、引客、APP、反欺詐和驗真,我們也有廣告平臺“喜從天降”、終端產品“有機密”等,同時提供大量標準化的產品,這類產品要創(chuàng)造效益,還有很長的路要走。

比如選址雷達,你可以根據(jù)標簽選擇偏好用戶所在的位置,以方便商戶選址;另一款叫引客雷達是你可以上傳一批目標客戶的號碼,我通過Lookalike的方式幫你找到潛在用戶在哪里;至于金融驗真產品,大家不用擔心用戶隱私的問題,因為都是通過用戶授權的,身份驗證主要是通過手機、身份證和姓名進行三證合一,當然還可以做刷單行為的判斷,比如滴滴刷單,你可以把司機手機號碼和客戶的號碼交給運營商,運營商通過兩個號碼之間位置切換的關系來判斷是不是異常。

運營商合作的幾種形式:① 數(shù)據(jù)服務:比如驗證,運營商提供標簽,你輸入用戶號碼,我們提供標簽;這是第一種服務模式我們叫做數(shù)據(jù)云化,當然無論是模型還是標簽都是一樣的。這個更多的運營在驗證場景,主要通過用戶授權。②模型錘煉:由于現(xiàn)在大數(shù)據(jù)處于起步階段,許多企業(yè)處于觀望心態(tài)。浙江移動提供了模型錘煉的服務,我開放你數(shù)據(jù)服務,當然這些是去隱私的,你可以在我們平臺上進行模型淬煉,如果你覺得達到要求了,我們再正式商用、收費;③產品孵化:運營商(包括浙江移動)我們的產品研發(fā)能力是有限的,不可能在各個方面都做端對端的產品,我們希望有更多的伙伴和我們合作,分成都是可以的,這一塊我們也在做許多嘗試。④渠道廣告:比如我剛才提到的“喜從天降”,運營商有許多渠道,比如微信公眾號等等,可以將運營商在數(shù)據(jù)方面的能力與各產業(yè)合作伙伴的需求結合在一起,短信等傳統(tǒng)渠道由于政策方面的原因,還有待觀望。

信息服務費指的是按次查詢信息需要收取的費用,比如驗證,一個號碼與身份證的匹配關系,比方說每次收取一次一塊錢或者兩塊錢,這都是通過用戶授權以后,我們可以和銀行合作收取的信息服務費。信息使用費是指你租用我們的數(shù)據(jù)之后,我們按照數(shù)據(jù)里面用戶的量,比如每一千用戶收取多少費用。設備租賃費和阿里云類似的方式。

我們客流產品是如何收費的?它要收取功能費和增值功能費,這個產品涉及到位置,我們可以按照位置的扇區(qū)可以單獨收費。這是對于相對成熟產品的收費方式。

運營商是非常負責任的國企,有自己的數(shù)據(jù)安全原則:“凡是能夠直接或者間接地識別自然人的任何信息,包括身份證、手機號碼、IMEI、COOKIE等,都不能對外提供”,這一點許多互聯(lián)網公司是沒有遵循的,他們的串號、COOKIE都是可以互相交換的,但是對運營商來講這一點很難,因為COOKIE也是代表了用戶的屬性,這也是存在隱私風險的,運營商做大數(shù)據(jù)難也是難在這里,國企對于稍有模糊的地帶都是不敢踩的,因此我們是非常艱難的?!安簧婕皞€人清單信息的數(shù)據(jù)分析服務和產品服務,比如行業(yè)分析報告”,這些是可以做的,因為這些是統(tǒng)計類的信息?!盎谟脩羰跈嗟母黝悢?shù)據(jù)服務”這些我們也是都可以做的,不論是查詢標簽,還是個人身份信息。

只有確保這些前提下,運營商才能做各類變現(xiàn)服務,挑戰(zhàn)難度是相當大的,這也是在考驗運營商的創(chuàng)新能力。

我們對外合作的形式包括① 標準化產品模式:這一類產品業(yè)務比較誠實,產品標準化程度高,我們向第三方購買也有可能。②合作運營模式:運營商只有數(shù)據(jù),沒有任何產品、建模能力。這時我們希望與合作伙伴合作然后大家分成。③外包解決模式:這是一種比較傳統(tǒng)的方式,通過招標給運營商提供定制服務,然后運營商自己面對最終客戶。④ 應用孵化模式:運營商開放部分脫敏數(shù)據(jù),幫助合作伙伴進行數(shù)據(jù)產品孵化。

浙江移動為了做大數(shù)據(jù)運營變現(xiàn)專門成立了大數(shù)據(jù)中心、云計算中心。由這兩個中心保障大數(shù)據(jù)專業(yè)化的進行服務。沒有專業(yè)的人做專業(yè)的事,做大數(shù)據(jù)變現(xiàn)是不可能的。

那么運營商缺什么呢?①數(shù)據(jù)建模能力:運營商經營分析起家,以前的數(shù)據(jù)挖掘基本是數(shù)據(jù)外包的形式做的,但是進入大數(shù)據(jù)時代以后,對建模的能力要求越來越高,運營商非常稀缺這一類資源。②平臺技術:運營商現(xiàn)在也在建立大數(shù)據(jù)平臺,現(xiàn)在平臺已經建立起來,但是售后服務支撐能力是非常薄弱的,因為技術組件太多了,我們在變現(xiàn)中發(fā)現(xiàn)了大量的問題,需要我們在技術方面進一步突破。③連接能力:運營商對各個行業(yè)是不熟悉的,希望有能撮合最終客戶和運營商的企業(yè),這對我們很重要。④運營能力:這里有一部分文化因素,因為許多從業(yè)人員是從運營商的體系中轉過來的,在策劃、運營方面缺乏經驗,我們需要擅長做運營的企業(yè)與我們合作,其實我們什么都缺。

?以下為個人觀點

大數(shù)據(jù)變現(xiàn)對運營商的挑戰(zhàn)巨大,首先是速度。大家都知道做大數(shù)據(jù)十有八九是會失敗的,你做了這么多產品、采集了這么多數(shù)據(jù),有多少能用,有多少能真正成功,有多少客戶愿意來買單很難說。十個里面能成功一兩個已經很好了,這個時候你的速度是很重要的,如果你開發(fā)一個應用要兩個月甚至半年,那基本上沒法跟上節(jié)奏。

另一個是渠道,運營商如果只有數(shù)據(jù)沒有渠道也很難成功,不能脫離業(yè)務去做大數(shù)據(jù)。比如說我們現(xiàn)在有大數(shù)據(jù)交易平臺,但是現(xiàn)在在大數(shù)據(jù)交易平臺在個人隱私沒有定論的前提下是很難做的。我們在做大數(shù)據(jù)變現(xiàn)的時候傳統(tǒng)渠道不能用,必須要創(chuàng)造新的渠道,這樣才能讓大數(shù)據(jù)承載在上面,大數(shù)據(jù)才能成為渠道的放大器。

第三點是數(shù)據(jù)為王,運營商做任何產品是離不開數(shù)據(jù)的,如果做的產品與差異化的數(shù)據(jù)沒有結合起來,十之八九就會失敗。相對于互聯(lián)網公司,你沒有任何競爭力,唯一的核心競爭力就是數(shù)據(jù)。

最后是運營,運營只有持續(xù)的迭代才有可能成功,KPI也是一種信仰,運營商原來的機制、流程比較冗長,它的迭代速度還是比較慢的。

另外,運營商對外也是反輔主業(yè)的需要,因為運營商進入流量經營時代后,內容運營越加迫切,傳統(tǒng)的標簽體系根本無法支撐,我們在對外變現(xiàn)中,發(fā)現(xiàn)外部客戶對于標簽的要求是非常高的,這驅動了我們去完善自己的內容標簽體系,同時,運營商通過大數(shù)據(jù),也可以培養(yǎng)和挽留住一批人才,你必須給一些人一些出口,可能運營商對外短期內無法規(guī)模變現(xiàn),但它也承擔著更多的使命,你不去實踐,永遠不懂大數(shù)據(jù)到底是什么。

大家都在找大數(shù)據(jù)的商業(yè)模式,我覺得現(xiàn)在商業(yè)模式已經很多了,實際上真正賺錢的大數(shù)據(jù)變現(xiàn)模式只有兩種,一種是金融風控,一種是廣告。再找到第三種已經很難了。我們現(xiàn)在已經嘗試了一些,無論是做報告還是洞察,實際上最大規(guī)模的變現(xiàn)就是金融和廣告。

運營商更需要的是工匠精神,需要精益求精,在某一點上進行單點突破,而不要求泛,每一方面都做一點但每一點都沒辦法做透。因為無論你的數(shù)據(jù)模型能力,還是運營能力、產品能力,都存在非常大的欠缺,你不可能有精力做那么多,我們希望能創(chuàng)造一個生態(tài),與各界合作共創(chuàng)大數(shù)據(jù)的未來,服務好我們的客戶,這也是我的期望。

?Q&A

Q:請問客流分析產品的市場需求有多大?

A:客流分析的產品市場相當大,但它受限于定位的精度。但是如果我們能基于精準位置定位,比如說如果我們取MR的數(shù)據(jù)來做,能夠做到50米到100米的精準定位,這個是非常廣闊的市場,通過1-2年的時間,這個產品肯定能做出來,這個是非常有前景的,因為他可以定位到某幢樓,我對此也是非常有信心。

Q:MR和DPS是如何連接起來?

A:這個和運營商的數(shù)據(jù)有關系,MR相當于測量報告,我們運營商上網數(shù)據(jù)需要SE—MME有一個信令數(shù)據(jù),這個信令數(shù)據(jù)里面就有我們的經緯度數(shù)據(jù),它里面的ID里面有一個標識,這個標識可以和MR里的標識結合起來,這個時候你就可以得到一個關聯(lián)。

Q:目前浙江移動在大數(shù)據(jù)廣告方面有開展業(yè)務嗎?

A:廣告這一塊,我們之前有做過,但是由于安全的原因這一塊兒暫停了,運營商的數(shù)據(jù)有它的特殊性,比如手機閱讀這一塊兒,我們移動有個咪咕閱讀,我們每個月可以幫他新增5萬的手機閱讀用戶。通過DPI數(shù)據(jù)是很方便找到他的競爭對手用戶。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論