當下中國,大數據是個(gè)熱詞。大數據是怎樣發(fā)揮價(jià)值的?關(guān)注到騰訊近日發(fā)布的大數據報告《95后迷之隱私觀(guān)大揭秘》,人與人交流的傳統調研模式,不僅沒(méi)有被所謂大數據掩埋,反而在大數據時(shí)代,被一個(gè)個(gè)數據又激發(fā)出來(lái)。搞大數據研發(fā),不就是坐在實(shí)驗室、電腦前,整天對著(zhù)數字噼里啪啦地運算?
大數據給不出解釋
可騰訊公司用戶(hù)與市場(chǎng)研究中心調研員韓娜,更多地是奔波在見(jiàn)調研對象的路上。
韓娜講了一個(gè)對于她來(lái)說(shuō)“家?!钡墓适?。
一年冬天,她從南方的深圳趕到北方的沈陽(yáng),約了一個(gè)孩子做用戶(hù)調研。本來(lái)知情的父母臨時(shí)有事不在,孩子的姑姑不讓韓娜進(jìn)門(mén)。韓娜拿出身份證、工作證、介紹信,反復解釋?zhuān)凶C明一概無(wú)用,對方就是不肯相信。
最終,韓娜被“砰”的一聲拒之門(mén)外。
類(lèi)似的經(jīng)歷,韓娜所在的團隊幾乎人人都遇到過(guò)。
很多人不理解,一個(gè)互聯(lián)網(wǎng)公司怎么還用上門(mén)調研這種“老土”的方式?
的確,擁有7.62億月活躍微信賬戶(hù)、8.77億月活躍QQ賬戶(hù)的騰訊,并不缺乏用戶(hù)社交的大數據,但光有數字就行了嗎?
“大數據給出了結論,但給不了解釋?!?/span>用戶(hù)與市場(chǎng)研究中心總監譚池舉了一個(gè)他自己的親身經(jīng)歷。
多年前,他曾經(jīng)參與過(guò)早期蘋(píng)果手機一代的調研。當時(shí),老外們通過(guò)大數據驚訝地發(fā)現一個(gè)現象:蘋(píng)果的幾種輸入法中,中國人特別偏愛(ài)某一種??墒抢贤庀氩煌?,這是為什么?
譚池說(shuō),“為什么”往往是大數據的盲點(diǎn),想要找到答案,目前,還只能依靠傳統的人對人詢(xún)問(wèn)。
當時(shí),經(jīng)過(guò)傳統調研,譚池找到了原因:
中國抽煙人口比西方國家多,許多公共場(chǎng)合更是想抽就能抽,人們一只手拿煙時(shí),只好單手握著(zhù)手機打字,因此中國的蘋(píng)果一代用戶(hù),特別偏愛(ài)單手型、單指型的輸入法。
知道這個(gè)“為什么”以后,相關(guān)產(chǎn)品的開(kāi)發(fā),開(kāi)始更多考慮單手模式了。
人與人交流的傳統模式,不僅沒(méi)有被掩埋,反而在大數據時(shí)代,被一個(gè)個(gè)數據又激發(fā)出來(lái)。
大數據讀不出場(chǎng)景
“滴”“滴”———訪(fǎng)談室里充滿(mǎn)此起彼伏的電子音。研究員們有些震驚。
事情緣起于產(chǎn)品經(jīng)理想做一個(gè)無(wú)障礙功能的設計。研究員朱丹招募了6位盲人進(jìn)行訪(fǎng)談。起初,大家做好充分準備,以為盲人們可能不會(huì )使用智能手機,不會(huì )用APP,需要先教一下。
但沒(méi)想到,這群盲人使用互聯(lián)網(wǎng)產(chǎn)品相當熟練。
他們利用智能手機的讀屏功能,并且每個(gè)人都把聲音調到最快檔,只聽(tīng)見(jiàn)手機發(fā)出“滴”“滴”這樣短促的電子音,常人的耳朵根本聽(tīng)不懂是什么,但6位盲人卻在怪誕的聲音中,熟練地使用互聯(lián)網(wǎng),讓在場(chǎng)的“小伙伴都驚呆了”。
“原來(lái)網(wǎng)絡(luò )對他們的幫助比我想象中大很多?!敝斓じ锌?。有位盲人告訴她,比如移動(dòng)支付,對正常人來(lái)說(shuō)只是多了一種支付手段,但對他們而言是一種顛覆式的設計,大大方便了盲人消費。
大數據提供了一個(gè)結果,但它并不知道用戶(hù)在使用產(chǎn)品時(shí),身處什么樣的場(chǎng)景,懷揣怎樣的心情,有著(zhù)怎樣的需求。這一切,唯有人與人面對面,才能知曉。
還有一次,譚池找到了成都的一名用戶(hù),興高采烈跑到對方家里。目的是為了知道用戶(hù)使用產(chǎn)品時(shí),真實(shí)的生活場(chǎng)景什么樣。一番交流和觀(guān)察后,他忽然覺(jué)得不太對勁:
這戶(hù)人家冰箱里只有6罐可樂(lè ),沒(méi)有多余的食物,房間里也找不到水壺或飲水機。譚池發(fā)短信給同行的同事:留意一下,這是不是他真的家。
等到雙方聊得很開(kāi)心以后,對方果然露出了口風(fēng),原來(lái)他確實(shí)不住在這兒,這間屋子的主人是他父母,目前租給別人,這次為了接受調研,臨時(shí)借用了一下。
“這樣一來(lái),我觀(guān)察他的生活場(chǎng)景,有一半信息就沒(méi)用了,比如小區、鄰里關(guān)系等?!弊T池遺憾地說(shuō)。
用戶(hù)真正的使用情景,他們的擔憂(yōu)、開(kāi)心、困惑與不爽,目前的大數據讀不出來(lái)。數據再大也是死的,只有人能激活它。
大數據不知道怎么做
多年前,有一位調研員曾經(jīng)接過(guò)一個(gè)項目,對方要求調研某產(chǎn)品在用戶(hù)心中是多少分,如果得分在80分以下,整個(gè)相關(guān)團隊就要被撤銷(xiāo)。
“其實(shí),給79分還是80分,有很大區別嗎?”譚池反問(wèn),“不談評分機制,就算根據數據得分,判了一個(gè)團隊的生死又怎樣?問(wèn)題還是在那兒,依然沒(méi)有得到解決?!?
大數據本身,并不能給出一個(gè)既定做法。面對數據運算的結果,之后的步驟可能更加重要。
每一年,研究中心負責調研的項目數以百計,這些課題并非調研員自己“拍腦袋”想的,大部分來(lái)自產(chǎn)品策劃的需求方。
韓娜說(shuō),剛入這一行,自己與產(chǎn)品經(jīng)理交流時(shí),經(jīng)常需要磨合。比如一位產(chǎn)品經(jīng)理很糾結,關(guān)于“簽到”有兩種改進(jìn)方案,究竟95后用戶(hù)更喜歡哪一種呢?他不知道。
他可能先去找數據師,去調相關(guān)的大數據。大數據顯示,95后更熱衷于每天上網(wǎng)“簽到”。但是他們“簽到”究竟是出于什么心理,獲得了什么滿(mǎn)足,數據并不懂。
于是,產(chǎn)品經(jīng)理接著(zhù)找韓娜,請她進(jìn)行用戶(hù)研究。結果顯示,95后樂(lè )意“簽到”,更多是為了滿(mǎn)足自己的情感需求,尤其是“刷存在感”??墒侵懒诉@一點(diǎn)后,產(chǎn)品經(jīng)理依然無(wú)法抉擇,究竟哪個(gè)方案更好。
時(shí)間久了,韓娜漸漸明白,自己做完調研,不能僅僅解答“為什么”,“用戶(hù)怎么想”,還要給出“怎么做”的建議。
當然,再細致的調研,最終也不一定能找到產(chǎn)品經(jīng)理想要的答案。有時(shí)候,答案是有了,但考慮到成本營(yíng)收、缺乏供應商、缺乏可操作性等因素,改進(jìn)方案依然不了了之。大數據和訪(fǎng)談就都白做了。
另一位調研員馬建說(shuō),自己工作最開(kāi)心的那刻,就是調研的建議被采納,最終體現到產(chǎn)品中。
今天的企業(yè)、政府,乃至整個(gè)社會(huì ),很容易通過(guò)大數據對市場(chǎng)一目了然,但一目了然之后怎么做?漠視它、改正它、還是適應它?
大數據未必懂得價(jià)值
羅英、何文是“數據挖掘師”。但這份工作想做得好,單純依靠算數據并不夠,其實(shí)還要動(dòng)用“情商”。
比如,QQ音樂(lè )有一個(gè)功能叫“猜你喜歡”。根據用戶(hù)的數據,軟件會(huì )自動(dòng)推薦一些陌生歌曲。這種推薦,顯然是基于大數據平臺。一般我們以為,只要提供一些算法,大數據平臺照此運算就成,但事實(shí)沒(méi)那么簡(jiǎn)單。
首當其沖的是準確率?!安履阆矚g”究竟能猜對多少首歌?不同的數據師,可能會(huì )設計不同的算法,有的人效果明顯比較好,他把“年齡”的數據用起來(lái),而另外一個(gè)人沒(méi)用,就會(huì )導致兩者準確率差很大。
究竟需要考慮哪些數據維度,薦歌才會(huì )最符合心意呢?沒(méi)有標準答案,不同數據師有自己的判斷。同樣的大數據庫,一個(gè)運算下來(lái)比較準確,一個(gè)不準,其中唯一的變化就是人。
第二個(gè)問(wèn)題是,為什么有人能想到“年齡”,而有人卻想不到?憑借的也是個(gè)人經(jīng)驗?;蛘哒f(shuō),憑借的是人對事物的理解,考驗的正是數據師的“情商”。
“在我們行內有一個(gè)不等式:業(yè)務(wù)知識>數據>算法?!绷_英解釋?zhuān)岸鴺I(yè)務(wù)知識就是你的理解能力?!庇猛械脑?huà)來(lái)說(shuō),就是“你的架構是否合理?!?/span>
最近,產(chǎn)品經(jīng)理提出:能不能根據大數據,觀(guān)察每座城市的人口遷移,隨后做一份《城市年輕指數》報告?
數據師們給出了這樣一些數據:用戶(hù)的登錄地,再比對他們的年齡信息等。最后給出來(lái)的數據,大家一看都覺(jué)得有價(jià)值,《城市年輕指數》報告就這樣出爐了。
當然,更多時(shí)候,理想很完美,但運算出來(lái)的數據卻沒(méi)什么變化,被判定“數據價(jià)值不大”,議題便會(huì )不了了之。
“大數據就好像是一杯水,我們需要去廚房煮菜,水只是材料之一。”羅英形容。
何文則說(shuō),他工作的成就感,不在于運算大數據,而在于最終“能給出有價(jià)值的數據”。
大數據還能做什么
第一張與家人的合影、第一張旅行的照片、第一張寶寶的笑容……
最近,騰訊運用QQ空間的數據,為個(gè)人生成一份“社交回顧互動(dòng)”H5,比如顯現出你第一次注冊空間的時(shí)間,跳出第一張上傳的家人合照。
“其實(shí)也捏了一把汗?!睆氖翾Q空間運營(yíng)的琪琪說(shuō),“試想,第一張與家人的合影,萬(wàn)一大數據判斷錯誤,跳出來(lái)的照片是與男同事的合影,豈不是很尷尬?”怎么抽取數據,讓數據判斷準確很重要。
小迪做調研時(shí)遇到一名初中男孩,對方很有傾訴欲。男孩告訴他,自己有5個(gè)QQ號,4個(gè)已經(jīng)被媽媽“破解”了,可能是因為密碼太簡(jiǎn)單,都是生日之類(lèi),媽媽太容易猜到。于是他想出了第5個(gè)QQ密碼,復雜到連自己也記不住。
他把密碼放在帶鎖的儲錢(qián)罐里,再把儲錢(qián)罐藏在床底下,每次用這個(gè)賬號登錄QQ時(shí),他都要先從床底下把密碼翻出來(lái)才行。
這個(gè)故事,后來(lái)被小迪寫(xiě)進(jìn)了《95后迷之隱私觀(guān)大揭秘》報告中。該報告揭示,95后是一群非常注重隱私的群體,近4成95后認為,自己的隱私遭到過(guò)侵犯,他們?yōu)榱吮Wo隱私采取過(guò)各種小手段。他們渴望有自己的空間,活躍于QQ空間其中一個(gè)原因,就是可以不和父母在同一個(gè)社交圈。
隱私報告誕生后,也讓一些媒體和學(xué)者產(chǎn)生了危機感。長(cháng)此以往,是不是一家互聯(lián)網(wǎng)公司就能自己完成科研報告了?大數據會(huì )不會(huì )讓一些科研機構被取代呢?
除了活動(dòng)、推薦、科研,最讓人期待的是,大數據在某個(gè)領(lǐng)域正發(fā)揮著(zhù)超乎想象的作用———城市公共空間的實(shí)時(shí)數據檢測。
類(lèi)似功能,其實(shí)微信上已經(jīng)有了。打開(kāi)微信個(gè)人錢(qián)包,選擇城市服務(wù),右下方有一條“城市熱力圖”。點(diǎn)擊進(jìn)入,熱力圖能實(shí)時(shí)顯現你所在的位置附近,有多少人流,它意味著(zhù)交通是否擁擠。
當然,擴大使用的話(huà),它還能實(shí)時(shí)監測某塊區域,是否短時(shí)間內人流密度過(guò)高,及時(shí)提出預警。
也是基于相同的原理,近幾年騰訊發(fā)布了春運遷徙報告,實(shí)時(shí)監測每年春運的遷徙情況。
而未來(lái),當每個(gè)人的身體信息都能被實(shí)時(shí)收集,形成個(gè)人的大數據時(shí),人會(huì )怎樣?當整個(gè)社會(huì )被大數據連接起來(lái),整座城市管理,都可以用大數據運算出一個(gè)“最佳方案”時(shí),城市又會(huì )怎樣?
我們已經(jīng)邁入一個(gè)大數據的時(shí)代。
有人說(shuō),終究有一天,數據的價(jià)值將超過(guò)土地的價(jià)值。
但是也有人說(shuō),世界就是一個(gè)“黑盒子”,永遠無(wú)法窺探內部的秘密。
遠古時(shí)代,宇宙對于人類(lèi)就是一個(gè)巨大的黑盒子。如今,科學(xué)技術(shù)正在解開(kāi)一個(gè)又一個(gè)黑盒子,可是大數據的終解會(huì )通往哪里?目前依然沒(méi)人說(shuō)得清楚。
“技術(shù)是有局限性的?!碑斘覀円恢痹谡雇萍嫉臒o(wú)限可能時(shí),反倒是這些一直與大數據打交道的人,不斷強調著(zhù)這一點(diǎn)。
人始終無(wú)法被替代
上海觀(guān)察:企業(yè)對大數據的估值一直都很高,不會(huì )輕易公開(kāi)。你們怎么會(huì )想到免費對公眾發(fā)布一些大數據的社會(huì )報告?
李航(騰訊集團市場(chǎng)與公關(guān)部總經(jīng)理):這幾年,社會(huì )上的大數據報告很多,每家互聯(lián)網(wǎng)公司各有偏重。
社交平臺本身就是一個(gè)濃縮的小社會(huì ),社會(huì )的新變化、新趨勢,都會(huì )在這個(gè)平臺有所反應。比如,大家越來(lái)越覺(jué)得,當代年輕人變得無(wú)法定義了,他們似乎喜歡追星、喜歡消費,他們究竟是怎樣一群人呢?能否做出一些描述?
那么,在我們的社交數據平臺上,是否可以觀(guān)察到年輕人的一些變化?意識到這是一個(gè)社會(huì )共同關(guān)注的話(huà)題,我們就基于大數據發(fā)布了相關(guān)的報告。
另一方面,大數據是個(gè)很大的盤(pán)。但是這個(gè)大盤(pán)上也可以有許多小的切面和故事。大數據未必一定要生成一個(gè)宏觀(guān)的大報告,從特別的角度切入,以小見(jiàn)大,也是一種嘗試。
這次我們推出95后的隱私觀(guān),那么下次可以繼續推出當代年輕人的審美觀(guān)、擇業(yè)觀(guān)等,持續聚焦一些可長(cháng)期跟蹤的社會(huì )話(huà)題。
上海觀(guān)察:這份報告既有宏觀(guān)數據,又有微觀(guān)故事,看起來(lái)似乎“搶”了高校和媒體的活。
李航:我們是一個(gè)平臺,也許從能力上,我們可以做到像高校那樣,或者像媒體那樣,但從自身的定位來(lái)說(shuō),我們盡量只做平臺該做的,那就是客觀(guān)陳述。
有些洞見(jiàn),不輕易進(jìn)行價(jià)值判斷。這些大數據發(fā)布出去以后,如果高校、媒體引用,進(jìn)一步就這個(gè)社會(huì )現象深入分析下去,我們也很高興。
上海觀(guān)察:是不是因為互聯(lián)網(wǎng)行業(yè)變化太快,所以你們對社會(huì )的細微變化很敏感,也因此對調研投入了很大精力?
李航:Pony(指馬化騰)曾經(jīng)說(shuō):巨人倒下的時(shí)候,身體還是溫的。互聯(lián)網(wǎng)這個(gè)行業(yè),分分秒秒都在變化,所以我們始終有一種危機意識。
今天,我們愿意開(kāi)放一部分資源和數據,也是希望能與全社會(huì )一起去解讀互聯(lián)網(wǎng)的動(dòng)向,可以說(shuō)是為了社會(huì ),同時(shí)也是為了我們自己的生存前景。
上海觀(guān)察:那么您對大數據的未來(lái)怎么看?有了人工智能、深度學(xué)習,未來(lái)人還有用武之地嗎?
李航:目前看待和處理大數據有幾種方式。
一類(lèi)是對年齡、性別、星座等基礎結構型數據進(jìn)行呈現和總結。
第二類(lèi)是視頻數據、語(yǔ)音數據、圖像數據。我們有像優(yōu)圖這樣世界領(lǐng)先的技術(shù)團隊,他們在音頻、人臉、圖片識別等領(lǐng)域都有深入研究?,F在我們正在研究,如何讓語(yǔ)音數據與圖像數據結合進(jìn)行分析。
第三類(lèi)就是人工智能,它的想象空間非常大,或許通過(guò)深度學(xué)習,未來(lái)人工智能自己會(huì )對數據產(chǎn)生洞察力,理解數據背后的意義、原因、提供建議,一切皆有可能。
我相信人無(wú)法人與人的當面交流,所知被替代。人性很復雜,即使也是有限的。人的情感、動(dòng)機、心理,這些都是目前機器解讀不了的。
越是與大數據打交道,越是對人性保有敬畏之心。