DJIA15070.18
-105.90
NASDAQ3423.56
-21.81
S&P 5001626.73
-9.63
 
新浪推薦
ENTER SYMBOL(S)
Value Engine Stock Forecast
涂子沛:得大數據者得天下 中國青年報
2013年06月18日 16:24
轉寄給朋友
列印

  本報記者 林衍

  在涂子沛的第四次國內巡講之旅中,連早餐時間都已經被占滿了。

  6月16日,這位《大數據》一書的作者在招商銀行深圳總部大樓與馬蔚華共進早餐。馬剛剛卸任招商銀行行長,不久前,他的照片曾出現在電影《中國合伙人》的片尾致敬花絮裡,和他一同進入大銀幕的企業家還包括柳傳志、王石、馬雲等人。

  “未來的世界一定是數據化的世界,未來的城市也一定會是數據化的城市。”在一個多小時的早餐會面裡,馬蔚華幾次向涂子沛強調這一觀點。

  事實上,從去年7月《大數據》出版后開始,每當這位在美國供職的中國程序員回到國內,都會受到熱烈的追捧。和馬蔚華共進早餐的第二天,他在江蘇常州就“教育與大數據”的話題進行了一場聽衆超過1000人的講座,組織者是當地的教育局局長。其間,他還與國泰君安證券股份有限公司董事長萬建華吃了一頓午飯,萬告訴他,在自己的新書《金融e時代》裡,有整整一章都在探討大數據的問題。 

  “從認識的角度講, 這一年絶對可以稱為中國的大數據元年。”涂子沛說。在過去的一年裡,包括他的《大數據》在內,有超過20本以大數據為主題的新書在中國面世, 在噹噹網上,幾本賣得最好的書甚至被打上了“限量購”的標籤。

  如果把2013年全世界預計將存儲的數據總量全部記在書裡,那麼這些書可以覆蓋整個美國52次

  涂子沛在國內的第一場公開演講正是受馬蔚華之邀。在去年10月的招商銀行全國行長研討班上,從美國趕來的涂子沛一下飛機就被拉到會場,當着100多位分行行長的面,講了4個多小時的大數據。

  “什麼是大數據?”來自全國各地的行長們最好奇的就是這個問題。

  按照涂子沛的解釋,這首先是對信息爆炸時代的嶄新描述。事實上,如果把2013年全世界預計將存儲的數據總量全部記在書裡,那麼這些書可以覆蓋整個美國52次。如果將這些數據存儲在只讀光盤上,這些光盤可以堆成五堆,每一堆都可以伸到月球。

  事實上,在互聯網專家維克托·邁爾-舍恩伯格的着作《大數據時代》裡,曾將互聯網時代的數據洪流與1439年前后古登堡發明印刷機時造成的信息爆炸相對比,一個重要的發現就是“當時信息存儲量花了50年才增長了一倍,而如今大約每3年就能增長一倍”。

  但在涂子沛看來,僅僅用數量之大解讀大數據有失偏頗,能量之大才是大數據這枚硬幣的另一面。

  一個經典的案例是,在甲型H1N1流感爆發前幾周,谷歌公司通過觀察5000萬條美國人最頻繁檢索的詞條數據,發現“哪些是治療咳嗽和發熱的藥物”這一主題的檢索頻率大增,進而準確預測了流感的發生及傳播範圍。

  “面對海量數據,誰能更好地處理、分析數據,誰就能真正搶得大數據時代的先機。” 常年生活在美國的涂子沛對大數據的威力印象深刻,他記得有一次自己要搬家,便把各種各樣的傢具在網上拍賣,結果很快就有搬家公司找上門來。

  和涂子沛的看法類似,一位在美國攻讀統計學碩士的中國學生也告訴記者,大數據在美國非常火。他清楚地記得課堂PPT上曾有過這樣的案例——美國有一個叫做Orbitz的訂票網站,他們通過數據分析,發現顧客訂票的價格高低往往與他們的網頁瀏覽器相關,其中safari最高,chrome和firefox差不多。他們據此做出調整,一旦有用戶通過safari網頁登錄,往往會被優先顯示價格高的搜索結果。

  事實上,在麥肯錫發布的一份報告中,已經將數據分析稱為 “下一個創新、競爭和生産力的前沿”。

  你想用3000多個樣本折射幾億用戶的行為,這事荒不荒唐就不用說了

  在美國,數據分析形成了一條完整的産業鏈,不少大學還設立了相關的碩士學位,而在中國,這種傳道也正如燎原之火。在去年,一名叫王煜全的天使投資人曾經和涂子沛同台演講,和涂子沛一樣,他也是數據的忠實信徒,“自己現在會投的創業者,必須有數據分析技術,否則免談”。

  在王煜全看來,在傳統的社會學研究中,“大樣本、實時監測、連續監測”往往是不可兼得的條件,而大數據打破了這個迷思。

  “我們都知道央視索福瑞是做電視收視率調查的,大家知道多少個樣本嗎?3000多個。你想用3000多個樣本折射幾億用戶的行為,這事荒不荒唐就不用說了。”他在一次演講中這樣說道,“web2.0改變了這個現狀,不管在Facebook、Twitter、新浪微博、微信上,我們能夠隨時獲得全樣本的實時的連續數據,這個時候我們對用戶行為的理解就有可能達到空前的深度。比如在沒有社交網絡的時候,某位名人一直說自己是加州理工畢業的,大家相信了很久,等有社交網絡你再看他的好友圈,一定有若幹個西太平洋而沒有加州理工的,你猜他是哪畢業的?”

  而在《大數據時代》一書中,維克托·邁爾-舍恩伯格曾提出過另一個重要論點,相比於因果關係,相關關係也許能夠幫助我們更好地了解這個世界,換言之,在大數據時代,知道“是什麼”或許比知道“為什麼”更重要。一個經典案例是,沃爾瑪的研究人員通過數據挖掘,發現四成左右的年輕爸爸在購買嬰兒尿布時會順手買點啤酒犒勞自己,便對這兩種商品進行捆綁銷售,結果銷售量雙雙增加。

  “大數據最要命的是什麼?就是任何數據我都能匯總起來,分析你,比你還了解你自己。”王煜全曾這樣解讀大數據的價值。

  涂子沛則記得,去年10月,時任中央政治局委員、廣東省委書記汪洋曾給省財政廳的全體幹部推薦過《大數據》。汪洋講到馬雲曾經對他說,現在數據就是競爭力:“你想不到全中國比基尼賣得最好的是哪幾個省,一般人認為肯定是廣東、海南島。”

  馬雲隨即告訴汪洋,從淘寶數據上看,其實賣得最好的是新疆和內蒙古。他這樣解釋這種反常的相關性:估計每一個男人,都要給他的夫人、情人和對象一個美好的憧憬,“有一天我帶你去下海”。

  “當然這是他的一種解釋,但是能反映什麼呢,就是這些數據和你想象的不是一個概念。如果商家掌握了這個東西,其實你比基尼廣告的重點不要放在廣東做,你放到新疆、內蒙去做啊,這效果可能就不大一樣了。”汪洋給出了自己的解讀。

  在中國,大數據會一步步改變我們的生活

  這一次回國,曾工作過多年的廣東仍然是涂子沛的必到之處。這兩天,除了與馬蔚華見面,他還與中信銀行的幾名管理者做了深入的溝通,讓他感到明顯不同的是,金融“精英們”已不再把大數據當做新奇的概念,反而開始有了某種“深深的憂慮”。

  困擾金融巨頭的假想敵正是掌握着大量數據的互聯網企業。曾經兩次去阿里巴巴交流的涂子沛告訴記者,阿里金融正在試圖通過大數據技術解決“小微企業融資難”的問題。“所有貸款都是通過信用貸款,不像銀行那樣需要房産或其他抵押品,也不需要走訪約談。因為他們會對客戶的所有行為數據進行挖掘分析,再決定是否放貸。”

  “依靠大數據技術,IT企業也可以變成銀行,很難想象吧?”涂子沛笑着說,“在中國,大數據會一步步改變我們的生活。”

  事實上,越來越多基於大數據技術産生的創意正在實實在在地進入中國人的生活。有媒體曾經報導過支付寶的數據科學家們每天的工作:他們會把客戶分成50個族群進行研究,其中有一個群體叫做都市輕熟男,還有一個群體叫千金美少女,而這些類型的劃分依據就是用戶在淘寶、天貓、支付寶和聚劃算中的付費行為數據。在能識別用戶之后,一個微妙的變化是,在寫商品推薦文字的時候,不再是過去那樣千篇一律地使用“親”作為開頭了。

  類似的變化涂子沛也曾親身感受過。有一回在國內演講,他住在白天鵝賓館,賓館的信息部主任告訴他,這家賓館的信息部有收集用水量的習慣。有一年,原本平穩的用水量突然出現了大幅波動,工作人員經過分析排查發現,花壇下有個水管漏水很久,“是數據讓他們發現了問題”。

  這一回,又一個與大數據有關的故事讓他眼前一亮。在華東師範大學,一名女生因為減肥,5月份的飯卡消費較少,沒想到竟然收到一條系統短信:“同學你好,發現你上個月餐飲消費較少,不知是否有經濟困難?如有困難,可電話、短信或郵件我。如無困難,也請回復一下,以便下月不再重覆問詢。”

  原來,這個消息來自學校的困難生預警系統,而這套系統正是基於學生飯卡消費的數據建成。涂子沛第一時間轉發評論了這條微博:“華東師大用數據表達愛和關懷。”

  在一次演講中,涂子沛曾這樣說道:“今天,數據已經無處不在,我們的衣食住行、喜怒哀愁、吃喝玩樂都以數據的形式存在。通過數據、網絡和軟件,我們用數據來記錄這個世界,再通過研究數據去發現這個世界。”

  “大數據無處不在?”記者在電話裡問涂子沛。

  “我想是的,哦,你猜我一抬頭看見了什麼?”正在白雲機場准備趕赴下一個演講地點的涂子沛告訴記者,出現在他眼前的是一塊IBM的大幅廣告,上面寫着這樣一行字——

  大數據時代:用智慧的分析洞察,構建智慧的地球。

其它滬深財經新聞
高房價調控成本不應成中産難承之重 大洋網-廣州日報
外匯局:一季度國際收支雙順差 京華時報
地方食藥機構改革預計年內完成 新京報
終結養老金雙軌制需要公開博弈 大洋網-廣州日報
消息稱京深等地房産稅試點方案已上報 中國網