名家筆陣:體現大數據價值

以下場景大家應該不陌生:在交叉路口明明沒有車輛經過,但交通燈仍然顯示行人禁止通行的信號;在機場櫃枱登記,等候的人排成長長的隊伍,但值勤人員只有一兩人;速遞公司無法準確通知送貨時間,結果一次又一次錯失包裹簽收等等,怎麼交通、機場和速遞公司的系統就不可以「聰明」一點?

原因很簡單:我們缺乏可用以作出聰明判斷的數據。當無法獲得充足的數據和訊息來指引當下的決策時,人們只能參照「慣常」的行為模式來行動,而這些「慣常」的情形和真實場景往往存在很大的差異,從而導致決策「失誤」。

比如交通燈系統,就是根據「日常」交通流量來指示信號燈的轉換;機場人手安排,是根據「一般」每日離境人流數量做準備;而速遞公司由於無法預測實時路況,所以只能憑「經驗」加「見機行事」,亦就無法得知準確的送貨時間。

如何解決這些問題?大數據(Big Data)也。

收集數據助決策

如果回顧一下「大數據」誕生的歷史,就能明白它的價值所在。過去三十年,訊息技術(IT)的進步令數據存儲、傳輸網絡、數據挖掘的能力得到重大的發展,我們進入了「訊息膨脹」的年代。然而,IT的進步便利了數據收集,卻無法真正「讀懂」數據背後的意義,亦未能幫助我們更好做出實時的決策。

「大數據」的出現就是為了解決上述IT無法解決的問題。一般而言,大數據是指可以從多個數據來源中處理、分析和提取有用訊息以輔助決策行為的系統技術,它關注的除了數據的多少(Volume),還有數據的種類(Variety)和更新頻率(Velocity),即所謂的3V。

大數據就是要對各種不同種類、不斷更新的大批量數據進行實時分析以協助作出最切合實際情形的決策,而這背後則需要巨大的計算能力和IT設備的輔助。

雲計算管理資源

當然,不是每個企業都有這樣頂尖的運算能力和設施,這就是「雲計算」興起的原因。由雲計算服務供應商來管理一個共同的計算資源平台,幫助各個企業管理數據,並按需分配和靈活調整彼此的計算資源。比如在促銷旺季,電商平台就可以申請更多「計算」資源來應付網站流量的激增,而促銷後再把計算資源調低。這種「共享計算資源」和「按需調整計算能力」的模式,大大節省了運算成本,令雲計算廣受中小企包括初創企業歡迎,而其靈活拓展的能力亦用於需要巨型運算的場景。

一個典型例子就是去年雙十一,阿里雲就支撐起當天支付峰值達每秒8.6萬筆交易量。「雲計算」也和「大數據」亦由此成為幾近共生的名詞。

大數據並非紙上談兵的華麗術語,而是今時今日被廣泛應用到各種日常場景、令人們生活更為便捷的工具。科技的發展一日千里,可能很快,大數據就會變得像水、電、煤一樣普及,成為我們生活中無處不在的元素。

閔萬里 

阿里雲資深數據挖掘專家

作者:閔萬里