專家視野:健康碼與智能信貸的背後理據

最近有輿論促請港府在全民檢測後,盡快推出「港版健康碼(港康碼)」。到底健康碼是甚麼?

健康碼是一個裝在手機App上的二維碼,今年二月由杭州率先推出。用戶需先在App申報健康情況,例如14天內是否有外遊、發燒發熱、接觸確診病人等,再加上病毒檢測結果,然後經過系統審核,自動生成一個健康碼,分成「綠碼」、「黃碼」、「紅碼」。持「綠碼」者,可自由出入各種公共場所;不幸變成「黃碼」者需隔離7天,「紅碼」則要隔離14天。

如何審核一個人的健康碼呢?除了自己申報的健康資料和病毒檢測結果外,系統還會收集手機上的大數據,包括定位、流動網絡資訊、WIFI連接、支付等數據,然後系統可以計算過去14日,手機用戶甚麼時段到過哪些地方。

大數據分析應用廣泛

當有新確診個案發生時,系統就可從數據庫中迅速辨認出誰曾和確診者有密切接觸,例如曾在同一時間於同一個場所聚集,甚至曾在超市一同排隊用過支付系統等。此時,當事人手機上的健康碼,就會被轉成「黃碼」或者「紅碼」,須盡快安排隔離,因而能有效阻止潛在的傳播病毒機會。

在金融科技方面,大數據分析應用更為廣泛。例如傳統的信貸評分,通常是根據申請人的個人資料和信貸紀錄,計算出信貸等級。而使用大數據的智能信貸評分系統,就會在傳統資料上,再參考如線上購物、乘車出行、社交平台、流動電訊商等的數據來作判斷。

傳統分析重視「因果」,而大數據就更重視數據和評分之間的「關係」。例如大數據分析發現,工作時間經常四處跑的貸款申請人,比每天規律地「兩點一線」的出行者,過去的還款表現是比較差的。根據這種關係,以大數據進行信貸評分時,行為數據偏向前一種的申請人可能得分較低。

大數據分析雖有眾多優點,但作為一門新興科技,必然會衍生出道德倫理問題,例如原生和衍生數據產權歸屬、個人私隱保護、算法出錯責任誰屬等有待解決的議題。

香港電腦學會金融科技專家小組執行委員會委員 陳穎峯