25/12/2009

中大數據新技術確保私隱

【本報訊】巿民日趨重視個人私隱,中文大學開發了一項嶄新的保密技術,可將數據作適當修改及模糊化後才作公布,有效保障資料提供者的私隱,卻不失數據的準確性。

中大計算機科學與工程學系博士畢業生蕭小奎,在○五年開始研究「保護私隱的數據發布技術」,他指如人口普查數據或醫療紀錄等龐大數據,都會涉及個人私隱;政府部門發布有關數據作研究之用時,必須先進行修改及隱密,以確保私隱不會外洩,但他指因現時有關技術仍有不少漏洞,令個人敏感資料仍有可能會被一併公布。

他指出,由他開發的新系統主要針對舊系統的漏洞,將數據中的敏感個人資料可按需要模糊化,但同時能保存有用的資料作數據分析,並能隨時增減新的資料及更新數據,「寫程式時用咗特別方法去寫,外人無法破解。」即使用新系統處理六百萬人的資料,亦不超過二十小時,速度驚人。不過若要求公布的數據愈能保護私隱,則難免會減低準確度,約有正負百分之十的誤差。

獲「青年科學家獎」

蕭小奎憑該技術,獲香港科學會頒發本年度物理與數學科學範圍的「青年科學家獎」,他現正進行優化系統研究,希望明年可完成更完善的版本。

該數據處理系統現可於網上免費下載,網址為http://sourceforge.net/projects/anony-toolkit/。