甚麼是大數據?我相信不同的讀者都會有不同的解釋及認知。其實大數據並不是甚麼新話題,找到應用層面才是王道。
其實只要能活用大數據,可搜尋出股市中有市場行為風險的公司。以下是一個實際的例子。Gekko Lab是香港企業,其核心產品Gekko Graph是一款針對於金融機構的監管科技(Regtech)應用系統,用於發現和偵測資本市場的關係網絡,從而預防市場行為的風險。去年年底,Gekko Lab就有份預警了41家瀕危的上市公司,在香港市場引起廣泛關注。
最近Gekko Lab經香港電腦學會提名參加「亞太資訊及通訊科技大獎 2019」,於「科技組別─大數據分析」奪得大獎,為港爭光。
自二○一六年成立以來,公司就以打通各種的金融數據,建立有系統的金融知譜數據庫為目標,並通過自行研發的知識圖譜展示平台Gekko Graph,配合金融文檔智能檢索系統,幫助用戶快速找到可疑訊息,提高金融法規調查的效率。
其實要建立一個打通金融知譜的數據庫和展示平台,並不容易。Gekko Graph背後有四個重要技術,包括複雜PDF文檔解析和標註技術、異源數據融合技術、智能文檔標註技術及高性能知識圖譜可視化技術。
現時上市公司主要透過聯交所的「披露易」發放資訊,而這些資訊,並非屬於結構化數據。透過自行研發的技術和流程,就能從非結構化數據中,提取出一系列的獨特深層關係數據,作為分析的基礎。
展望未來,知識圖譜和大數據技術互相配合,在監管科技行業將會有更廣闊的應用。隨着數據量愈來愈多,金融監管的工作壓力和複雜性大大增加,提高監管效率成為行業的首要任務。
現時,應用知識圖譜和大數據技術的Gekko Graph,已有海外監管和金融機構應用,未來將以打通和連接各金融市場訊息披露的孤島為目標,建立可覆蓋全球各主要市場的數據;屆時,香港的分析大數據產品,將可享有更廣闊的前景。
Gekko Lab業務發展經理
作者:周珍妮