名家筆陣:銀行「手機開戶」締三贏

隨着網絡購物、商旅應用、打車軟件和O2O(線上到線下)的興起,用家的習慣開始慢慢傾斜,移動支付的應用也愈加豐富起來,個人消費模式慢慢由線下走到線上,很多人都選擇足不出戶,便可以買到心儀貨品的購物方式。連理財習慣亦同時慢慢轉變,因此各大銀行近年都爭相推出電子化銀行服務。

用戶「一take過」體驗佳

如果大家有留意近日的銀行廣告,不難發現有好幾間銀行都提倡手機「一take過」開戶,當中包括有中信銀行(國際)的iMotion開戶服務、渣打香港的手機開戶服務、大新銀行的e直通遙距開戶服務,以及中銀香港的跨境電子支付平台BoC Pay提供的開戶服務,而花旗銀行早前亦預告將於今季推出遙距開立存款戶口服務。

有別於過往申請人必須帶齊身份證明文件及住址證明等,親自到銀行開啟戶口的方式,最新的手機開戶服務,只需要透過手機拍攝身份證等證明文件便可;但卻毋須按拍攝按鈕,就能自動觸發,直接通過視訊預覽識別傳送到銀行。其實,背後是何種技術?銀行業界怎樣利用這識別技術提升用戶體驗?

這種遙距開戶服務,當中最重要的技術,就是光學文字辨識(OCR)結合人工智能(AI)技術。OCR英文全寫,是Optical Character Recognition,中文稱為「光學字符識別」。

OCR概念源於一九二九年,由德國科學家Tausheck提出,它利用光學技術,對文字和字符進行掃描識別,並將其轉化為一種電腦內碼而人又可以理解的格式。

文字識別是現時電腦世界裏,視覺研究領域的分支之一,而且這個課題,到現在已經是比較成熟的了,並且在商業中,已經有很多落地項目;例如身份證識別、駕駛證識別、銀行卡識別、車牌識別、名片識別等。

結合AI提升圖像識別

而AI又怎樣將OCR提升到另一層次呢?就是通過運用深度語義分割、多任務學習、多目標學習等一系列方法,在識別模型上,引入深度學習、遷移學習等技術,解決了因為拍攝者拍攝時所產生的圖像抖動、歪斜、多種字體混合等問題,提升圖像識別效果,減少對用戶拍攝條件的限制,從而提升了整體客戶體驗及服務效率。

其主要功能包括,(1)圖像預處理:此過程主要是去噪、傾斜度矯正等;(2)版面分析:將所要識別的文檔分段、分行處理;(3)字符切割:當中需要字符定位和字符切割,定位出字符串的邊界,然後分別對字符串進行單個切割,再做識別;(4)字符特徵提取:提取字符特徵,為後面的識別提供依據;(5)字符識別:將當前字符提取的特徵向量,與特徵模板庫進行模板「粗分類」和模板「細匹配」,識別出字符;以及(6)後處理校正:根據特定的語言上文下理關係,對識別結果進行較正的算法。

完全顛覆人手輸入方式

以上光學文字辨識結合AI技術,完全顛覆了手工輸入的方式;當中識別速度快、識別的準確率高、且能抗干擾等好處,不僅大大提高了輸入資料的效率,節省了時間,提高了客戶滿意度。並且還能保存實物圖像,減少人手處理的同時,實現了低碳環保,真正實現了用戶、商家和技術提供商的三贏局面!

劉奕輝

香港電腦學會金融科技專家小組執行委員會成員

作者:劉奕輝