國家標準代碼頻頻修訂

【本報訊】電腦的興起及普及應用源於西方,其系統設計亦以英文為基礎,原本並不能顯示中文字;經過多番努力,中文電腦的應用才逐漸普及。由於中文字與英文字存在極大差異,電腦系統要正確顯示中文,須視乎系統使用的漢字編碼集有否收錄該中文字。內地官方制訂的「國家標準代碼」,也經過多次修訂,由一九八○年代的只能顯示六千多個中文字,增加逾九倍至目前的逾七萬字。

系統更新 問題浮現

「國家標準代碼」是中華人民共和國的中文常用漢字編碼集,最新版本是於二○○五年發布、○六年五月實施的GB 18030-2005,共收錄70,244個中文字,更支援少數民族文字、繁體漢字、日韓漢字。一九八○年代發布的GB 2312-80版本,只收錄6,763個中文字,兩者相差逾九倍。即使是十年前(二○○○年)發布的GB 18030-2000版本,收錄的中文字也只有27,533個。

香港大學電腦學系助理教授徐燦傑表示,早期使用的電腦系統由於沒有足夠的中文字庫,故經常出現身份證明文件與原名不相符的情況,導致「身份危機」。他相信隨着系統更新,同類問題會陸續浮現。