Open Ray手記:跟電腦說話的新世代

看科幻電影時,主角跟遠方的朋友通話,總是用視像電話。當控制電腦時,很多時也會用上先進的語音輸入,就像電影《鐵甲奇俠》(Ironman)的主角只需跟電腦說話,電腦便會自動執行程序。今時今日,電腦科技也正在朝這個方向發展,例如語音輸入已漸趨成熟,尤其在手機上使用語音輸入時,可以方便駕車人士毋須看屏幕或按鍵,令駕車通話或發短訊更方便和安全,比在電腦上進行語音輸入更實用。

語音輸入要普及,先要解決技術問題,例如以往的語音辨識準確度有限,一般只有7成左右。縱使準確度達到8、9成,即是用戶每打10個字,只有一至兩個錯字,但如果是用來發短訊或搜尋的話,便可能錯漏百出,難以實際應用得到。

科技進步,現在大部分語音辨識的技術問題已經解決了。例如昨日提過的Dragon Dictation,辨識準確度達9成以上。去年我在北京試用過手機語音搜尋,準確度甚高。當時我用普通話對着電話說「北京附近的Pizza店」,手機便可以搜尋出十多間附近的Pizza店,十分方便,對駕車人士尤其適合。

當時我用的搜尋語言是普通話夾雜了英文,搜尋結果仍然準確,十分厲害。該搜尋方式是把語音以聲音檔案格式直接上傳到網站後,再在網上進行辨識,然後才把結果下傳到手機上。Dragon Dictation也是用這種方法來進行辨識,效果理想。下一代iPhone似乎也有類似語音功能,但暫時還未有機會試用,相信正式推出後,語音輸入功能將大受歡迎。

飲食網站創辦人

鍾偉民(Ray)