兩岸國際

日版ChatGPT開發中 促國際聯合研究

開發團隊使用富岳(圖)訓練日語輸入。 開發團隊使用富岳(圖)訓練日語輸入。
開發團隊使用富岳(圖)訓練日語輸入。
【本報綜合報道】人工智能(AI)聊天機械人ChatGPT在推出不到一年引起全球轟動。英國科學雜誌《自然》上周四刊登文章介紹,日本政府正在聯合當地大型科技公司,基於大型語言模型(LLMs),打造日語版本的ChatGPT,如果能夠做到準確,預計將對國際聯合研究產生積極影響。
訓練超級計算機「富岳」
LLMs通常使用來自公開資源的大量數據來學習自然語音和散文的模式。它們被訓練根據一段文本中的前一個單詞預測下一個單詞。ChatGPT之前的模型GPT-3所訓練的絕大多數文本都是英語。開發團隊使用日本超級計算機「富岳」,主要對其進行日語輸入訓練,藉此開發日本版的ChatGPT。
英語只有26個字母,而書面日語由兩組48個基本字符和2,136個常用漢字組成。大多數漢字都有兩種或兩種以上的發音,還有大約5萬個很少使用的漢字,導致ChatGPT在處理日語時遇到困難。專門研究自然語言處理的日本東北大學研究員坂口慶祐表示,目前的LLMs在英語方面表現出色,但在日語方面往往表現不佳。使用日語時,ChatGPT有時會生成大多數人從未見過的極其罕見的字符,以及奇怪的未知單詞。
第一手消息請下載on.cc東網 iPhone/ iPad/ Android/
人人做記者
爆料方法 :
爆料熱線:
(852) 3600 3600
傳 真:
(852) 3600 8800
SMS:
(852) 6500 6500