阿里AI新數學大模型 測試評分傳勝GPT-4o
內地人工智能(AI)不斷追趕美國對手,阿里巴巴(09988)旗下AI通義千問的新一代數學大模型,據報評測得分高於業界標桿——美國科技獨角獸OpenAI的GPT-4o。目前通義Qwen2-Math系列模型主要支持英文,開發的通義團隊說很快就將推出中英雙語版本,多語言版本也在開發中。
據了解,本次測試在多個中英文數學基準測評集對指令微調模型作性能評估,除了業界常見的評測基準外,還引入更具挑戰的考試競賽類測試,如奧林匹克級別的基準測評、高考、美國數學邀請賽2024賽題等。
通義團隊指,Qwen2-Math-72B-Instruct表現優異,例如在MATH基準測評中,通義千問數學模型取得84%的準確率,超過GPT-4o的76.6%、Claude-3.5-Sonnet的71.1%、Gemini-1.5-Pro的80.6%等開閉源模型。
內地科企望增回購
研究又解釋,內地經濟放緩仍持續影響這些科技巨頭,例如騰訊的廣告、金融科技、商業服務業務對經濟增長惡化十分敏感。至於阿里及京東等電商,近期亦加大線上福利及折扣的資金投入,以推動平台的銷售增長。科技股昨日普遍上升,阿里股價升1.36%,騰訊及京東分別升0.48%及1.69%。
人人做記者
爆料方法 :
爆料熱線:
(852) 3600 3600
傳 真:
(852) 3600 8800
SMS:
(852) 6500 6500