產經

阿里AI新數學大模型 測試評分傳勝GPT-4o

阿里旗下AI新一代數學大模型,將推中英雙語版本。 阿里旗下AI新一代數學大模型,將推中英雙語版本。
阿里旗下AI新一代數學大模型,將推中英雙語版本。
內地人工智能(AI)不斷追趕美國對手,阿里巴巴(09988)旗下AI通義千問的新一代數學大模型,據報評測得分高於業界標桿——美國科技獨角獸OpenAI的GPT-4o。目前通義Qwen2-Math系列模型主要支持英文,開發的通義團隊說很快就將推出中英雙語版本,多語言版本也在開發中。
據了解,本次測試在多個中英文數學基準測評集對指令微調模型作性能評估,除了業界常見的評測基準外,還引入更具挑戰的考試競賽類測試,如奧林匹克級別的基準測評、高考、美國數學邀請賽2024賽題等。
通義團隊指,Qwen2-Math-72B-Instruct表現優異,例如在MATH基準測評中,通義千問數學模型取得84%的準確率,超過GPT-4o的76.6%、Claude-3.5-Sonnet的71.1%、Gemini-1.5-Pro的80.6%等開閉源模型。
內地科企望增回購
內地巨型科技股下周開始陸續公布業績,在整體經濟環境仍然偏淡的情況下,市場預料公司業績難有驚喜。不過,有機構研究指,阿里、騰訊控股(00700)、京東集團(09618)等科網行業的資產負債表強勁,積累大量現金儲備,這些企業或將公布更多回購計劃,以提高股東回報。
研究又解釋,內地經濟放緩仍持續影響這些科技巨頭,例如騰訊的廣告、金融科技、商業服務業務對經濟增長惡化十分敏感。至於阿里及京東等電商,近期亦加大線上福利及折扣的資金投入,以推動平台的銷售增長。科技股昨日普遍上升,阿里股價升1.36%,騰訊及京東分別升0.48%及1.69%。
人人做記者
爆料方法 :
爆料熱線:
(852) 3600 3600
傳 真:
(852) 3600 8800
SMS:
(852) 6500 6500
人人做記者