阿里AI新數學大模型測試評分傳勝GPT-4o

內地人工智能（AI）不斷追趕美國對手，阿里巴巴(09988)旗下AI通義千問的新一代數學大模型，據報評測得分高於業界標桿——美國科技獨角獸OpenAI的GPT-4o。目前通義Qwen2-Math系列模型主要支持英文，開發的通義團隊說很快就將推出中英雙語版本，多語言版本也在開發中。

據了解，本次測試在多個中英文數學基準測評集對指令微調模型作性能評估，除了業界常見的評測基準外，還引入更具挑戰的考試競賽類測試，如奧林匹克級別的基準測評、高考、美國數學邀請賽2024賽題等。

通義團隊指，Qwen2-Math-72B-Instruct表現優異，例如在MATH基準測評中，通義千問數學模型取得84%的準確率，超過GPT-4o的76.6%、Claude-3.5-Sonnet的71.1%、Gemini-1.5-Pro的80.6%等開閉源模型。

內地科企望增回購

內地巨型科技股下周開始陸續公布業績，在整體經濟環境仍然偏淡的情況下，市場預料公司業績難有驚喜。不過，有機構研究指，阿里、騰訊控股(00700)、京東集團(09618)等科網行業的資產負債表強勁，積累大量現金儲備，這些企業或將公布更多回購計劃，以提高股東回報。

研究又解釋，內地經濟放緩仍持續影響這些科技巨頭，例如騰訊的廣告、金融科技、商業服務業務對經濟增長惡化十分敏感。至於阿里及京東等電商，近期亦加大線上福利及折扣的資金投入，以推動平台的銷售增長。科技股昨日普遍上升，阿里股價升1.36%，騰訊及京東分別升0.48%及1.69%。

爆料熱線：

(852) 3600 3600

傳真：

(852) 3600 8800

SMS：

(852) 6500 6500

電郵：

網上爆料：

MMS：

阿里AI新數學大模型 測試評分傳勝GPT-4o