兩岸國際

傳DeepSeek繞過英偉達框架 適配華硬件

【本報綜合報道】內地初創公司DeepSeek近日推出以低成本開發的人工智能(AI)模型,引發關注。內媒昨日引述消息報道,DeepSeek在研發大模型時繞過了美國晶片巨頭英偉達的「護城河」、軟硬件整合技術統一計算架構(CUDA),準備適配國產GPU(圖形處理器),令美企感到很大威脅。
模型訓練僅需5天
CUDA是一種通用編程框架,允許開發者利用英偉達的GPU計算。北京航空航天大學副教授黃雷受訪指出,如DeepSeek真的繞過了CUDA,可直接根據GPU的驅動函數做一些新開發,從而實現更細粒度的操作。分析指,CUDA會導致訓練模型時損失一些靈活性,DeepSeek的做法相當於繞過硬件對訓練速度的限制,意味其他模型需訓練10天,DeepSeek只需5天。
消息人士透露,DeepSeek擁有一些擅長寫PTX語言的內部開發者,假如之後使用國產GPU,其在硬件適配方面將更得心應手,只要了解這些硬件驅動提供的一些基本函數接口,就可以仿照英偉達GPU硬件的編程接口去寫相關代碼,從而讓自家大模型更容易適配國產硬件。
第一手消息請下載on.cc東網 iPhone/ iPad/ Android/
人人做記者
爆料方法 :
爆料熱線:
(852) 3600 3600
傳 真:
(852) 3600 8800
SMS:
(852) 6500 6500
人人做記者