跌破眼?中DeepSeek公布R1成本29.4美元

商媒|者任/合外
喧一的中AI新DeepSeek罕公其核心模型,根《路透》,DeepSeek在《自然(Nature)》期刊最新表的文中指出,其推理向模型R1耗29.4美元即完成,低於美同上美元的成本,再度引界注美中在AI局中的定位。
文一步披露,DeepSeek旗下R1使用512(Nvidia)中市的H800晶片,80小;DeepSeek充文件也首度坦承持有A100晶片,用在研初期的小模型中。
美政府之前疑DeepSeek可能取得受到出口管制的H100晶片,但DeepSeek均,正式使用的是合法管道取得的H800晶片。DeepSeek具A100超算集的消息,恐怕再次引美方注。
美AIOpenAI行阿特曼(Sam Altman)2023年曾指出,其基模型成本「高於1美元」,管未公布具字;但相於DeepSeek的低成本策略,已大大覆外界AI展的知。
DeepSeek今年1月推出低成本模型,曾一度引全球科技股大震,市心其技可能等AI巨的主地位。自此之後,DeepSeek人梁文峰便少公露面,偶布品更新。
此外,外界指控DeepSeek透「模型蒸」(model distillation)OpenA成果,DeepSeek尚未正面回,蒸能降低成本提升效能,有助大AI技普及。文章中承部分模型曾基於Meta源的Llama行蒸,而V3模型的中亦包含大量OpenAI生成答案,但於「接取」,非刻意行。
美官方界仍DeepSeek的真技源存疑,但次公的低成本,必再次引中AI是否能以「高效能、低成本」路,成功小美AI力差距的激烈。

- 者:商媒
- 更多科技新 »