据路透社报道称, 中国新兴人工智能(AI)公司Deepseek在17日在科学期刊《自然》上发表的一篇同行评审论文中表示,斥资29.4万美元训练大语言模型“R1”。 明显低于美制模型的训练成本,关于中国是否在AI发展竞赛中占据上风的争论很可能重新燃起。

自1月Deep Seek推出低成本生成式AI模型震惊全球以来,创始人梁文峰就很少公开露面。

然而,在这篇论文中,梁先生被列为合著者之一,并写道,除了研究费用外,还使用了美国半导体巨头英伟达的512台“H800”。 1月份的上一篇论文没有包括这些信息。

与此同时,OpenAI首席执行官Sam Altman在2023年表示,所谓的“基础模型训练”的成本“远高于”1亿美元。

然而,对人工智能开发成本和所用技术的深度寻求解释引发了美国企业和美国政府官员的质疑。

Deepseek此次提到的H800是美国政府于22年100月有效禁止英伟达高性能GPU“H100”和“A100”向中国出口后,该公司为中国市场设计的产品。

然而,几位美国政府官员在 6 月告诉路透社,Deep Seek 正在使用对华出口管制措施开始后采购的大量 H100。

在对这篇论文的补充说明中,Deepseek 首次承认自己拥有 A100,并表示在开发准备阶段就已经使用过。

原文:https://www.toutiao.com/article/1843647934807040/

声明:该文仅代表作者本人观点,欢迎在下方【顶/踩】按钮中亮出您的态度。