
北京初创公司月之暗面(Moonshot AI)于7月11日发布了其最新的大型语言模型Kimi K2。这不仅是中国在六个月内推出的第二个震惊全球的顶级开源模型,更以其在编码和创作等关键任务上的卓越表现,迅速被部分研究者誉为“全球新的最佳开放模型”。这一被形容为“另一个DeepSeek时刻”的事件,标志着全球人工智能开源社区的力量格局可能正在发生根本性转变,并引发了西方关于其在开源领域影响力的深刻反思。
性能与开放性:Kimi K2现象的核心
与此前一月份横空出世的DeepSeek R1相似,Kimi K2的发布在Hugging Face等全球领先的开放科学平台上引发了爆炸性的关注。数据显示,该模型在上线仅一天后,其下载速度便超越了平台上任何其他模型。这股热潮的背后,是其强大的性能与彻底的开放姿态的完美结合。
在性能上,Kimi K2在多项行业基准测试中表现出与西方顶尖模型(如Anthropic的Claude 4)及DeepSeek部分模型相当甚至超越的水平。其最引人注目的优势体现在代码生成能力上。在旨在评估AI模型解决实际编程挑战的LiveCodeBench等测试中,Kimi K2取得了极高的分数,显示出其作为高效生产力工具的巨大潜力。
除了是一位编程高手,Kimi K2似乎还是一位颇具天赋的“作家”。在社交平台X上,不少AI评论员称赞其写作风格自然流畅,摆脱了传统AI的机械感。这一点在基准测试中得到了数据支持:在评估角色真实性和避免陈词滥调等创作标准的“创意写作v3”基准测试中,Kimi K2目前高居榜首。同时,在检验模型角色扮演情商的EQ-bench 3测试中,它也表现优异。
实现这一切的,是一个庞大而高效的技术架构。Kimi K2拥有高达1万亿的参数规模,这是一个衡量模型复杂性和能力的关键指标。然而,对于小型研究机构而言,运行如此庞大的模型通常是遥不可及的。Kimi K2的巧妙之处在于采用了“专家混合”(Mixture of Experts, MoE)架构,每次处理任务时仅激活其中约320亿个相关参数。这种设计如同一个拥有众多专家的团队,每次只派遣最擅长该任务的专家出马,极大地降低了运行所需的计算资源,使其变得异常“轻量”,从而为更广泛的研究人员和开发者敞开了大门。
艾伦人工智能研究所的机器学习研究员内森·兰伯特(Nathan Lambert)在其时事通讯《Interconnects》中指出,Kimi K2是“世界上新的最佳开放模型”。开放科学平台Hugging Face的AI研究员Adina Yakefu则表示,社区可以自由地使用它、进行微调并在此基础上构建应用,而无需承担从零开始训练模型的巨大成本。
从“推理者”到“代理”:一条不同的进化路径
值得注意的是,Kimi K2的开发者并未将其定位为像OpenAI的o3系列那样的“推理器”——即那种经过专门训练以执行复杂分步逻辑和科学推理的模型。事实上,在评估AI预测人类研究员会感兴趣的科学思想能力的SciMuse基准上,Kimi K2的表现落后于谷歌的Gemini算法和OpenAI的推理模型。德国马克斯·普朗克光科学研究所的AI科学家马里奥·克伦(Mario Krenn)指出了这一点。
然而,Kimi K2选择了一条不同的、但同样至关重要的发展路径:成为一个强大的“代理大型语言模型”(Agent LLM)。这意味着它的核心设计目标是利用各种外部工具(如浏览网页、调用数学软件、查询数据库等)来自主完成多步骤的复杂任务。虽然某些闭源模型已经具备类似能力,但一个性能如此强大的开源代理模型的出现,为整个社区研究和构建更实用的AI应用提供了前所未有的基础。
从侥幸到趋势:中国的开源AI力量
如果说六个月前DeepSeek的出现尚可被视为一次惊艳的偶然,那么Kimi K2的接踵而至则清晰地表明,这已演变为一种趋势。兰伯特写道:“今年早些时候发布的DeepSeek R1更像是AI发展轨迹中的前传,而非一次性的侥幸。”这表明中国顶尖的机器学习研究人员、工程师以及强大的硬件资源正在系统性地支持这类世界级模型的开发。
成立于2023年3月的月之暗面虽然在西方尚属新面孔,但其此前基于旧模型的Kimi聊天机器人在2024年第一季度已成为中国使用量第三大的AI应用,据报道其背后有阿里巴巴和腾讯等科技巨头的投资。中国公司选择将如此强大的模型公开发布,正在重塑全球开源AI的生态。
这一系列事件也引发了西方的警醒。兰伯特补充说,美国需要一个类似DeepSeek和Kimi K2的开放模型项目,以对抗其在开源和学术社区中不断下降的影响力,他将其称为“美国DeepSeek项目”。
显然,全球AI领域的竞争与合作正在进入一个新的阶段。马里奥·克伦总结道:“很明显,大量拥有出色硬件的顶级机器学习研究人员和工程师一直在支持这项工作。如果未来几个月会有更多(来自中国的模型)问世,我不会感到惊讶。”
原文:https://www.toutiao.com/article/7527778468105290283/
声明:该文仅代表作者本人观点,欢迎在下方【顶/踩】按钮中亮出您的态度。