发布日期:2025-08-10 浏览次数:
凯发国际娱乐官网入口网址,又一次“搞大事情”,火爆海外,引发热烈讨论。今年7月,月之暗面发布的大模型Kimi K2,参数总规模达到万亿级别,
此前的2023年10月,月之暗面发布了支持20万汉字输入的Kimi产品,成为行业领头羊,并于2024年3月上线万汉字输入的Kimi新产品。这家一次次在全球大模型领域实现超越的海淀企业,其实很年轻,2023年3月成立,员工平均年龄29岁,大部分员工在海淀总部办公。
上次月之暗面引发全球轰动,当属2023年10月Kimi智能助手上线万汉字长文本的智能助手产品,引领大模型“无损长上下文”时代。美国人工智能公司OpenAI和Anthropic到当年11月才在长文本上追上来,而在精度(无损记忆)和中文能力上Kimi依然领先。
不到半年后的2024年3月,Kimi上线万汉字输入的新产品。这家初创公司用领先的Kimi大模型产品,确立行业地位,成为中国人工智能大模型阵营的一支劲旅。
此次月之暗面发布的Kimi K2大模型,是一款采用混合专家架构(MoE)的基础模型,总参数1万亿,激活参数320亿。这是全球首个开源万亿参数基础模型。虽然总参数规模达到了万亿级别,由于采用混合专家架构,每次任务仅动态激活320亿参数,只需调用模型中相关模块,有助于控制所需算力。
“既拥有巨大模型的知识和能力,又保持很高的运行效率,能以更低的成本开展更加复杂的工作。”月之暗面研究员杜羽伦介绍,Kimi K2支持通过应用程序接口调用,定价显著低于“克劳德4”等主流闭源模型。
Kimi K2在代码、数学推理、智能体任务等开源模型基准性能测试中,均取得开源模型中的SOTA(领域内最高水准)成绩。上线一周后,国际权威大模型排行榜LMArena宣布,这一模型成为全球第一的开源模型,并在开闭源总榜上排名第五。截至8月5日,在全球最大开源AI平台Hugging Face上,Kimi K2下载量超过39万次,日均下载量甚至超过了DeepSeek-V3和R1。在全球最大的大模型程序接口(API)聚合网站OpenRouter上,Kimi K2于7月中旬登上趋势榜第一名。
美国西雅图艾伦人工智能研究所机器学习研究员内森·兰伯特7月14日撰文称,今年年初的DeepSeek-R1更像是人工智能发展轨迹中的前传,接下来像Kimi K2这样的模型证明中国可以持续做出惊人的世界级创新。
月之暗面海淀总部的门口摆放着一架钢琴,上面有摇滚乐队平克·弗洛伊德的专辑《The Dark Side of the Moon》(《月之暗面》)。月之暗面创始人杨植麟因为这张专辑定下了公司的名称。这架钢琴不是摆设,公司员工在闲暇之余可以自己弹奏。在Kimi K2发布前,月之暗面的员工想听Kimi K2弹钢琴。Kimi K2项目组成员詹皓冰说,大家使用Kimi K2编写了一个MCP(模型上下文协议)工具,让它学会弹钢琴。最终,K2经过识别琴谱、学习运用代码弹钢琴,于发布前夜完整弹奏出了《卡农》。
从零开始,自主学习弹钢琴,正是在大参数下,Kimi K2的核心定位——专为智能体工作流而设计,能够更准确地理解用户的复杂意图,拆解任务,自主调用工具去完成,甚至完成复杂的多步骤流程。
詹皓冰表示,K2的前端编程能力很强,在3D、游戏、动画制作等场景上,用简单的指令和K2交互,就能得到很惊艳的效果。另一方面,智能体的工具调动能力也让模型整体上有了很大提升。如将13万行的原始数据丢给Kimi K2,它可以分析远程办公比例对薪资的影响,并用统一色调做出小提琴图、箱线图、散点图等专业图表,整理成报告。还可以帮用户完成演唱会所在城市的机票、酒店与旅游规划,并且生成日历,再用超文本标记语言概括完整行程规划后发送邮件。
“希望通过全面开源性能更强的模型,进一步加速通用人工智能研究与应用落地的整体进程。”月之暗面相关负责人说。
2024年,Kimi大模型用户量增长了100倍,从几十万增长到几千万。2025年1月,Kimi K1.5多模态思考模型发布。此后,直到2025年6月,才发布Kimi-Researcher(深度研究)模型,中间有几个月空档。
在这几个月时间里,月之暗面勤于修炼“内功”。“面对市场环境和竞争格局变化,我们并没有‘一拍脑袋’把强化学习干到底,反而更加注重第一性原理,即先把基座模型做好。所以我们在几个月时间里没有发布任何模型,也拒绝了抢发模型的诱惑,而是做了一件更长期的事。”月之暗面研究员杜羽伦说。
直到7月发布的Kimi K2大模型一鸣惊人,问鼎全球。K2的名称源于乔戈里峰。乔戈里是喀喇昆仑山脉第二个被考察的山峰,国际上公认的命名便是K2。
杜羽伦表示,贯彻第一性原理,做好基座模型这一长期战略看来对团队非常有益,既得到了技术突破,也得到了一个非常好的模型。
月之暗面长达几个月的“闭门修炼”,显示了公司的发展定力和实力,也体现了各方给予公司的包容和耐心。其中,海淀不断强化耐心资本与科技创新深度融合,引导耐心资本投早、投小、投长期、投硬科技,赋予科技创新更大空间。记者了解到,2024年初,月之暗面获得当时国内大模型领域的最大笔融资。截至目前,海淀区已汇聚股权投资管理机构近500家,“十四五”以来辖区企业年均获投金额超700亿元,机构数量、被投案例及资金规模均居全国前列。资本更有耐心,企业更加安心。
如果说月之暗面是一匹千里马,那么,这家初创人工智能公司背后,有什么样的伯乐?
记者在月之暗面公司官网看到,公司简介很短,只有100多字。第一段是一句话的公司介绍和一句话的产品介绍。第二段也是一句话,主要内容是创始团队核心成员参与了多个大模型的研发,多项核心技术被多个主流产品采用。
月之暗面公司从全球人工智能大模型企业中脱颖而出,创始人是重要因素。创始人杨植麟是中国35岁以下NLP(自然语言处理)领域被引用最高的研究者,被誉为“天才少年”,两位联合创始人周昕宇和吴育昕都有10000+的谷歌学术搜索引用。
当千里马出现后,怎样助力千里马奋力奔跑、追逐梦想?考验伯乐的知识、远见、气魄等。“月之暗面在成立的两年多时间里,得到海淀区的大力支持,积极协调解决人才引进、算力补贴、房屋租赁等各种困难问题,为企业加快发展奠定坚实基础。”公司相关负责人表示。
人工智能领域人才极度稀缺。而在海淀区,招募人工智能人才有显著优势。海淀区37所高校中,有21所高校开设人工智能本科专业,形成全球最大规模的人工智能人才自主培养体系。全区拥有人工智能学者1.23万名,全市占比超80%。
记者搜索发现,从月之暗面公司出发,步行前往清华大学是2.4公里,前往北京大学是2.9公里。月之暗面创始人杨植麟本科也毕业于清华大学计算机系。
当前,海淀正建设具有全球影响力的人工智能创新策源地和产业高地,给月之暗面这样的人工智能企业提供了深厚的土壤,搭建了良好的生态。海淀区已基本形成芯片、框架、大模型、数据技术与处理服务等技术体系自主可控的人工智能全产业链,成为全国人工智能领域产业基础最好、人力资源最密集、产品迭代最活跃的地区。
2024年,海淀区人工智能核心产业规模达2822亿元,年增速达30%,规模占全市80%。现有人工智能企业1900余家,备案大模型95款、全市占比近70%;全市首个万P级智算集群建成投用。在这片土地上,人工智能企业创新成果持续涌现。
海淀在扶持创业者上,还通过搭平台、办赛事等各种形式促转化,让更多科研成果从“书架”走向“货架”。
“Kimi K2模型目前还没有经过大规模的强化学习,下一版经过大规模强化学习之后,能力会更强,更多工具即将在Kimi上线。”杜羽伦说。