月之暗面重返基模战场:发布首个开源万亿模型,押注“模型即Agent”
炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会!

蓝鲸新闻7月12日讯(记者 朱俊熹)时隔半年,“大模型六小龙”之一的月之暗面终于推出新一代基座模型Kimi K2。据官方介绍,Kimi K2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型,总参数达1万亿,激活参数为320亿。
7月11日发布并同步开源的新模型包括两个版本:基础模型Kimi-K2-Base、更适合通用聊天和智能体任务的后训练模型Kimi-K2-Instruct。在自主编程、工具调用和数学推理相关的能力评测中,Kimi K2均取得了较优的表现。以SWE-bench Verified、AIME 2025等评测集为例,Kimi-K2-Instruct的得分超过了同为开源模型的DeepSeek-V3、阿里Qwen3,逼近甚至能够反超OpenAI GPT-4.1、Anthropic Claude 4 Opus等领先闭源模型。
结合6月底开启内测的新Agent“Kimi-Researcher”不难看出,月之暗面的思路正转向“模型即Agent”。模型自身就集成了自主决策和执行任务的能力,能够作为智能体解决复杂任务。
在官方释出的用例中,用户要求Kimi K2帮忙规划参加Coldplay乐队巡演的行程。该模型通过17次工具调用,涵盖搜索、日历、邮箱、航班、餐厅预订等环节,制定出一份完整的机酒与旅游规划,并形成可视化报告。
智能体能力正在成为国内外大模型厂商竞相押注的进化方向。本周,马斯克旗下的人工智能初创公司xAI发布新一代大模型Grok 4,包括单智能体、多智能体两个版本,具备工具使用、实时搜索等功能。Anthropic在推出Claude 4系列模型时也强调,在编程、推理和Agent方面“树立了全新标准”,能够处理复杂且长时间运行的任务。
月之暗面在Kimi K2的技术博客里分享了对构建开放智能体智能的看法。其指出,预训练是智能体智能的关键基础,它让模型拥有基本的知识、理解和推理能力,从而在后续的强化学习中更有效地学习。但“人类数据就像是有限的‘化石燃料’”,因此如何在预训练阶段提升对有限数据的利用效率,成为当前AI扩展的关键挑战。
而在后训练阶段,大模型不再只依赖人类数据,开始从自己的行为和结果中获得奖励、进行自我优化,以实现超越人类能力的可能。
“Kimi K2正是在这些洞见之上锻造而成的。”月之暗面表示。其同时强调,Kimi K2是构建通用Agent能力的坚实基础,但通用Agent还需要更高级的能力,比如思考和视觉理解,计划未来为该模型加入这些能力。此外,长文本处理能力曾是Kimi的核心优势,此次Kimi K2的上下文长度为128k,不及部分新发布的模型。
值得注意的是,Kimi K2是国内首个开源的万亿参数级别模型。此前虽有其他大模型厂商训练出万亿参数模型,如腾讯混元Turbo、MiniMax abab 6.5等,但都采取了闭源路线。
在训练Kimi K2这样的万亿参数级别的大模型时,月之暗面采用了自主创新的Muon优化器。与传统的Adam优化器相比,Muon在token利用效率上表现更优,能让大模型学得更快、更有效率。同时为解决Muon在超大规模训练时遇到的不稳定问题,团队还提出了MuonClip这一稳定性增强技术,支撑Kimi K2顺利完成15.5万亿tokens的预训练,未出现训练损失值的异常峰值。
自年初DeepSeek横空出世以来,月之暗面虽然陆续释出了一些技术或产品上的更新,但始终未能重拾外界对其的热切期待,一度表现得颇为低调沉寂。而此次Kimi K2的发布,让这家明星创企终于重回基模舞台的聚光灯下,这场牌局仍未见定论。
- • 推进“好房子”建设、构建房地产发展新模式,国常会最新部署
- • 新冠发烧:了解发烧持续天数的重要性
- • 小马智行启动上海浦东自动驾驶出行服务
- • 瑞银:澳门6月至今博彩收入环比跌2%仍亮眼 推荐银河娱乐
- • 档案盒侧面:见证历史与传承记忆的守护者
- • 西边的风,儿童脚模中的童年记忆
- • “新消费三姐妹”估值争议:40倍PE泡泡玛特是时代红利,还是资本泡沫
- • 审计非标意见暴露田野股份多重风险:收入虚增疑云与内控失效下的退市危机
- • 赛尔号魔王咤克斯:神秘降临,赛尔英雄的终极挑战
- • 安莉芳内衣:时尚与舒适的完美融合
- • 湖南桑植农村商业银行被罚38.6万元:在用现金机具鉴别能力不符合国家和行业标准等
- • 机器人时代的社会结构模型与十年后中国首富预测——周亚辉投资笔记2025系列第1篇
- • 急着第四季度盈利的蔚来汽车不再固执
- • 摩根士丹利将美股评级上调至"超配"
- • 与普京通话讨论乌克兰问题后,特朗普:我不高兴
- • 企业招聘信息发布模板:高效吸引优质人才
- • 来伊份回应粽子异物事件:全链路调查启动 代工模式与品控问题再受关注
- • 欧洲债市:德债走低 市场下调欧洲央行降息预期
- • 《陈一发儿童话镇在线听:重温经典,感受童趣魅力》
- • 权威访谈丨国家疾控局就《世界卫生组织大流行协定》答记者问
- • 岳阳警方:一货车移车时意外失控,造成饮料店门口2死2伤
- • 提升历史课堂有效性:策略与实践
- • 河南消防网:守护家园的消防安全信息平台
- • 《魔兽世界法师技能等级:解锁魔法奥秘的钥匙》
- • 从左翼人士到晚年“右转”:作家略萨的政治之旅
- • 电脑打字在线练习:提升打字速度与准确率的利器
- • 河南无症状病例追踪:揭秘新冠病毒的无形威胁
- • 揭秘AI换脸女明星福利网站:技术突破还是道德沦丧?
- • 【携手奔赴现代化的明天】这么一“升级”,吉林农业真的变了!
- • 江西银行、吉林银行、东莞农商行被评D档,交易商协会发布2024年承销机构评价结果
- • 关颖颖高清肉搏照引发热议:模特界的时尚与争议
- • 墓地苔藓:探寻我国苔藓分布的神秘角落
- • 未来5年,城市将有这些新变化(权威发布)
- • 天伦燃气股价持续上涨逾7% 公司逆势提升分红派息比例
- • 哈佛大学国际生遭遇“禁招令”,全球多所高校抛出橄榄枝
- • 台湾娱乐中文网在线:为你带来全方位的娱乐资讯
- • 国产电影2014:回顾与展望
- • 中国汽车保险安全指数:守护驾驶安全的新标杆
- • 移仓:金融市场中的策略调整与风险管理
- • 法国时尚电视台引发争议:无上装节目是否挑战传统审美?
- • 河北地税网上办税大厅:便捷高效,助力企业减负增效
- • 探索上海特斯拉官网:新能源时代的未来出行先锋
- • 全面关停,盒马折戟会员店业态
- • 明星势力榜:盘点娱乐圈的璀璨星辰
- • F1奥地利站:速度与激情的巅峰对决
- • 俄罗斯西伯利亚东部发生5.2级地震,震源深度10千米
- • 工程量验收单:确保工程质量的守护神
- • 哈马斯称其在停火谈判中表现出极大灵活性
- • 环球印网:引领全球印刷行业的数字化转型
- • 《中国体育》直播平台zhibo.tv:体育盛宴的线上聚集地
- • 中国太保获贝莱德增持709.3万股 每股作价约24.53港元
- • 准80后遵义市自然资源局局长陈清松任仁怀市委副书记、代市长
- • 伊朗报复以色列发动三波导弹袭击,造成至少63人受伤
- • 新华社:摩萨德渗透伊朗有多深?
- • 女同性恋的称呼:多元文化中的理解与尊重
- • 周二热门中概股涨跌不一 小马智行涨5.74%,中通跌8.04%
- • 2021年湖北省高考状元:砥砺前行,书写青春华章
- • 红杉中国考虑与Ami分道扬镳
- • 冲上热搜!张雪峰突然宣布暂停直播两个月
- • 4000万日元背后的故事:财富的奇迹与挑战
- • 华研精机:创新驱动,打造智能装备领域的领军企业
- • 胜利精密最新公告:聚焦创新驱动,拓展多元化市场布局
- • “假发大王”瑞贝卡被证监会立案,曾多次被警示
- • 符号互动论:揭示社会互动背后的符号奥秘
- • 加拿大野火肆虐过火面积超7.3万平方公里
- • 数学在实际生活中的应用:探索与启示
- • 食品安全,守护健康——食品安全视频宣传片深度解析
- • 《畅游天下:探索旅游频道的魅力与价值》
- • 在山东威海,每年有20万人去寻找一艘沉船
- • 洪水过后,这些饮食安全问题要警惕(服务窗·夏季安全指南)
- • 揭秘韩国高清美女网站:网络美学的盛宴
- • 深入解读工商总局商标局官网:了解商标注册的便捷之门
- • 董璇晒小酒窝萌照,网友直呼可爱到爆!
- • 美国多地天降“火球”
- • 识别强势股的秘诀:哪些股票值得关注?
- • 淘宝闪购将投入500亿补贴 促进商家生意增长
- • 养痈成患:警惕小问题演变成大灾难
- • 外汇管理局官网汇率查询:便捷查询外汇汇率,助力跨境交易
- • “轻松掌握高考成绩,普通高考成绩查询网站助你一臂之力”
- • 经济日报:“非升即走”将走向何方
- • 近五年港股医药板块最大IPO,恒瑞港股上市首日收涨25%
- • 卢特尼克表示10%的基础关税在“可预见的未来”将持续存在
- • 揭秘康师傅冰红茶的出厂价:成本构成与市场策略
- • Excel表格如何进行高效排序:实用技巧详解
本文 快租网 原创,转载保留链接!网址:https://mip.kuaizu.me/post/19056.html