DeepSeek R2有望8月下旬发布?内部人士:不属实
近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。
8月13日,DeepSeek内部人士向澎湃新闻记者表示,上述消息不属实。
早在今年4月,就有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。当时有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
不过,上述内部人士曾向记者坦言,该传言真实度不高。
此后,DeepSeek官宣推出R1新版本,业内普遍认为这是取代了R2的发布。
5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。
公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。
相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。
大模型行业的内卷正在加剧。7月31日,据国际开源社区Hugging-Face最新趋势热榜显示,前十名模型中,有9个是国产大模型,其中排名第一的是智谱最新发布的新一代旗舰大模型GLM-4.5,排名第二的是阿里旗下通义千问模型Qwen3,而腾讯混元最新发布的3D模型则排行第三。
但据排名数据显示,DeepSeek R1在Hugging-Face趋势热榜中并不靠前,不过其依然是目前点赞最多的大模型,DeepSeek R1收到了1.25万个赞(like),远超其他国产大模型。
在年初成为大模型产业王炸黑马后,DeepSeek成为国内大模型厂商的集体竞标对手,包括MiniMax、月之暗面等知名大模型公司或明或暗都提出了对标DeepSeek的目标,且在更新迭代上进展迅速。作为中国开源大模型的“风向标”,DeepSeek正在面临更激烈竞争。
- • 事关AI,腾讯重大宣布!互联网领涨恒生科技,513770涨逾1%
- • “车上放瓶水视频走红,揭秘车主日常生活中的小细节”
- • 戴维·珀杜宣誓就任美国驻华大使
- • 已落马领导干部制定的简单粗暴政策仍在执行?纪委出手
- • 上海最高观景台纪录刷新,早鸟票5888元/套含观光餐饮等
- • 奥雅设计IPO:绿色生态设计引领者迈向资本市场
- • 特朗普称将把进口钢铁关税从25%提高至50%
- • 芬兰总统呼吁保持冷静镇定 有报道称俄罗斯在两国边境附近增兵
- • 北三县最新动态:新京报深度解析区域发展新趋势
- • 淋巴结发炎:揭秘引起这一症状的多种原因
- • 《惊险刺激!侠盗飞车5下载攻略,让你畅游虚拟城市》
- • 华为云张平安:基于昇腾AI云服务,可以打造出世界一流大模型
- • 一汽、东风和广汽发声:将支付账期统一至60天内
- • 《促醒者》演员阵容大揭秘:实力派明星齐聚一堂,精彩演绎感人故事
- • 莫迪好尴尬:印度神,中国造
- • 国产创新减重药物在上海落地使用,患者超重伴有轻度脂肪肝
- • “塑料兄弟情”维持不到一年,特朗普和马斯克是如何走向决裂的?
- • 光大期货:7月24日软商品日报
- • 宣布在AI领域二次创业后,王自如再被强制执行246万元
- • 前五个月新增社融超18万亿元,政府债是主要支撑
- • 13家煤企预亏约30亿,煤炭一哥也难逃下滑
- • 《东方财经股市直播室:解码中国股市的智慧之门》
- • “反内卷”点燃期市暴力拉升行情,交易所限仓降温,多个热门品种回调
- • 心慌气短:揭秘身体发出的紧急信号
- • 李东生:新型全球化是中国企业发展的主要驱动力,应构建全球经营和供应链体系
- • NPR和PBS的首席执行官们表示将针对特朗普政府削减联邦资金的举措发起挑战
- • 流浪大师沈巍近况:生活依旧,精神不减
- • 中国海洋发展可能延迟刊发年度业绩
- • 浪漫瞬间:美女与帅哥的深情吻
- • 农业农村部:把住能繁母猪存栏量“总开关”,引导养殖场户优化母猪存栏结构、合理控制产能
- • 测量平均速度练习题:提升学生数学能力的有效途径
- • 哈根达斯蛋糕官网订购,尽享美味与便捷
- • 《人潮汹涌》翻拍韩国电影:致敬经典,再创辉煌
- • 汽车早报|特斯拉加州销量连续七个季度下滑 现代起亚对美电动汽车出口同比骤降88%
- • 美国加入战斗,将如何影响原油、黄金和美股价格?
- • 美国务卿与以色列总理通话,讨论加沙局势
- • 1953年国庆阅兵:新中国军事力量的辉煌展示
- • 乌鲁木齐八一中学:传承红色基因,培育时代新人
- • 甘肃天水一幼儿园违规使用添加剂致部分幼儿血铅异常,实控人拥有4家幼儿园
- • 回顾性研究设计:策略与要点解析
- • Excel日历表格模板:高效管理时间,轻松规划生活
- • 盗贼偷窃宏,警钟长鸣守家园
- • 机构:快递业务量或保持较快增速 港股物流股集体上涨
- • 匈牙利福林持稳 市场静候央行利率决议
- • 四川甘孜州地震:众志成城,共渡难关
- • G20峰会晚宴:国际领袖共聚一堂,共商全球发展大计
- • 成年男女的性生活:探索和谐与平衡之道
- • 2021年湖南高考录取分数线揭晓:分数线稳中有升,竞争激烈
- • “防水茅”东方雨虹被出具警示函,涉资金占用和财务核算等问题
- • 轩字:古韵悠长的意境与深远的文化内涵
- • DNF希洛克硬币:揭秘地下城与勇士中的神秘货币
- • 比特币跃升至历史新高,超过了1月份的纪录
- • “99久爱”:一场跨越世纪的浪漫传奇
- • “朱雀玄武敕令”改名“周乔治华盛顿”?警方称未通过审核
- • “影像·算法·共域”首届高校摄影教育与智能影像研讨会举办
- • 《中国国际文化产权交易所客户端:便捷下载,开启文化产权交易新篇章》
- • 揭秘:探索“屁屁里放入jj是啥滋味”的真相
- • 森金村猎人训练师:传承狩猎技艺的守护者
- • 揭秘水宝宝:探究其制作原料与工艺
- • 小米汽车公布最新开店进展:4月新增34家门店
- • 山西洪洞县又有两名前官员被通报:对干部带病提拔问题负有责任
- • 容量瓶上的标识:揭秘实验室中的“度量神器”
- • 美公布“泰坦”号深潜器事故调查报告
- • 一季度“淡季不淡”,这几大因素让上海集成电路产业快速增长
- • 白宫审查马斯克公司的政府合同,发现SpaceX几乎不可替代
- • 湖南卫视《汉语桥》:搭建中外文化交流的桥梁
- • 滕泰:尽快推出万亿元级别的消费繁荣计划,把选择权交给消费者和市场
- • 游客不听劝阻遇难,安全意识亟待提高
- • 短剧行业的出海裂痕:从ReelShort版权纠纷说起
- • 脑中卒症状:识别与应对的关键知识
- • 《中国好声音报名条件详解:梦想舞台,你准备好了吗?》
- • 物流地产巨头ESR私有化退市,盈利陷困境,股价较峰值跌去60%
- • 中金:升阅文集团目标价至43.5港元 维持“跑赢行业”评级
- • 人民日报关注:超越许多中超场次上座率,“苏超”为啥突然火了
- • 《不会恋爱的我们》电视剧免费观看全集:探寻现代都市情感困境的温暖启示
- • 交涉之政、交涉之学与交涉文献——《近代中外交涉史料丛书》第二辑“总序”
- • 据称将与白宫达成1亿美元和解协议 康奈尔大选拒绝置评
- • 女子购4万元黄金寄“军官男友”,民警拦截:这是“杀猪盘”
- • 三大指数集体回调!AI+银行成今日避风港,银行ETF(512800)盘中创新高!金融科技单边下挫
- • 杭州奔驰车失控撞人事件:悲剧背后的人性反思
- • 平面直角坐标系压轴题:探索数学之美
- • 深南股份002417:创新驱动,引领行业新潮流
- • 张纯烨泳装秀:青春活力,时尚风采
- • 广州市公务员网络大学堂:创新学习模式,助力公务员能力提升
本文 快租网 原创,转载保留链接!网址:https://mip.kuaizu.me/post/26299.html