近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。
8月13日,DeepSeek内部人士向澎湃新闻记者表示 ,上述消息不属实 。
早在今年4月,就有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。当时有报道称 ,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
不过,上述内部人士曾向记者坦言 ,该传言真实度不高 。
此后,DeepSeek官宣推出R1新版本,业内普遍认为这是取代了R2的发布。
5月29日 ,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后 ,开启“深度思考”功能即可体验最新版本 。API也已同步更新,调用方式不变。
公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力 ,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro 。
相较于旧版R1 ,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens ,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考 。
大模型行业的内卷正在加剧。7月31日,据国际开源社区Hugging-Face最新趋势热榜显示 ,前十名模型中,有9个是国产大模型,其中排名第一的是智谱最新发布的新一代旗舰大模型GLM-4.5 ,排名第二的是阿里旗下通义千问模型Qwen3,而腾讯混元最新发布的3D模型则排行第三。
但据排名数据显示,DeepSeek R1在Hugging-Face趋势热榜中并不靠前,不过其依然是目前点赞最多的大模型 ,DeepSeek R1收到了1.25万个赞(like),远超其他国产大模型。
在年初成为大模型产业王炸黑马后,DeepSeek成为国内大模型厂商的集体竞标对手 ,包括MiniMax 、月之暗面等知名大模型公司或明或暗都提出了对标DeepSeek的目标,且在更新迭代上进展迅速 。作为中国开源大模型的“风向标”,DeepSeek正在面临更激烈竞争。
股票:开户配资炒股-二季度扩内需政策有望加码,涉及消费、楼市和中小企业
股票开户在哪家证券开户好:配资出金-2025陆家嘴论坛今日开幕 若干重大金融政策将发布(附最新议程)
股票开户怎么办理流程:配资平台哪个是实盘的-消息人士称特朗普计划最早下周与普京和泽连斯基会面
炒股配资推荐网查询:手机开户怎么买st股票-多家私募看好AI产业链投资!科技板块有望迎来修复行情
线上股票开户选哪个券商好:线上买股票怎么开户-小米预计全年整体收入增超三成 汽车业务有望下半年单月或单季盈利
深圳股票配资知识网:股票怎么融资-50%关税!特朗普深夜宣布!美联储重磅发布!
万通配资提示:文章来自网络,不代表本站观点。
文丨财联社自今年以来,中特估这一概念时常被市场提起。正如机构此前指出,这一概念是港股新核心资产,低估值、...
记者辛圆给补贴、建平台,为了吸引更多高层次人才,各地纷纷放出“大招”。据央广网周一发布消息,湖...
文丨财联社今年彩票销售明显变得火爆,相比于股票的高风险和高回报,彩票凭借其较低的门槛和“命运盲盒”的魅力...
界面新闻记者|龙力开年以来,私募“扫货”首发ETF的热情持续高涨。Wind数据显示,截至3月6日,今...
文丨中信证券中信证券研报指出,8月15日央行超预期降低MLF和逆回购利率。一是时间超预期,前两次降息分别...
记者辛圆猪价近期呈现疲弱态势。农业农村部监测数据显示,2月份全国猪肉价格连续4周下降。另据中国养猪网数...
记者辛圆3月6日,十四届全国人大三次会议举行经济主题记者会,国家发展和改革委员会主任郑栅洁、财政部部长...
记者辛圆国务院总理李强周三在政府工作报告中介绍今年政府工作任务时提出,推动标志性改革举措加快落地,更好...