美团开源5677亿参数大模型,两项测试刷新SOTA!
创始人
2026-03-21 23:39:26

IT之家 3 月 21 日消息,美团现已开源 LongCat-Flash-Prover 大模型,采用 5677 亿参数、MoE(混合专家模型)形态,旨在解决复杂的数学证明问题。

据介绍,该模型引入了混合专家迭代框架(hybrid-experts iteration framework),用于生成大规模、高质量的形式化推理轨迹。可通过整合 Lean4、基于 AST 的多阶段严格验证流程,消除“幻觉”现象。

训练方面,该模型使用混合专家迭代框架生成冷启动数据,并在强化学习阶段引入 HisPO 算法稳定 MoE 模型的长程任务训练。同时加入定理一致性和合法性检测机制防止 Reward Hacking(奖励黑客行为)。

基准测试表明,这款模型在 MiniF2F-Test 上取得 97.1% 的成绩,仅需 72 次推理尝试;在 PutnamBench 任务上解决了 41.5% 的问题,使用 118 次推理尝试,在上述两项测试中刷新 SOTA 水平。

IT之家附该模型开源地址如下:

  • GitHub:https://github.com/meituan-longcat/LongCat-Flash-Prover
  • Hugging Face:https://huggingface.co/meituan-longcat/LongCat-Flash-Prover

相关内容

热门资讯

8道快手家常菜,简单实惠又好吃... 对于忙碌的上班族或者厨房新手来说,能在短时间内做出几道美味可口的家常菜,是一件非常幸福的事。下面就为...
儿童护眼台灯推荐品牌有哪些?高... 现在越来越多家长开始重视孩子的用眼环境,尤其是每天都要长时间写作业、看书,台灯选得好不好,真的会直接...
聚焦端侧AI,江波龙携多场景存... 2026年3月2日至5日,世界移动通信大会(MWC26)在西班牙巴塞罗那举行。国内半导体存储企业江波...
AI人才汇聚金陵同台竞技,南京... 上证报中国证券网讯(记者 仲茜)3月21日,作为“智汇金陵·AI开源人才峰会暨魔搭开发者大会”的重磅...