news 2026/2/10 20:31:41

美团发布5600亿参数LongCat-Flash-Thinking大模型,推理能力跃升

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
美团发布5600亿参数LongCat-Flash-Thinking大模型,推理能力跃升

美团正式发布其最新大语言模型LongCat-Flash-Thinking,这是一款具备5600亿总参数的高效大型推理模型(LRM),采用创新的混合专家(Mixture-of-Experts, MoE)架构,标志着国内企业在通用人工智能领域的技术突破。

【免费下载链接】LongCat-Flash-Thinking项目地址: https://ai.gitcode.com/hf_mirrors/meituan-longcat/LongCat-Flash-Thinking

当前大语言模型正朝着"大参数+高效率"的方向快速演进,MoE架构已成为平衡性能与计算成本的主流选择。据行业研究显示,2024年全球参数规模超千亿的大模型数量同比增长150%,其中采用MoE架构的模型占比达62%。与此同时,推理能力作为衡量模型智能水平的核心指标,已从简单逻辑推理向复杂数学证明、工具使用等高级形态发展,推动大模型从内容生成向问题解决转变。

LongCat-Flash-Thinking的核心突破在于其动态计算机制与创新训练方法的结合。该模型总参数达5600亿,但根据上下文需求仅激活186亿至313亿参数(平均约270亿),这种"按需分配"的计算方式显著提升了效率。其技术亮点集中在三个方面:

首先是领域并行强化学习(RL)训练方法,通过将STEM、编程和智能体任务等不同领域解耦优化,再融合各领域专家模型,最终实现了近乎帕累托最优的综合性能。这一方法有效解决了传统混合域训练的不稳定性问题,使模型在保持数学推理能力的同时,也能在代码生成等任务上表现出色。

其次是自主研发的DORA(Dynamic Orchestration for Asynchronous Rollout)系统,这一高效分布式强化学习框架支持异步训练和灵活的计算资源使用,通过弹性协同定位和多版本异步流水线两大核心组件,实现了数万台计算设备上的稳定可扩展训练,并优化了长序列生成任务的性能。

第三是在形式化推理与智能体推理方面的突破。模型引入新颖的专家迭代框架,通过语句形式化、迭代证明合成和语法一致性过滤等技术,显著提升了自动定理证明能力;同时采用双路径推理方法,能自适应识别高价值查询并调用工具解决复杂任务,强化了模型的实际问题处理能力。

从行业影响来看,LongCat-Flash-Thinking的发布展现了中国企业在大模型核心技术上的自主创新能力。在数学推理领域,该模型在MATH500数据集上达到99.2%的正确率,HMMT25竞赛题测试得分为83.7分,接近国际顶尖水平;代码生成方面,LiveCodeBench基准测试中获得79.4分,OJBench达到40.7分,展现出强大的工程实践能力。特别值得注意的是其在零售、航空等垂直领域的工具使用能力,τ²-Bench-Retail数据集得分71.5分,显示出模型在商业场景落地的潜力。

安全性能同样表现突出,在有害信息识别、犯罪内容过滤、虚假信息检测和隐私保护四个维度得分分别为93.7、97.1、93.0和98.8分,体现了模型在对齐人类价值观方面的严格把控。

【免费下载链接】LongCat-Flash-Thinking项目地址: https://ai.gitcode.com/hf_mirrors/meituan-longcat/LongCat-Flash-Thinking

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/4 22:25:58

macOS 终端中 screen 命令兼容性问题实战案例

macOS 终端里screen总是出问题?别急,我们来一锅端了它你有没有过这样的经历:深夜正在用 Mac 连远程服务器跑一个训练任务,信心满满地敲下screen -S train python train.py,然后去泡杯咖啡回来——发现终端莫名其妙卡死…

作者头像 李华
网站建设 2026/2/3 18:42:33

抖音无水印下载完整教程:3种强力方法轻松搞定

还在为抖音视频带有水印而烦恼吗?douyin_downloader正是你需要的专业解决方案!这款开源工具通过智能解析技术,直接获取抖音原始视频文件,完美避开平台水印添加环节,让你的收藏保持最佳画质和清晰度。🎯 【免…

作者头像 李华
网站建设 2026/2/5 17:54:10

GetQzonehistory完整指南:永久备份QQ空间所有历史记录

想要永久保存QQ空间里那些珍贵的青春记忆吗?GetQzonehistory这款强大的开源工具能够帮你一键导出所有历史说说、转发内容和留言记录,让那些承载着青春印记的数字回忆永不丢失。无论你是为了重温美好时光,还是确保数据安全,这款工具…

作者头像 李华
网站建设 2026/2/7 23:59:27

Qwen3重磅发布:2350亿参数模型支持双模式切换

Qwen3系列最新旗舰模型Qwen3-235B-A22B-MLX-8bit正式发布,凭借2350亿总参数和220亿激活参数的混合专家(MoE)架构,首次实现单模型内"思考模式"与"非思考模式"的无缝切换,标志着大语言模型在场景适应…

作者头像 李华
网站建设 2026/2/3 13:45:14

Qianfan-VL-8B:多模态大模型如何提升文档理解能力?

Qianfan-VL-8B:多模态大模型如何提升文档理解能力? 【免费下载链接】Qianfan-VL-8B 项目地址: https://ai.gitcode.com/hf_mirrors/baidu/Qianfan-VL-8B 百度最新发布的Qianfan-VL-8B多模态大模型,通过针对性优化文档理解能力和OCR技…

作者头像 李华
网站建设 2026/2/9 12:00:25

Windows苹果设备驱动完整安装指南:一键解决连接难题

Windows苹果设备驱动完整安装指南:一键解决连接难题 【免费下载链接】Apple-Mobile-Drivers-Installer Powershell script to easily install Apple USB and Mobile Device Ethernet (USB Tethering) drivers on Windows! 项目地址: https://gitcode.com/gh_mirro…

作者头像 李华