news 2026/5/10 21:56:32

美团LongCat-Flash-Thinking:5600亿参数推理引擎来了!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
美团LongCat-Flash-Thinking:5600亿参数推理引擎来了!

美团LongCat-Flash-Thinking:5600亿参数推理引擎来了!

【免费下载链接】LongCat-Flash-Thinking项目地址: https://ai.gitcode.com/hf_mirrors/meituan-longcat/LongCat-Flash-Thinking

导语:美团正式发布5600亿参数大模型LongCat-Flash-Thinking,采用创新混合专家(MoE)架构,在数学推理、代码生成等复杂任务中展现出行业竞争力,标志着国内大模型技术在高效推理领域迈出重要一步。

行业现状:大语言模型正朝着"更大参数、更高效率"的方向快速演进。随着GPT-5、Gemini 2.5等国际巨头模型的迭代,参数规模已突破千亿级,但如何在保持性能的同时提升计算效率成为行业共同挑战。混合专家(Mixture-of-Experts, MoE)架构通过动态激活部分参数的方式,有效平衡了模型规模与计算成本,成为当前大模型技术的重要发展方向。据行业报告显示,2025年全球大模型市场规模预计突破2000亿美元,其中推理效率优化相关技术将成为核心竞争点。

产品/模型亮点:LongCat-Flash-Thinking作为美团DORA分布式强化学习框架的重要成果,呈现三大核心创新:

首先,动态高效的MoE架构。该模型总参数达5600亿,但通过智能激活机制,实际推理时仅需调用186亿至313亿参数(平均约270亿),在保证性能的同时显著降低计算资源消耗。这种"按需激活"的设计使模型在消费级硬件上也能实现高效推理。

其次,领域并行强化学习技术。创新性地将STEM(科学、技术、工程、数学)、代码开发和智能体任务进行解耦优化,分别训练领域专家模型后融合为 Pareto 最优模型。这一方法有效解决了传统混合域训练的不稳定性问题,使模型在数学推理(MATH500测试得分99.2)、代码生成(LiveCodeBench@4得分79.4)等专业领域达到行业领先水平。

第三,强化推理能力突破。特别强化了形式化推理和智能体推理两大关键能力:在形式化推理方面,通过专家迭代框架实现自动定理证明,MiniF2F测试Pass@32得分达81.6;在智能体推理方面,采用双路径推理方法提升工具使用效率,在τ²-Bench-Telecom等行业基准测试中得分83.1,展现出在零售、航空、电信等垂直领域的应用潜力。

行业影响:LongCat-Flash-Thinking的发布将加速大模型技术在产业端的落地进程。其高效推理特性降低了企业级应用的部署门槛,而领域专精能力则为垂直行业解决方案提供了技术支撑。美团作为生活服务领域的领军企业,此次布局不仅强化了自身技术壁垒,更为服务业智能化转型提供了新范式。值得注意的是,该模型在安全评估中表现突出,有害信息识别率93.7%、隐私保护得分98.8,为行业树立了负责任AI的典范。

结论/前瞻:LongCat-Flash-Thinking的推出,标志着国内大模型研发已从"参数竞赛"转向"效率与精度并重"的高质量发展阶段。随着动态计算、领域并行等技术的成熟,大模型将更广泛地渗透到实体经济中。未来,我们有理由期待美团将这一技术应用于智能客服、供应链优化、本地生活服务等场景,推动服务业数字化升级进入新阶段。同时,其开源策略也将促进学术界和产业界的协作创新,共同推动大模型技术的健康发展。

【免费下载链接】LongCat-Flash-Thinking项目地址: https://ai.gitcode.com/hf_mirrors/meituan-longcat/LongCat-Flash-Thinking

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 16:58:46

CogAgent:解锁GUI智能操作与高清视觉对话的AI新星

CogAgent:解锁GUI智能操作与高清视觉对话的AI新星 【免费下载链接】cogagent-chat-hf 项目地址: https://ai.gitcode.com/zai-org/cogagent-chat-hf 导语:THUDM团队发布的CogAgent模型,凭借其在GUI智能操作与高清视觉对话领域的突破性…

作者头像 李华
网站建设 2026/5/10 7:16:34

IBM Granite-4.0:3B参数多语言AI新模型

IBM Granite-4.0:3B参数多语言AI新模型 【免费下载链接】granite-4.0-micro-base 项目地址: https://ai.gitcode.com/hf_mirrors/ibm-granite/granite-4.0-micro-base 导语:IBM推出Granite-4.0-Micro-Base模型,以30亿参数实现多语言处…

作者头像 李华
网站建设 2026/5/10 12:19:31

Lucy-Edit-Dev:文本指令一键编辑视频新体验

Lucy-Edit-Dev:文本指令一键编辑视频新体验 【免费下载链接】Lucy-Edit-Dev 项目地址: https://ai.gitcode.com/hf_mirrors/decart-ai/Lucy-Edit-Dev 导语:DecartAI推出开源视频编辑模型Lucy-Edit-Dev,首次实现纯文本指令驱动的视频精…

作者头像 李华
网站建设 2026/5/9 6:52:24

LFM2-8B-A1B:手机也能跑的8B参数AI模型

LFM2-8B-A1B:手机也能跑的8B参数AI模型 【免费下载链接】LFM2-8B-A1B-GGUF 项目地址: https://ai.gitcode.com/hf_mirrors/unsloth/LFM2-8B-A1B-GGUF 导语:Liquid AI推出的LFM2-8B-A1B模型,以83亿总参数、15亿激活参数的混合架构设计…

作者头像 李华
网站建设 2026/5/10 11:33:05

Qwen3-4B-SafeRL:安全智能双优的AI模型新体验

Qwen3-4B-SafeRL:安全智能双优的AI模型新体验 【免费下载链接】Qwen3-4B-SafeRL 项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3-4B-SafeRL 导语:Qwen3-4B-SafeRL模型正式发布,通过创新的混合奖励强化学习技术,…

作者头像 李华
网站建设 2026/5/9 14:07:03

LFM2-1.2B-Extract:9语文档智能提取新体验

LFM2-1.2B-Extract:9语文档智能提取新体验 【免费下载链接】LFM2-1.2B-Extract 项目地址: https://ai.gitcode.com/hf_mirrors/LiquidAI/LFM2-1.2B-Extract Liquid AI推出全新轻量级文档提取模型LFM2-1.2B-Extract,以12亿参数实现跨9种语言的非结…

作者头像 李华