news 2026/5/5 2:02:12

美团在 GitHub 上悄悄开源 AI 大模型?8 个大脑并行,绝了。

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
美团在 GitHub 上悄悄开源 AI 大模型?8 个大脑并行,绝了。

2026 年,可能是会自己深思熟虑的智能体模型正式登场的一年。

美团 LongCat 团队刚刚开源的LongCat-Flash-Thinking-2601,就是这一波浪潮中的标志性模型。

它不仅是一个大模型,更是一个为智能体 Agent 时代量身打造的大型推理模型(Large Reasoning Model, LRM),号称全球首个完整开源、可在线体验的「重思考」模型。

在工具调用、智能搜索、交互式推理等一系列评测中都冲上了开源 SOTA。

01

开源模型简介

2026 年 1 月 15 日,美团正式发布了 LongCat-Flash-Thinking-2601,开源可用,可在线体验:

  • 参数规模:5600 亿,采用 MoE 混合专家架构

  • 定位:高性能、高效率的大型推理模型

  • 核心方向:Agent 能力 + 深度思考能力

它不是单纯为了更会聊天,而是为了在以下这种任务里表现更好:

  • 多工具协同的复杂任务

  • 需要多步推理、反复权衡的高难问题

  • 在信息不完美、环境有噪声的真实场景下,依然保持稳定决策

可以理解为:以前的大模型更像聪明学生,LongCat-Flash-Thinking-2601 则在努力变成靠谱专家。

看下面这个图,不仅在智能体工具调用、智能体搜索、工具集成推理等核心任务的基准测试中斩获顶尖成绩,还在任意分布外的真实智能体场景中,实现了泛化能力的显著提升。

从训练开始就把它当 Agent 的大脑来打造:

美团构建了包含每个环境 60+ 工具的高质量环境集合,工具之间形成复杂依赖图,用来训练模型在真实工具网络里操作世界。

任务不是简单问答,而是从环境图中抽取连通子图,要求模型合理规划调用多种工具,解决复杂任务。

通过大规模、多环境的强化学习,结合异步 rollouts 与 DORA 训练框架,模型在不同环境之间迁移和泛化的能力显著提升。

这背后的目标很直接:

让模型在新工具、新场景面前依然能快速上手,降低企业在真实业务中适配新工具的成本。

02

重思考模式

LongCat-Flash-Thinking-2601 最大的卖点就是重思考模式(Heavy Thinking Mode)。

你可以把它理解成 AI 版多轮头脑风暴 + 复盘总结。

① 并行思考阶段:

模型同时启动多条推理路径,8 个大脑并行思考,就像 8 个不同风格的高手在同一时间各想各的方案。

这些路径刻意保持思路多样性,避免所有推理都走一条思维惯性路线。

② 总结归纳阶段:

模型会对这些路径进行梳理、对比、筛选与合成,提炼出更优的解法;

优化过的结果再被重新输入模型进行迭代推理,形成一个封闭的深度思考循环。

③ 额外强化学习训练:

LongCat 团队专门为这一模式设计了额外的强化学习环节,重点训练模型的总结与归纳能力。

简单说:普通模式是想一遍、给答案,重思考模式是多路并行想、来回复盘想清楚再回答。

03

试一下

比如我输入:

某基金在 2024–2026 连续三年收益率分别为 +20%、-10%、+15%。

请计算这三年的总收益率(不是简单相加),并解释为什么不能直接把百分比相加。最后,用生活中一个直观的类比帮助非理工科读者理解这个结论。

可以看到,LongCat-Flash-Thinking-2601 会分析 8 个 Thinker 对同一个Query的回答,然后给出一个最终的、最佳的回复。

再比如:

组织一个商务局,有上级领导、上上级领导、上上上级领导、有客户、有内向的技术大牛,你是产品经理,老板让你排座位 & 主持一下,你要怎么排座位?支持怎么聊?

看下 LongCat 的回答,还挺有意思的。尤其是怎么坐:

还有一个:

我是一名体制内/国企的新人。我的直属科长让我把一份文件重点突出A数据,但分管副局长(科长的上级)私下暗示我他对A数据不感兴趣,想重点看B数据。

明天就要汇报,我该怎么写这份报告?请给出具体的处理思路,并模拟一段我向科长汇报时的高情商话术。

先来看看这个 8 个 Thinker 每个给出的要点:有的说不要擅自作主、自作聪明,有的说要用学习态度和执行意识保护自己,还有的说要把对抗性选择转化为建设性补充。

下面是 LongCat 最终生成的一个内容,集众家之所长:

可能在这种人情世故的场景上,多想想总有靠谱的解法。。。

比如 LongCat 的回复就是在不越级的前提下,平衡两方需求。

再来看下一个例子:

请估算一下,如果要把太平洋的水全部换成珍珠奶茶,需要多少只奶牛产奶?请列出所有的假设数据(如太平洋体积、奶茶配比、奶牛产量等)并一步步计算。

可以看到 LongCat 自己算完一遍,还得看看自己算的和 8 个 Thinker 的为啥不一样。

比如它认为有 4 个 Thinker 回答的是合理的,但是有几个回答不合理,具体误差可能出在哪里,他也会分析一下。

03

快来体验

目前 LongCat-Flash-Thinking-2601 模型已经在 HuggingFace 和 GitHub 上开源。你也可以直接访问 longcat.chat 使用:

GitHub:https://github.com/meituan-longcat/LongCat-Flash-Thinking-2601HuggingFace:https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking-2601体验链接:https://longcat.chat/技术报告:https://github.com/meituan-longcat/LongCat-Flash-Thinking-2601/blob/main/LongCat_Flash_Thinking_2601_Technical_Report.pdf

04

点击下方卡片,关注逛逛 GitHub

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/2 13:24:10

阿里Z-Image开源利好:中小企业降本增效部署教程

阿里Z-Image开源利好:中小企业降本增效部署教程 1. 为什么Z-Image对中小企业特别友好? 你是不是也遇到过这些问题:想用AI生成商品图,但Stable Diffusion跑不动;想给营销团队配个本地化图像工具,可租GPU服…

作者头像 李华
网站建设 2026/5/2 13:13:57

WAN2.2文生视频ComfyUI工作流详解:SDXL Prompt Styler参数全解析

WAN2.2文生视频ComfyUI工作流详解:SDXL Prompt Styler参数全解析 1. 为什么这个工作流值得你花5分钟了解 你是不是也遇到过这样的问题:想用WAN2.2生成一段短视频,但每次输入提示词后效果都不稳定——画面抖动、风格跑偏、动作不连贯&#x…

作者头像 李华
网站建设 2026/5/3 10:55:39

3步构建企业级轻量Windows镜像:IT运维实战指南

3步构建企业级轻量Windows镜像:IT运维实战指南 【免费下载链接】tiny11builder Scripts to build a trimmed-down Windows 11 image. 项目地址: https://gitcode.com/GitHub_Trending/ti/tiny11builder 核心价值:企业级部署的效能革命 在企业IT架…

作者头像 李华
网站建设 2026/5/1 22:12:45

探索go2rtc:构建现代摄像头流媒体系统的技术实践

探索go2rtc:构建现代摄像头流媒体系统的技术实践 【免费下载链接】go2rtc Ultimate camera streaming application with support RTSP, RTMP, HTTP-FLV, WebRTC, MSE, HLS, MP4, MJPEG, HomeKit, FFmpeg, etc. 项目地址: https://gitcode.com/GitHub_Trending/go/…

作者头像 李华
网站建设 2026/4/29 19:39:44

YOLOv9轻量版部署实战:yolov9-s.pt模型推理全流程

YOLOv9轻量版部署实战:yolov9-s.pt模型推理全流程 你是不是也遇到过这样的问题:想快速验证一个目标检测模型的效果,却卡在环境配置上——CUDA版本不匹配、PyTorch和torchvision版本冲突、依赖包安装失败……折腾半天,连第一张图片…

作者头像 李华
网站建设 2026/5/2 19:54:26

解锁浏览器中的矢量创作自由?开源SVG编辑工具的5大突破

解锁浏览器中的矢量创作自由?开源SVG编辑工具的5大突破 【免费下载链接】svgedit Powerful SVG-Editor for your browser 项目地址: https://gitcode.com/gh_mirrors/sv/svgedit 在数字设计领域,你是否遇到过这样的困境:专业软件动辄数…

作者头像 李华