news 2026/5/10 1:04:40

全球大模型能力排名榜单

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
全球大模型能力排名榜单

🌐 全球大模型能力排名榜单

2026年5月 · 综合 Intelligence Index · GPQA Diamond · 代码 · 推理
数据来源:Artificial Analysis · LLM Stats · Vellum AI


🟣 S 梯队 — 顶尖前沿

排名模型开发商综合指数GPQA开源擅长领域
🥇 1GPT-5.5 (xhigh)OpenAI6093%综合、代码、推理
🥈 2GPT-5.5 (high)OpenAI5992%综合、多模态
🥉 3Claude Opus 4.7(推理增强)Anthropic5792%推理、写作、代码
4Gemini 3.1 Pro PreviewGoogle5791%代码、多模态
5Claude Mythos PreviewAnthropic5695% ★推理全球第一

★ Claude Mythos Preview 的 GPQA Diamond 得分 95%,为当前全球最高。


🟢 A 梯队 — 强力竞争者

排名模型开发商综合指数GPQA开源擅长领域
6Grok 4xAI5589%综合、速度
7Kimi K2.6月之暗面5491%开源第一、推理
8GLM-5智谱AI5387%中文、代码
NEW9DeepSeek V4-Pro深度求索5390.1%代码、性价比极高
10DeepSeek V3.2深度求索5286%开源、性价比

💡 DeepSeek V4-Pro:2026年4月24日发布,1.6T 参数 / 49B 激活,支持 100万 token 上下文,MIT 开源,定价仅 $3.48/M tokens,比 GPT-5.5 便宜约8 倍


🟡 B 梯队 — 高效主力

排名模型开发商综合指数GPQA开源擅长领域
11Claude Sonnet 4.6Anthropic5184%效率、写作
12Gemini 3.1 FlashGoogle4982%速度、性价比
13GPT-5 (standard)OpenAI4881%综合
14DeepSeek V4-Flash深度求索4783%速度、极低成本
15GLM-4.7 Thinking智谱AI4783%开源代码
16Llama 4 MaverickMeta4678%开源多模态
17Qwen3-235B (MoE)阿里巴巴4579%中文开源

⚪ C 梯队 — 实用选择

排名模型开发商综合指数GPQA开源擅长领域
18DeepSeek R1深度求索4476%推理、开源
19Mistral Large 3Mistral4172%欧洲、开源
20GPT-4oOpenAI3867%多模态经典
21Llama 3.3 70BMeta3458%本地部署

📌 关键结论

维度最强模型
综合能力第一GPT-5.5 (xhigh) · 指数 60
推理能力第一Claude Mythos Preview · GPQA 95%
开源综合第一Kimi K2.6 · 指数 54
性价比之王DeepSeek V4-Pro · $3.48/M tokens
国产最强闭源GLM-5 · 指数 53
本地部署推荐Llama 3.3 70B / DeepSeek V4-Flash

说明:综合指数基于 Artificial Analysis Intelligence Index,融合 GPQA Diamond(博士级推理)、SWE-Bench(代码)、AIME 2025(数学)、MMLU-Pro(知识)等多项基准。排名为预览版数据,仅供参考,实际表现因任务类型而异。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 1:03:42

命令行AI创意工具melies-cli:为开发者和AI代理打造高效视觉生成工作流

1. 项目概述:一个为AI代理和创作者设计的命令行创意工具箱 如果你和我一样,每天都在命令行里敲敲打打,同时又需要快速生成高质量的视觉内容——无论是为项目做个演示图,还是为社交媒体设计个吸引眼球的封面,那你肯定遇…

作者头像 李华
网站建设 2026/5/10 1:00:14

OpenClaw 用户如何快速配置 Taotoken 聚合端点实现多模型调用

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 OpenClaw 用户如何快速配置 Taotoken 聚合端点实现多模型调用 对于已经在使用 OpenClaw 框架的开发者而言,接入新的模型…

作者头像 李华
网站建设 2026/5/10 0:59:40

ThinkPad风扇控制革命:如何用TPFanCtrl2告别过热与噪音困扰

ThinkPad风扇控制革命:如何用TPFanCtrl2告别过热与噪音困扰 【免费下载链接】TPFanCtrl2 ThinkPad Fan Control 2 (Dual Fan) for Windows 10 and 11 项目地址: https://gitcode.com/gh_mirrors/tp/TPFanCtrl2 在ThinkPad用户群体中,风扇控制一直…

作者头像 李华
网站建设 2026/5/10 0:52:14

AI赋能宠物纪念册:Gemini3.1Pro的情感文案术

在 2026 年,AI 的应用场景已经从“写文案、做海报、生成代码”扩展到更细分、更情绪化也更需要边界感的领域。比如宠物殡葬、生命纪念、情感告别、个性化内容定制等场景,过去往往依赖人工经验和手工整理,现在则可以借助 Gemini 3.1 Pro 先完成…

作者头像 李华
网站建设 2026/5/10 0:52:00

Deno终端交互开发实战:基于ANSI转义序列构建现代化CLI应用

1. 项目概述与核心价值最近在捣鼓一个终端应用,需要实现一些花里胡哨的交互效果,比如彩色文字、光标定位、鼠标支持什么的。这让我想起了那些老派的命令行工具,它们是怎么在纯文本界面里玩出花来的?答案就是ANSI 转义序列。这玩意…

作者头像 李华
网站建设 2026/5/10 0:46:21

CANN/sip Nrm2向量范数算子

Nrm2 【免费下载链接】sip 本项目是CANN提供的一款高效、可靠的高性能信号处理算子加速库,基于华为Ascend AI处理器,专门为信号处理领域而设计。 项目地址: https://gitcode.com/cann/sip 产品支持情况 产品是否支持Atlas 200I/500 A2 推理产品A…

作者头像 李华