原文 https://openrouter.ai/state-of-ai
Anthropic 的 Claude高度集中在编程与技术用途,两者合计超过其使用量的 80%。角色扮演和通用问答只占很小一部分。这证实了 Claude 作为针对复杂推理、编码和结构化任务优化的模型定位;开发者和企业似乎主要将 Claude 用作编码助手和问题解决者。
Google 的模型使用更为多样化。我们看到翻译、科学、技术以及一些通用知识占据了显著部分。例如,约 5% 的 Google 使用量是法律或政策内容,另有约 10% 与科学相关。这可能暗示了 Gemini 广泛的训练重点。与其他公司相比,Google 的编程份额相对较少,并且在 2025 年底实际上有所下降(降至约 18%),但拥有更广泛的类别尾部。这表明 Google 的模型更多地被用作通用信息引擎。
xAI 的使用特征与其他提供商截然不同。在大部分观察期内,使用量绝大部分集中在编程,经常超过所有 token 的百分之八十。直到 11 月底,分布才开始拓宽,在技术、角色扮演和学术领域有明显增长。这种急剧转变与 xAI 的模型通过特定消费应用免费分发的时间相吻合,这可能引入了大量非开发者流量。其结果是一个混合的使用构成:早期以开发者为核心的基数,加上一波突发的通用参与浪潮。这表明 xAI 的采用路径既受到技术用户的影响,也受到与促销可用性相关的偶发性激增的塑造。
OpenAI 的使用特征在 2025 年间发生了显著变化。年初,科学任务占所有 OpenAI token 的一半以上;到 2025 年底,这一份额已降至 15% 以下。与此同时,编程和技术相关使用现在合计占总使用量的一半以上(各占 29%),反映出其更深地融入了开发者工作流、生产力工具和专业应用。OpenAI 的使用构成现在介于 Anthropic 高度集中的特征与 Google 更分散的分布之间,表明其拥有广泛的实用性基础,但越来越向高价值、结构化的任务倾斜。
DeepSeek 和 Qwen的使用模式与之前讨论的其他模型系列有很大不同。DeepSeek 的 token 分布以角色扮演、休闲聊天和娱乐导向的交互为主,通常占其总使用量的三分之二以上。只有一小部分活动属于编程或科学等结构化任务。这种模式反映了 DeepSeek 强大的消费端导向及其作为高参与度对话模型的定位。值得注意的是,DeepSeek 在夏末显示编程相关使用量有适度但稳定的增长,表明在轻量级开发工作流中正逐步被采用。
相比之下,Qwen呈现出几乎相反的特征。在整个所示期间,编程始终占所有 token 的 40-60%,表明其明确侧重于技术和开发者任务。与 Anthropic 更稳定、以工程为主的构成相比,Qwen 在相邻类别(如科学、技术和角色扮演)中表现出更高的波动性。这些周际变化意味着其用户群体具有异质性,且在应用用例上迭代迅速。9 月和 10 月期间角色扮演使用量的显著上升,随后在 11 月收缩,暗示了用户行为的演变或下游应用路由的调整。