news 2026/7/2 2:44:42

黄仁勋口中的“物理AI”时代已来,Kimi打响第一枪

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
黄仁勋口中的“物理AI”时代已来,Kimi打响第一枪

2026年,AI领域的第一场震撼是Kimi给的。1月27日,Kimi发布了全新一代旗舰模型K2.5, 这是目前最强基座模型,它最大的特点是 “All in One”,同时支持视觉和文本输入、深度思考和快速问答模式,以及对话和Agent 任务模式。K2.5在Agent、代码、视觉理解等方面取得开源SOTA的表现, 强悍的模型能力领先GPT、Gemini等一众闭源模型。

在1月28日Artificial Analysis最新公布的榜单中,Kimi K2.5 全球开源第一,总排名第五。

在大模型竞技场LMArena榜单中,Kimi K2.5 代码能力全球开源第一,总榜排名前三,仅次于Claude和Gemini。

最令我印象深刻的是,K2.5达到了大师级别的编程美学功力,以及对图片和视频的十分精准的理解。从全新一代旗舰模型 Kimi K2.5身上,我似乎看到了大模型未来的样子。


01

“物理AI”时代,模型从“虚拟”走向“现实”

在CES 2026展会上,英伟达创始人黄仁勋提出了“物理AI”的概念,他认为AI正从虚拟数字空间走向真实的物理世界。模型不再只是生成内容,还必须能够在物理世界中完成感知、理解、推理,并最终执行复杂任务。AI学会理解物理规律,从“能说会道”迈向“能走能干”,黄仁勋多次强调“物理AI”与机器人技术将开启新一轮工业革命。他将AI的演进分为四个阶段:感知AI、生成AI、代理AI、物理AI,并宣布“物理AI”的“ChatGPT时刻”已经到来。

这跟Kimi对于大模型的理解出奇的一致,全新的K2.5不仅能读懂文字,更能看懂世界(Vision),图片和视频等多模态语料对于Kimi来说,已经不再是外挂插件,而是原生具备的视觉能力,对图片和视频的理解就像文字一样自然,这是模型实现“物理AI”的基础。思考模式(Thinking Mode)赋予了模型超强推理能力,快速模式(Non-think Mode)则是智能与效率的最佳平衡,就像人类大脑的“慢思考”与“快思考”在搭配工作一样。

Kimi实现“物理AI”的重要一步就是Agent,从“生成内容”到“动手干活”。K2.5的Agent模式最大的亮点是“Agent集群”,当处理长时间或复杂任务时,能够自动召唤出100个Agent分身、并行1500个任务,将“串行”任务变成“并行”任务,提升任务的执行效率。比如同时调研100家上市公司、下载并分析50篇论文。这意味着AI学会了像人类一样进行社会分工,从“个体智力”进化成为“群体智力”,有能力帮助人类一起创造文明。

这已经接近了OpenAI创始人CEO Sam Altman所说的“AGI发展五个阶段”中的第四个:创新(Innovators),AI真正参与到拓展人类文明的各项研究与创新任务当中。


02

Kimi K2.5,重新定义大模型

K2.5模型极具特色的几个能力,包括:Agent 集群、Kimi Code 、Kimi Office Agent。

如上文提到的,Agent 集群具备了组织级别的协作能力,对企业来说“人类员工+数字员工”的组织模式将成为常态。

Kimi Code是自研的基于Terminal的Coding Agent,完全开源,可本地部署,基于Python开发,支持二次修改。在开发者场景下,大量的token是 input cache hit,能力对齐顶尖闭源模型的同时,成本进一步降低。

Kimi Office Agent,一句话概括:Office领域的Cursor。手搓文档的时代过去了,它就是一个专家级的办公搭子。

关于K2.5的技术架构、参数规模、榜单情况等,大家可以移步到Kimi的官网进行了解。


03

最强基座模型,带来颠覆性体验

聊了这么多K2.5的模型能力,究竟实际上手的产品体验又如何呢?下面跟随K哥实测。

1)所见即所得的编程“黑魔法”

K2.5的编程交互方式不再只是输入文字需求,现在Kimi能够看图写应用,你只需要上传一张设计图或应用截图,甚至还可以是一个100M以内的视频,Kimi 就能看懂你的意图,像素级复刻出一个可交互的网页。

我上传了一张Coldplay乐队的专辑《Yellow》封面图,让Kimi参考这个风格,制作一个科技公司的网页。

神奇的事情发生了,Kimi能够看懂它的设计风格,然后开始根据对风格的理解设计网页。

于是我得到了一个设计水准达到了专业级别的网页作品,K2.5将市面上的AI编程工具远远甩出一个身位,断层式领先。

再上点难度,让Kimi参考一个风格复杂一些的设计,比如Def Leppard乐队的《Hysteria》专辑封面。提示词是:

根据附件Def Leppard乐队的专辑《Hysteria》的设计风格,设计一个潮牌店页面。

Kimi依旧表现稳定,识别风格、计划任务、开始执行,效果相当惊艳。在没体验过K2.5以前,你告诉我这是AI写的网页,我是不信的。

2)Agent学会了“打群架”

下面的任务,就不让Agent单打独斗了,切换到“Agent集群”模式,任务很简单:

请五个风格截然不同的知名艺术家或IP设计师,为我设计5个系列、每个系列5张的马年主题微信头像,我希望风格各异

理解完任务以后,Kimi采用草间弥生、村上隆、宫崎骏、毕加索等五位大师的风格,进行图片设计。

一口气生成了25张大师风格的头像,每张深得大师的设计精髓,我都非常喜欢。

接下来,再来一场辩论,Kimi帮我找20个各领域专家进行研讨,确保我的公司做大做强,成为世界500强。

Kimi立刻为我召集了20个专家,把任务分派给20个Agent从多维度进行研讨。

最后,生成一份完整方案,包含战略地图、关键行动和里程碑、风险与应对策略。

<< 滑动查看下一张图片 >>

2026年将是“物理AI”元年,黄仁勋画的饼,Kimi把它实现了。K2.5的发布,使得AI能够像人类一样观察世界、感知美学,并产生团队协作的能力。这标志着“物理AI”的“GPT时刻”已经到来,Kimi打响了第一枪,但真正的震荡才刚刚开始。接下来,在越来越多的企业里,“人类员工+Agent”的协作场景就像今天用电脑和手机办公一样稀松平常。

正如乔布斯所说,我们正站在科技与人文的十字路口,伟大的产品往往诞生在这里。“物理AI”的时代已经到来,而Kimi,站在了时代的最前沿。这一次,中国AI不是追赶者,而是定义者。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/29 22:45:14

【计算机毕业设计案例】基于springboot的智慧酒店业务协同运营平台 酒店管理系统(程序+文档+讲解+定制)

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

作者头像 李华
网站建设 2026/6/17 10:16:15

大数据领域数据产品的政府政务应用实践与挑战

大数据领域数据产品的政府政务应用实践与挑战关键词&#xff1a;政务大数据、数据产品、数字政府、数据治理、数据安全、智慧政务、数据共享摘要&#xff1a;本文以政务服务数字化转型为背景&#xff0c;结合实际案例&#xff0c;系统解析大数据领域数据产品在政府政务中的应用…

作者头像 李华
网站建设 2026/6/21 15:58:44

proctexe.ocx文件丢失找不到问题 免费下载方法分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况&#xff0c;由于很多常用软件都是采用 Microsoft Visual Studio 编写的&#xff0c;所以这类软件的运行需要依赖微软Visual C运行库&#xff0c;比如像 QQ、迅雷、Adobe 软件等等&#xff0c;如果没有安装VC运行库或者安装…

作者头像 李华
网站建设 2026/6/29 10:25:09

LLM填槽全解析 - 大模型如何理解并提取用户意图

LLM填槽是基于大语言模型的槽位填充技术&#xff0c;能从用户自然语言输入中提取预定义槽位信息&#xff0c;相比传统方法具有少样本/零样本学习、强语义理解、复杂场景适配等优势。实现方法包括零样本填槽、少样本填槽和结构化输出填槽&#xff0c;广泛应用于任务型对话系统、…

作者头像 李华
网站建设 2026/6/29 22:36:17

程序员如何抓住AI大模型风口?收藏这篇入门指南,薪资暴涨150%

AI大模型应用开发正处于上升期&#xff0c;薪资溢价明显。大模型是趋势而非泡沫&#xff0c;应用侧机会广阔。目前处于起步阶段&#xff0c;行业格局未定&#xff0c;正是入场良机。AI相关岗位扩招&#xff0c;薪资逆势上涨150%。建议程序员主动了解AI内容&#xff0c;提前布局…

作者头像 李华