news 2026/4/22 5:21:20

137. 集群或节点配置卡在节点污染“node.cloudprovider.kubernetes.io/uninitialized”

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
137. 集群或节点配置卡在节点污染“node.cloudprovider.kubernetes.io/uninitialized”

During the provisioning of RKE2 clusters, the machines are stuck with the status 'waiting for cluster agent'. The rke2-server service is running and pods are being created, but a number of them are in a pending state due to scheduling errors.
在配置 RKE2 集群时,机器会处于“等待集群代理”状态。rke2 服务器服务正在运行,pod 正在创建,但由于调度错误,其中不少 Pod 处于待处理状态。

Example: The vSphere CPI (Cloud Provider Interface) is unable to locate the virtual machine in vSphere, which results in the node being uninitialised. In the downstream cluster, the cloud controller manager pod logs indicate this error locating the virtual machine:
示例:vSphere CPI(云服务提供商接口)无法在 vSphere 中定位虚拟机,导致节点未初始化。在下游集群中,云控制器管理器的 Pod 日志显示了该虚拟机定位的错误:

search.go:186] Did not find node node1.example.com in vc=example.com and datacenter=datacentre1 nodemanager.go:160] WhichVCandDCByNodeID failed using VM name. Err: No VM found nodemanager.go:205] shakeOutNodeIDLookup failed. Err=No VM found node_controller.go:233] error syncing 'node1.example.com: failed to get instance metadata for node node1.example.com: failed to get instance ID from cloud provider: No VM found, requeuing node_controller.go:244] "Unhandled Error" err="error syncing 'node1.example.com': failed to get instance metadata for node node1.example.com: failed to get instance ID from cloud provider: No VM found, requeuing" node_controller.go:271] Update 1 nodes status took 57.912µs.
Resolution 结局

In order to resolve this issue, validate and correct the Cloud Provider configuration for the affected cluster, as required.
为解决此问题,请根据需要验证并纠正受影响集群的云提供商配置。

In the example above, with the vSphere Cloud Provider, you would need to check the Add-on: vSphere CPI configuration for the cluster, to ensure the correct vCenter and Data Center was configured, as well as validating that VMware Tools was running successfully in the virtual machine, and its hostname was correctly configured.
在上述示例中,使用 vSphere Cloud Provider 时,你需要检查集群的 Add-on: vSphere CPI 配置,以确保正确的 vCenter 和 Data Center 配置正确,同时验证 VMware Tools 在虚拟机中是否成功运行,主机名配置正确。

Cause 病因

The node.cloudprovider.kubernetes.io/uninitialized taint is added to new nodes in clusters where a Cloud Provider is configured. This taint is removed by the CPI once it successfully queries and sets the spec.providerID on the node. If there is a problem with the CPI configuration and this cannot be successfully queried, then the node will remain in this state and fail to complete provisioning. If this is the first node in the cluster then the cluster itself will be stuck in provisioning.
node.cloudprovider.kubernetes.io/uninitialized 污染会被添加到配置云服务提供商的集群中新节点。一旦 CPI 成功查询并设置了节点上的 spec.providerID,这个污点就会被清除。如果 CPI 配置存在问题且无法成功查询,节点将保持该状态,无法完成配置。如果这是集群中的第一个节点,那么集群本身将被卡在配置中。

Additional Information 附加信息
Environment 环境
  • A Rancher-provisioned RKE2 cluster with a Cloud Provider configured
    一个由 Rancher 配置的 RKE2 集群,配置了云提供商

访问Rancher-K8S解决方案博主,企业合作伙伴 :
https://blog.csdn.net/lidw2009

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 5:19:39

自变量机器人的家庭落地计划 - 科技行者

在一个日常家庭早晨,闹钟响起,客厅一片狼藉,拖鞋不知去向、碗筷未洗、孩子书包散落、猫咪打翻了水杯……,如果此时有一个“24小时保姆”已悄然收拾妥当、甚至倒好温度适宜的水,这是否会让生活瞬间美好?然而…

作者头像 李华
网站建设 2026/4/22 5:04:09

用东华OJ的50道基础题,带你系统掌握C++核心语法与算法思想

东华OJ 50题通关指南:构建C语法与算法思维的完整训练体系 对于许多C初学者来说,最困扰的问题往往不是理解单个语法概念,而是如何将零散的知识点串联成完整的知识网络。东华OJ平台的50道基础题目恰好提供了这样一个系统化训练的机会&#xff0…

作者头像 李华
网站建设 2026/4/22 5:03:09

告别树莓派GPIO不够用?用CH347给Linux小主机低成本扩展一堆IO和总线

用CH347为Linux小主机低成本扩展IO与总线的实战指南 当你在树莓派或香橙派上开发智能家居控制器时,是否遇到过这样的窘境:需要同时连接温湿度传感器、OLED显示屏、多个继电器和按钮,却发现板载的GPIO和总线接口早已捉襟见肘?这种资…

作者头像 李华
网站建设 2026/4/22 4:59:58

使用FCM进行编码解码Python实现代码

文章目录代码整体结构第 1 部分:生成二维合成数据固定随机种子means中心位置covs形状sizes点数生成数据裁剪到[0,1]第 2 部分:初始化隶属度矩阵为什么要按列归一化?这一步的意义第 3 部分:更新聚类中心第 4 部分:计算距离&#x…

作者头像 李华
网站建设 2026/4/22 4:59:44

如何用3步实现效率突破:开源智能工具重构网盘资源获取体验

如何用3步实现效率突破:开源智能工具重构网盘资源获取体验 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 在数字化信息爆炸的时代,获取网络资源已成为日常工作和学习的必备技能。然而,面对…

作者头像 李华
网站建设 2026/4/22 4:52:38

基于鸿蒙Electron框架的碰撞效果测试与战斗系统——实战模拟

欢迎加入开源鸿蒙PC社区: https://harmonypc.csdn.net/ atomgit开源仓库地址: https://atomgit.com/feng8403000/BattleSimulator 示例效果 项目背景 在游戏开发中,碰撞检测和战斗系统是两个核心组件。碰撞检测负责检测物体之间的交互&…

作者头像 李华