news 2026/4/15 16:32:32

性能测试中关于硬件环境的测试

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
性能测试中关于硬件环境的测试

比如营销活动的服务器的部署规格:
部署规格
CPU:0.001~4 (Core)
内存:16384~16384(Mb)
6个POD

测试要点:单个pod的性能指标摸底,6Pod 集群峰值容量测试,6Pod 集群 72 小时稳定性测试,6Pod 集群容灾测试(Pod 故障场景)

用例 1:单 Pod 极限性能摸底测试
  • 用例编号:PT-MARKET-001
  • 测试目的:确认单 Pod 性能天花板,验证单 Pod 4 核 CPU/16GB 内存规格是否满足基础业务需求
  • 前置条件:1. 仅启动 1 个营销服务 Pod(暂停其余 5 个);2. Pod 资源限制生效(CPU≤4Core、内存 = 16GB);3. 依赖服务(MQ/DB)正常运行;4. 清空测试环境历史数据
  • 测试步骤:
  1. 启动监控工具,实时采集单 Pod CPU、内存使用率,接口 QPS、响应时间、错误率
  2. 梯度加压:初始并发用户数 [填写,如 50],每 5 分钟递增 [填写,如 20],直至触发资源上限(CPU 达 4Core 或内存达 16GB)或接口错误率超标
  3. 每个梯度稳定运行 3 分钟,记录对应指标数据
  4. 达到极限后,维持极限压力运行 5 分钟,观察是否崩溃、报错
  5. 停止加压,恢复空载运行 3 分钟,观察资源是否回落
  • 预期结果:
  1. 单 Pod 极限 QPS、响应时间达到业务预期值
  2. 极限压力下 CPU≤90%、内存≤80%,无触达上限,无 OOM/CPU 节流
  3. 极限压力下接口错误率≤0.1%,服务不崩溃、不重启
  4. 空载后 CPU、内存快速回落至初始水平(波动≤5%)
  • 实际结果:[测试后填写]
  • 测试结论:[通过 / 不通过]
用例 2:6Pod 集群峰值容量测试(核心业务场景)
  • 用例编号:PT-MARKET-002
  • 测试目的:验证 6 个 Pod 集群能否承接业务峰值流量,资源利用率合理且负载均匀
  • 前置条件:1. 启动 6 个营销服务 Pod,负载均衡生效;2. 所有 Pod 资源限制正常;3. 依赖服务按生产规格部署;4. 准备业务峰值流量对应的测试数据
  • 测试步骤:
  1. 启动监控工具,采集 6 个 Pod 的 CPU、内存,集群整体 QPS、响应时间、错误率
  2. 加压策略:分 3 阶段加压,每阶段稳定运行 10 分钟
    • 阶段 1:业务日常流量(预期 QPS 的 50%)
    • 阶段 2:业务高峰流量(预期 QPS 的 80%)
    • 阶段 3:业务峰值流量(100% 预期 QPS),额外预留 10% 峰值冗余加压
  3. 每个阶段记录集群指标 + 单个 Pod 指标,重点核对负载均匀性
  4. 峰值压力下维持 15 分钟,观察指标稳定性
  • 预期结果:
  1. 集群峰值 QPS、响应时间、错误率均达标(符合基准指标)
  2. 所有 Pod CPU 使用率:日常≤70%、峰值≤90%,无触达 4Core 上限
  3. 所有 Pod 内存使用率全程≤80%,无波动超标
  4. 6 个 Pod CPU / 内存使用率偏差≤20%,负载均衡有效
  5. 集群性能损耗率≤15%(6Pod 总 QPS ≥ 单 Pod 极限 QPS×6×85%)
  6. 全程服务无崩溃、无重启,依赖服务无异常
  • 实际结果:[测试后填写]
  • 测试结论:[通过 / 不通过]
用例 3:6Pod 集群 72 小时稳定性测试
  • 用例编号:PT-MARKET-003
  • 测试目的:验证集群在长时间高负载下的稳定性,排查内存泄露、资源耗尽等隐性问题
  • 前置条件:1. 6 个 Pod 正常运行,负载均衡生效;2. 监控工具支持长时间采集(如 Prometheus+Grafana);3. 压力维持业务高峰流量(预期 QPS 的 80%)
  • 测试步骤:
  1. 启动监控,开启全量指标采集(每 1 分钟记录 1 次数据)
  2. 施加业务高峰压力,持续运行 72 小时(可按需求调整为 24/48 小时)
  3. 期间每 12 小时巡检 1 次:记录集群指标、单个 Pod 资源使用、服务是否重启、错误率是否超标
  4. 72 小时后停止加压,观察资源是否正常回落
  • 预期结果:
  1. 72 小时内集群 QPS、响应时间、错误率稳定,无大幅波动(波动≤10%)
  2. 所有 Pod CPU 使用率稳定≤75%,无持续上涨
  3. 所有 Pod 内存使用率稳定≤80%,无持续上涨(无内存泄露),波动≤5%
  4. 期间无 Pod 崩溃、无服务重启,依赖服务无异常
  5. 停止加压后,CPU、内存快速回落至空载水平
  • 实际结果:[测试后填写]
  • 测试结论:[通过 / 不通过]
用例 4:6Pod 集群容灾测试(Pod 故障场景)
  • 用例编号:PT-MARKET-004
  • 测试目的:验证集群在部分 Pod 故障时,剩余 Pod 能否承接流量,保障服务高可用
  • 前置条件:1. 6 个 Pod 正常运行,施加业务高峰压力(预期 QPS 的 80%);2. 集群指标稳定达标;3. 支持手动删除 Pod(kubectl delete pod)
  • 测试步骤:
  1. 施加业务高峰压力,待集群指标稳定(运行 5 分钟),记录基准数据
  2. 故障场景 1(轻度故障):手动删除 1 个 Pod,观察集群自愈(K8s 自动重建)及指标变化,稳定运行 10 分钟
  3. 故障场景 2(中度故障):自愈完成后,再手动删除 2 个 Pod(剩余 3 个),稳定运行 10 分钟
  4. 故障场景 3(极限故障):自愈完成后,再删除 1 个 Pod(剩余 2 个),稳定运行 10 分钟
  5. 每个场景记录:集群 QPS、响应时间、错误率,剩余 Pod 资源使用率
  6. 测试结束后,恢复 6 个 Pod,验证集群指标是否回归正常
  • 预期结果:
  1. 轻度故障(剩 5Pod):集群 QPS 不下降,响应时间、错误率达标;剩余 Pod CPU≤90%、内存≤80%,负载均匀
  2. 中度故障(剩 3Pod):集群 QPS 不低于峰值的 80%,响应时间≤预期 1.2 倍,错误率≤0.3%;剩余 Pod CPU≤95%、内存≤85%,无崩溃
  3. 极限故障(剩 2Pod):服务不中断,核心接口正常响应,错误率≤1%(非核心接口可放宽)
  4. Pod 故障后,K8s 自动重建,重建后 Pod 快速接入集群,指标恢复正常
  5. 恢复 6Pod 后,集群指标回归基准水平
  • 实际结果:[测试后填写]
  • 测试结论:[通过 / 不通过]
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/11 12:31:51

昇腾 NPU 环境下 GPT-2 模型本地部署全指南(含踩坑排错)

在昇腾 Atlas 系列 AI 处理器上部署开源大模型,核心是基于torch_npu适配 PyTorch 生态,充分发挥昇腾硬件的算力优势。昇腾作为国产化 AI 算力基础设施的核心载体,凭借安全可控的技术栈,已在政务、金融、能源、交通等关键领域大规模…

作者头像 李华
网站建设 2026/4/12 9:50:08

2025最新!9款AI论文软件测评:本科生写论文痛点全解析

2025最新!9款AI论文软件测评:本科生写论文痛点全解析 2025年AI论文工具测评:为何值得一看? 随着人工智能技术的不断进步,越来越多的本科生开始依赖AI论文软件来提升写作效率。然而,面对市场上琳琅满目的工具…

作者头像 李华
网站建设 2026/4/12 20:22:50

学长亲荐10个AI论文软件,本科生毕业论文轻松搞定!

学长亲荐10个AI论文软件,本科生毕业论文轻松搞定! AI 工具如何帮你轻松应对论文写作难题 随着人工智能技术的不断进步,越来越多的 AI 工具开始进入学术领域,帮助学生和研究者高效完成论文写作任务。尤其是对于本科生而言&#xff…

作者头像 李华
网站建设 2026/4/8 17:01:32

软件缺少vcruntime140.dll文件 无法运行问题 下载修复方法

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

作者头像 李华
网站建设 2026/4/15 15:06:19

预训练 vs 微调:打造AI学霸的秘密

生活中的例子 01ChatGPT先通过海量文本预训练学会说话,再通过微调学会如何有礼貌地回答人类问题。生活中的例子 02一个通用的绘画AI(预训练),经过二次元图片集特训(微调),变成专门画动漫风格的大…

作者头像 李华