news 2026/6/13 20:52:06

Amazon CloudWatch 的系统化知识点汇总

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Amazon CloudWatch 的系统化知识点汇总

一、Amazon CloudWatch 是什么

Amazon CloudWatch 是 AWS 提供的 托管式监控与可观测性服务,用于:

  • 收集指标(Metrics)

  • 收集和分析日志(Logs)

  • 设置告警(Alarms)

  • 自动触发动作(Auto Scaling / Lambda / SNS)

关键点

  • 不需要部署任何服务器

  • 有 AWS 账号即可使用

  • AWS 负责底层基础设施

二、CloudWatch 是如何工作的

1️⃣ 集中监控(Centralized Monitoring)

一个应用通常由 多个 AWS 服务组成

单独监控每个服务 → 非常困难

CloudWatch 作为统一入口:

  • 收集

  • 聚合

  • 分析

2️⃣ 自动指标(Basic Monitoring)

很多 AWS 服务会自动、免费发送指标

默认频率:

  • 每 5 分钟 1 个数据点

  • 无需任何配置

  • 适合大多数基础场景

📌 这称为:Basic Monitoring

3️⃣ 详细监控(Detailed Monitoring)

针对 EC2

指标频率提升到:

  • 每 1 分钟

  • 更高粒度

  • 需要额外付费

用于对性能敏感的生产系统

三、CloudWatch 中的 Metrics(指标体系)

1️⃣ Metric 的基本结构

每个 Metric 都包含:

  • 时间戳(Timestamp)

  • 数值

  • 命名空间(Namespace)

  • 维度(Dimensions)

2️⃣ Namespace(命名空间)

  • 指标的“分类容器”

  • 不同服务使用不同 namespace

  • AWS/EC2

  • AWS/S3

  • AWS/RDS

不同 namespace 之间完全隔离

3️⃣ Dimension(维度)

  • 键值对(Name / Value)

  • 用于区分同一类指标中的不同资源

例如:

  • InstanceId = i-123456

  • AutoScalingGroupName = web-asg

维度 = 精确过滤指标的关键

四、自定义指标(Custom Metrics)

1️⃣ 为什么需要自定义指标

AWS 默认指标 ≠ 应用级指标
例如:

  • 页面访问量

  • 错误率

  • 业务处理量

需要应用主动上报

2️⃣ Custom Metrics 能做什么

你可以自定义并上报:

  • 页面加载时间

  • HTTP 错误率

  • 进程 / 线程数量

  • 业务处理量

3️⃣ 高分辨率自定义指标(High-resolution)

  • 1 秒 1 个数据点

  • 用于对实时性要求极高的场景

  • 成本更高

4️⃣ 上报方式

  • 使用 PutMetricData API

  • 通过 SDK / CLI / 程序代码发送

五、CloudWatch Dashboards(仪表盘)

1️⃣ Dashboard 是什么

可视化监控页面

由多个 Widget 组成:

  • 折线图

  • 数值

  • 文本说明

2️⃣ Dashboard 的能力

  • 自定义多个 Dashboard

  • 不同 Dashboard 关注不同视角

  • 支持跨 Region 指标

  • 可展示实时数据(Live Data)

3️⃣ 非 CloudWatch 可视化

可通过 GetMetricData API

将指标接入:

  • 第三方工具

  • 自定义监控系统

4️⃣ 安全控制

通过 IAM Policies

控制:

  • 谁能看

  • 谁能改

六、CloudWatch Logs(日志系统)

1️⃣ CloudWatch Logs 能做什么

  • 集中存储日志

  • 搜索 / 过滤 / 查询日志

  • 从日志生成指标(Metric Filters)

2️⃣ 支持的日志来源

  • EC2(需安装 Agent)

  • AWS Lambda(几乎零配置)

  • 其他 AWS 服务

3️⃣ EC2 日志采集方式

需要安装 CloudWatch Logs Agent,包含:

  • CLI 插件(推送日志)

  • 启动脚本

  • cron 守护进程

4️⃣ CloudWatch Logs 的三层结构(必考)

Log Event

单条日志

含:

  • 时间戳

  • 日志内容

Log Stream

  • 来自同一资源的一组日志

例如:某台 EC2

Log Group

  • 多个 Log Stream 的集合

统一:

  • 保留策略

  • 权限

结构记忆口诀:
Event → Stream → Group

七、CloudWatch Alarms(告警)

1️⃣ Alarm 的用途

  • 监控指标

  • 指标持续异常 → 触发动作

2️⃣ 创建 Alarm 需要三要素(重点)

  • Metric:监控什么

  • Threshold:多少算异常

  • Time Period:持续多久才算异常

避免因“瞬时抖动”误报

3️⃣ Alarm 的三种状态(必考)

  • OK:正常

  • ALARM:超出阈值

  • INSUFFICIENT_DATA:数据不足

4️⃣ Alarm 可触发的动作

  • EC2 动作(重启、停止)

  • Auto Scaling(扩/缩容)

  • SNS 通知(邮件 / 短信)

  • Lambda(自动修复)

八、Logs + Alarm 的高级用法(非常重要)

示例:500 错误监控

  • 应用日志写入 CloudWatch Logs

  • Metric Filter 统计 500 错误次数

创建 Alarm:

  • 5 次 / 小时

Alarm 触发:

  • SNS 通知运维

  • 或 Lambda 自动修复

日志 → 指标 → 告警 → 自动化

九、核心价值总结(一句话版)

  • CloudWatch 是 AWS 的统一监控中枢,
  • 通过 Metrics、Logs、Dashboards 和 Alarms,
  • 实现从“可见”到“告警”再到“自动修复”的完整闭环。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/12 17:30:55

基于STM32物联网技术的仓库监测安防系统设计

基于STM32物联网技术的仓库监测安防系统设计摘要随着社会经济的快速发展和物流行业的日益壮大,仓库作为商品存储和流通的重要节点,其安全问题日益受到关注。传统的仓库安防系统往往依赖人工巡检,存在效率低、响应慢、易遗漏等问题&#xff0c…

作者头像 李华
网站建设 2026/6/13 10:01:35

语音克隆防御设想:结合Fun-ASR检测合成语音的真实性

语音克隆防御设想:结合Fun-ASR检测合成语音的真实性 在金融客服电话中,一个声音与你母亲几乎一模一样的来电告诉你“我出了车祸,快打钱”;在政务热线系统里,一段流畅自然的语音成功通过声纹验证,实则来自仅…

作者头像 李华
网站建设 2026/6/13 4:51:49

语音识别伦理讨论:监控场景下技术使用的边界在哪里?

语音识别伦理讨论:监控场景下技术使用的边界在哪里? 在一座现代化办公楼里,会议室的录音设备自动启动,将每一场讨论逐字转写成文本;教室中,学生的每一次发言被系统捕捉、分析,生成“课堂参与度报…

作者头像 李华
网站建设 2026/6/9 17:24:54

CCS安装教程全面讲解:支持多版本适配指南

深入拆解CCS安装全流程:从零部署到多版本共存实战 你有没有遇到过这样的场景? 刚接手一个老旧的C2000电机控制项目,文档里写着“使用CCS v7.4开发”,而你的电脑上装的是最新的CCS v12。结果一打开工程,编译报错、外设…

作者头像 李华
网站建设 2026/6/13 13:26:54

技术速递|今年最具影响力的开源项目

作者:Lee Reilly 排版:Alan Wang 从 Appwrite 到 Zulip,Universe 2025 的开源专区汇聚了众多出色项目,充分展示了开源所能达到的广度与深度。来认识这些项目的维护者吧——如果你也希望在 2026 年加入他们,现在就可以 …

作者头像 李华
网站建设 2026/6/13 10:04:33

PiuPiu酱 1.5.7| 无敏感限制聊天,虚拟女友,永久限制,免费使用

PiuPiu酱的核心功能——包括无限聊天、永久记忆、高品质语音朗读、群聊模式等——对所有用户完全免费,无需签到,没有任何隐藏限制。我们希望打造一款真正纯粹、无负担的AI伙伴。 核心功能: 「生态兼容」:完美支持主流酒馆角色卡(T…

作者头像 李华