Amazon CloudWatch 是一种面向开发人员、系统操作员、网站可靠性工程师 (SRE) 和 IT 经理的监控和管理服务。CloudWatch 为您提供相关数据和切实见解,以监控应用程序、了解和响应系统范围的性能变化、优化资源利用率,并在统一视图中查看运营状况。CloudWatch 以日志、指标和事件的形式收集监控和运营数据,让您能够在统一视图中查看 AWS 资源以及在 AWS 和本地服务器上运行的应用程序和服务。您可以使用 CloudWatch 来设置高精度警报、并排显示日志和指标、采取自动化操作、排查问题,以及发现能够优化应用程序并确保其正常运行的见解。
Amazon CloudWatch 的入门很简单。无需预先承诺,没有最低消费限制;您只需为所用内容付费,费用将在每月月末按实际用量收取。
优势
从单一平台访问您的所有数据
现代应用程序具有分布式的特点(即在微服务架构上运行)并且会以指标、日志等形式生成大量数据。您需要有一种简单易用的方式,从这些孤立的数据来源(服务器、网络、数据库等)收集、访问和整理数据,从而有效地监控应用程序和基础设施资源。Amazon CloudWatch 让您可以从在 AWS 和本地服务器上运行的所有 AWS 资源、应用程序和服务收集指标和日志,帮助您打破数据孤岛,从而可以轻松获得整个系统的可见性。
采集自定义和精细化的 AWS 资源指标的最简单方式
使用 Amazon CloudWatch 时,监控 AWS 资源轻而易举。CloudWatch 与 Amazon EC2、Amazon DynamoDB、Amazon S3、Amazon ECS、AWS Lambda 和 Amazon API Gateway 等 70 多种 AWS 服务原生集成,可自动发布频率为 1 分钟的详细指标和粒度高达 1 秒的自定义指标。您可以使用 AWS Systems Manager 来安装 CloudWatch 代理,或者使用 CloudWatch API 轻松收集和发布此类数据并将其存储在 CloudWatch 中。
跨应用程序、基础设施和服务的可见性
在分布式堆栈中获得可见性即可关联和可视化指标和日志,从而快速确定并解决问题。使用 Amazon CloudWatch,您能够可视化 CPU 利用率和内存等关键指标。您还可以将错误等日志模式与特定指标相关联,从而快速获知具体情况,诊断问题并了解根本原因。
降低总体拥有成本
Amazon CloudWatch 使您能够设置高精度警报和采取自动化操作。这意味着将会释放重要资源,集中用于增加业务价值。例如,您可以获得有关 Amazon EC2 实例的警报,并设置 Auto Scaling 来添加或删除实例。您还可以执行自动响应来检测和关闭未使用的 EC2 资源,从而减少超额计费情况并提高资源优化率。
优化应用程序和运营资源
您需要统一的运营视图、实时的粒度数据和历史参考内容,以便优化性能和资源利用率。使用 Amazon CloudWatch,您可以实现粒度为 1 秒的增强监控,并将指标存储和保留长达 15 个月。您还可以利用指标数学等原生 CloudWatch 功能来计算指标数据。例如,您可以汇总整个 EC2 实例队列的使用数据,以获得运营和利用率见解。
从日志中获取可行动的见解
借助 Amazon CloudWatch Logs Insights,您可以即时了解、分析和直观显示日志,从而轻松排查运营问题。使用 Logs Insights,您仅需为运行的查询付费。Logs Insights 可以根据您的日志数量和查询复杂度进行扩展,从而在几秒钟内提供答案。此外,您还可以发布基于日志的指标、创建警报,在 CloudWatch 控制面板中将日志和指标关联起来,从而获得完全的运营可见性。
工作原理
使用案例
基础设施监控和问题排查
监控关键指标和日志,可视化显示应用程序和基础设施堆栈,创建警报,将指标和日志关联起来以了解和解决性能问题的根本原因。
资源优化
启用 CloudWatch Alarms 以通过 Auto Scaling 实现容量和资源规划的自动化。
应用程序监控
触发自动化的 CloudWatch Alarms 和 Lambda 工作流程以提高客户体验。
日志分析
探索、分析并立即可视化显示日志,以解决运营问题和提高应用程序性能。
相关内容
作者:Helen Lin
2018 年 10 月 15 日
作者:Stephen McCurry
2018 年 9 月 25 日
作者:Jeff Barr
2017 年 12 月 14 日
了解有关 Amazon CloudWatch 的更多信息