사전 예방적 모니터링, 문제 해결, 데이터 기반 인사이트를 통해 AWS 리소스 성능 및 가용성을 최적화하여 원활하고 효율적이며 안전한 클라우드 운영을 지원합니다.
데이터를 표면화하여 문제의 근본 원인을 신속하게 진단함으로써 평균 해결 시간(MTTR)을 단축할 수 있습니다.
컨테이너와 서버리스 서비스 전반의 엔드 투 엔드 관찰성 및 분석을 통합하여 서비스 전반에서 번거로운 태깅과 이벤트 상관 관계를 제거할 수 있습니다.
컨테이너와 서버리스 워크로드를 모니터링하고 문제를 해결하여 복원력과 효율성을 향상할 수 있습니다. 예를 들어 CloudWatch의 AI 및 ML 기반 기능을 활용하여 자연어를 사용해 로그와 지표를 쿼리하고, 패턴을 분석하고, 이상 징후를 감지하며, CloudWatch 로그에서 민감한 데이터를 자동으로 마스킹할 수 있습니다.
Amazon Bedrock, Amazon SageMaker 및 Amazon CloudWatch의 성능을 활용하여 생성형 AI 리소스의 성능을 효과적으로 모니터링하고 최적화할 수 있습니다. CloudWatch Container Insights를 사용하면 Amazon EKS 클러스터에서 실행되는 NVIDIA GPU, Trainium 및 Inferentia 액셀러레이터, EFA 네트워크 어댑터, SageMaker HyperPod에 대한 주요 상태 지표를 자동으로 검색하고 모니터링하여 리소스 사용률, 가용성, 지연 시간에 대한 가시성을 제공할 수 있습니다.
CloudWatch Application Signals를 사용해 실행 기간, 오류, 스로틀과 같은 주요 운영 지표를 모니터링하여 서버리스 애플리케이션의 성능에 대한 심층적인 인사이트를 얻을 수 있습니다. CloudWatch Lambda Insights를 통해 즉시 사용 가능한 큐레이팅 대시보드에서 CPU, 메모리 및 네트워크 지표와 같은 주요 상태 지표를 모니터링하고, CloudWatch Logs Insights로 로그 데이터와 분산 추적을 분석하여 잠재적인 병목 현상을 식별할 수 있습니다. 이러한 CloudWatch 기능을 사용하면 서버리스 아키텍처를 최적화하여 비용을 줄이고 효율성을 높일 수 있습니다.
CloudWatch Application Signals를 사용하면 주요 애플리케이션 지표를 쉽게 모니터링하고 컨테이너에서 실행되는 애플리케이션의 성능에 대한 인사이트를 쉽게 얻을 수 있습니다. 비즈니스 목표를 SLO로 변환하여 핵심 성과 지표(KPI)를 기준으로 성과를 추적할 수 있습니다. CloudWatch Application Signals는 CloudWatch Container Insights와 함께 작동하여 Amazon EKS 및 Amazon ECS 리소스에 대한 상태 및 성능 지표를 제공함으로써 애플리케이션에 대한 엔드 투 엔드 관찰성을 지원합니다.
애플리케이션 개발자와 데이터베이스 관리자(DBA)는 CloudWatch Database Insights의 포괄적인 데이터베이스 텔레메트리 대시보드에 액세스하여 데이터베이스 클러스터(예: Aurora MySQL 및 PostgreSQL)의 속도 저하와 애플리케이션 성능에 영향을 미치는 문제의 상관관계를 파악할 수 있습니다. 이를 통해 데이터베이스 문제를 신속하게 해결하고 궁극적으로 더 나은 최종 사용자 경험을 제공할 수 있습니다.