Amazon CloudWatch Metrics
- AWS의 모든 서비스 메트릭 제공
- 모니터링 제공
- 네임스페이스 하위에 속함 (EC2, RDS 등 서비스 단위로 나뉨)
- 각 메트릭은 최대 30개의 디멘션(속성)을 가질 수 있음
- 모든 메트릭은 타임스탬프 값을 가짐
- 메트릭에 대한 대시보드 생성 가능
Amazon CloudWatch Streams
- 메트릭을 준 실시간으로 전송 가능
- Firehose를 사용해서 전달 가능
- 3rd party 서비스로 전달 가능
- 스트림에 필터 적용 가능
CloudWatch logs
- 로그 그룹: 임의로 지정하는 이름, 주로 서비스 이름 기재 (폴더라고 생각하면 됨)
- 로그스트림: 앱, 로그파일, 컨테이너의 인스턴스 (파일이라고 생각하면 됨)
- 로그 만료 정책 설정 가능
- 로그 암호화 가능 (KMS, 사용자 정의 암호화)
- S3, Kinesis, Lambda, OpenSearch 등으로 전송 가능
로그 수집처
- SDK, CloudWatch Logs Agent, CloudWatch Unified agent
- ECS 컨테이너
- 람다 함수 로그
- VPC Flow logs
- API Gateway
- 필터 기반 CloudTrail
- Route53
- Elastic Beanstalk
S3로 내보내기
- 로그가 최대 12시간 이내에 내보내기 가능한 상태가 됨
- createExportTask API로 가능
- Log Subscription 사용.
- 아카이빙을 위한 용도이므로 실시간 서비스가 아님
CloudWatch Logs Insights
- 로그에 저장된 로그 데이터를 검색하고 분석
- 목적에 맞춘 사전 정의 쿼리 언어 지원 (대시보드에서 쿼리 추가)
- 여러 계정의 여러 로그 그룹 쿼리 가능
- 실시간 서비스가 아닌 그냥 쿼리 엔진
Logs Subscription
- 로그 이벤트를 실시간으로 수집
- 로그의 처리, 분석을 위해 사용
- Kinesis Data Streams, Data Firehose, Lambda에 데이터 전달
- 로그 목적지에 대한 필터링 가능
Agent
- 가상 서버를 위해 사용 (EC2, 온프레미스 Linux 등)
- 오래된 버전
- CloudWatch Logs에만 전송 가능 (로그만 수집 가능)
Unified Agent
- 추가적인 시스템 레벨 메트릭 수집
- CPU (기본으로 사용 가능)
- Disk (기본으로 사용 가능)
- Network (기본으로 사용 가능)
- RAM
- Netstat
- Process
- Swap space 등
- 로그를 CloudWatch logs에 전송
- SSM parameter store를 기반으로 중앙화된 관리 가능
CloudWatch Alarms
- 메트릭에 대한 알림 전송을 위해 사용
- OK(평상시), INSUFFICIENT_DATA(데이터 불충분), ALARM(임계를 넘어서 알림 보냄) 상태가 있다.
- 초단위 이상의 데이터에 대해 평가 가능
- [10, 60]초에 대해 알람 해소 메트릭 설정 가능
- 알람을 Amazon SNS로 전달 가능
- Auto Scaling 트리거 가능
- EC2 인스턴스의 상태에 따른 알람 발생 가능
- 여러 개 메트릭 알람을 묶어서 트리거링 가능
Container Insights
- container의 메트릭, 로그를 수집 및 통합
- EKS, Kubernetes에서는 CloudWatch Agent의 컨테이너 버전을 통해서 컨테이너를 탐색
- EKS, ECS, k8s가 운영되는 EC2, Fargate 등에서 사용 가능
Lambda Insights
- 시스템 레벨 메트릭을 수집, 통합하고 요약
- cold start, worker shutdown 같은 특이 이벤트를 수집, 통합, 요약
- 람다 단에서 동작
Contributer Insights
- 로그 데이터를 분석하고 기여도에 따른 시게열 데이터를 생성
- 최근 n개의 기여도에 따른 데이터를 보여줌
- 전체 수, 사용량을 같이 보여줌
- AWS 기반의 모든 로그와 같이 동작
- 직접 룰을 생성하고 새로 생성되는 서비스에도 동일하게 적용 가능
- 사전 제작된 룰도 제공
Application Insights
- 잠재적인 위험을 감지할 수 있도록 자동화된 대시보드 제공
- 미리 기술 설정 필요 (Java를 사용한다 등..)
- EC2 인스턴스에서만 사용 가능
- SageMaker 기반
- 앱 상태의 가용성을 올리고 트러블 슈팅에 도움이 됨
- 검색과 alert는 EventBridge와 SSM OpsCenter로 전송됨
AWS CloudTrail
- AWS 계정에 대한 거버넌스, 컴플라이언스, 감사 제공
- 기본으로 사용 설정됨
- AWS 계정이 생성한 이벤트와 API 호출 이력을 가져올 수 있음
- 이벤트는 Console에서 조작, SDK 호출, CLI 명령어, AWS에서 호출 등등 모두 기록
- CloudGrail 로그를 CloudWatch Logs, S3에 넣을 수 있다.
- 모든 리전에 적용 가능, 단일 리전도 가능
이벤트
- 관리 이벤트
- AWS 계정이 실행한 모든 리소스에 대한 활동
- 기본적으로 모든 관리 이벤트 기록
- 읽기, 쓰기 구분 가능
- 데이터 이벤트
- 별도 설정 필요
- S3 오브젝트 수준의 활동 감시 가능
- 람다 함수 실행 감시 가능
Insights
- 일반적이지 않은 액션의 발생 감지 (ex. 적절하지 않은 프로비저닝)
- 기본 관리 이벤트를 분석하고 기준 생성 (기준에서 벗어나면 일반적이지 않은 것)
- 지속적으로 쓰기 이벤트 분석
이벤트 보관
- 90일간 보존
- 90일 이상 보관하려면 S3에 저장 후 Athena로 분석하면 됨
AWS Config
- 리소스에 대한 컴플라이언스를 기록하거나 이력을 관리
- 설정을 저장하고 변경한 내용을 기록
- S3, SG의 특정 설정, ALB 설정 변화 등 셋팅이 바뀌는 것을 관측하여 쉽게 알려줌
- ex. S3를 감시하고 있다가 사용자가 S3 중 public으로 배포된 오브젝트가 있나? 라고 질문하면 대답해 줌
- 모든 변경에 대해 SNS를 통해 alert 받을 수 있음
- 리전 단위 서비스
- 리전간, 계정간 데이터 통합해서 사용은 가능
- S3에 백업 가능
Config Rules
- 75개 가량의 기본 룰 사용 가능
- 커스텀 룰도 만들 수 있음 (람다 정의로)
- 룰을 평가하여 부합하면 동작을 트리거 시킬 수 있다.
- 근데 액션을 막지는 않음
- No Free Tier
'자격증 > SAA' 카테고리의 다른 글
[SAA] 데이터 분석 (0) | 2024.12.21 |
---|---|
[SAA] DB 총정리 (0) | 2024.12.21 |
[SAA] 서버리스 (0) | 2024.12.11 |
[SAA] Integration (0) | 2024.12.10 |
[SAA] Storage with On-premise (0) | 2024.12.08 |