본문 바로가기
Cloud/Amazon Cloud

RTO/RPO 및 백업 복구 설정

by ganyga 2024. 10. 21.

고가용성 : 애플리케이션의 가동 중단 시간을 최소화

백업 : 데이터를 안전하게 유지

재해 복구 : 주요 재해 발생 후 애플리케이션 및 데이터 백업을 가져옴

 

RPO(복구 시점 목표)

- 얼마나 자주 데이터를 백업해야 합니까?

- 장애가 발생했을 때 거기서부터 어느 정도 시간 때까지 데이터를 백업하고 있어야 하는가, 데이터 백업에 대한 주기

- RPO가 1시간이라는 것은 최대 1시간까지 데이터 손실 보는 것을 인정한다는 것

- RPO가 0여야 한다는 것은 백업이 아니고 실시간 복제를 하는 것

 

RTO(복구 시간 목표)

- 애플리케이션을 얼마나 오래 사용할 수 없습니까?

- 장애 시간부터 얼만큼의 시간 만큼 내가 서비스를 복구해야 하는가, 복구 시점 목표

- DR 필요성을 감지하고 자동으로 대체 시스템을 확장하는 데 소요되는 시간

 

재해 복구에 필수적인 AWS 서비스 및 기능

- 스토리지

- 컴퓨팅

- 네트워킹

- 데이터베이스

- 배포 조직화

 

백업 및 보원

준비 단계

- 현재 시스템을 백업함

- Amazon S3에 백업을 저장함

- 어떠한 AMI를 사용할 건지?

- 백업으로부터 시스템을 어떻게 복원할 건지?

- 새로운 시스템으로 어떻게 전환할 건지?

- 배포를 어떻게 구성할 건지?

 

재해 발생 시:

- Amazon S3로부터 백업을 검색하기

- 필요한 인프라를 준비하기

- 준비된 AMI, ELB 등이 있는 Amazon EC2 인스턴스

- AWS CloudFormation을 사용해서 주요 네트워킹 배포를 자동화할지

- 백업으로부터 시스템을 복원

- 새로운 시스템으로 전환

- AWS를 가리키도록 DNS 레코드를 조정함