본문 바로가기
정보관리기술사_개념/경영정보

DRP

by 두유_ 2024. 5. 27.

출제정보

토픽 이름 () DRP
분류 MG > BCP > DRP
키워드(암기) Disaster Recovery Plan, 정기/비정기 훈련
BCP, BCM, DRP, BIA
DRS 문서: DRS구성도, 운영절차서
복구계획서: 시스템복구, 업무복구, 비상연락체계
훈련계획서: 복구이동절차, 시나리오, 평가 및 보완
정기/비정기 모의훈련
체크리스트
암기법(해당경우) 관리방안 비모체

 

기출문제

번호 문제 회차
1 연거래 10조원 전자상거래 서비스의 재해 복구를 위한 DRP 특징, 개념도, DRP작성 절차에 대해 상세히 설명하시오. 합숙_2015.07.응용.Day2
2 1-10.DRP(Disaster Recovery Plan)의 현행화를 위한 테스트의 종류를 설명하시오. 합숙_2013.01.공통.4일차
3 자연재해 및 인재에 따른 사회적 피해가 증가하고 있으며 이러한 재난 재해의 신속한 대응을 위한 사업영속성계획(Business Continuity Planning)활동의 중요성이 부각되고 있다. 다음 사항에 대해서 기술하시오.
. BCP DRP(Disaster Recovery Planning)의 비교를 통한 BCP의 개념
. BCP수립단계 및 활동
. BCP관련 표준 및 ISO27001의 사업연속성관리 통제항목
모의_2014.07.관리.4교시

 

I. 비즈니스 연속성 보장을 위한 체계적인 재해복구계획, DRP 개요

. DRP(Disaster Recovery Planning) 정의

- 재해 발생시 정해진 절차대로 혼선 없이 업무복구 순서에 따라 체계적으로 복구할 수 있도록 수립한 절차와 문서의 집합

- IT 인프라와 데이터의 복구를 위한 체계적인 절차와 프로세스를 포함하여 조직의 비즈니스 연속성을 보장하는 중요한 문서

 

. DRP 필요성

구분 설명
업무 복구 순서 결정 - 데이터 손실에 따른 직접적인 손실비용
- 법규나 규정에 의한 법률적인 책임비용
복구 R&R 부여

- 복구 역할과 책임(R&R, Roles and Responsibilities)의 명확한 부여
- 이는 재해 발생 시 혼란을 최소화하고 신속하고 효율적인 대응을 가능하게 함
- 업무중단에 따른 기회손실비용 : 조직이 정상적으로 운영될 경우 발생할 수 있었던 수익이 중단으로 인해 실현되지 못하는 비용
- 직원의 휴무로 인한 인건비 손실비용 : 업무 중단으로 인해 직원들이 정상적으로 근무하지 못해 발생하는 비용
- 기회손실비용은 매출 손실, 시장 신뢰도 손실, 계약 위반 비용 및 기타 기회비용을 포함하며, 인건비 손실비용은 급여 비용, 복리후생 비용, 생산성 손실 및 교육 및 재훈련 비용을 포함
- 이러한 비용을 최소화하기 위해 조직은 DRP를 체계적으로 수립하고, 정기적인 훈련과 검토를 통해 준비태세를 유지해야함
기타 손실비용 - 투자 장비들이 원래의 목적을 이루지 못함으로 인한 투자 상실비용
- 기업의 이미지 하락에 의한 손실비용
- 감독기관의 감독강화에 의한 감사비용

 

- 조직이 예상치 못한 재난이나 중단 상황에서도 중요한 비즈니스 기능을 지속할 수 있도록 하는 활동을 의미
- 이를 위해 조직은 체계적인 재해복구계획(Disaster Recovery Plan, DRP)을 수립하고 실행해야 함
- DRP는 IT 시스템과 데이터를 복구하고 비즈니스 운영의 중단을 최소화하기 위한 절차와 프로세스를 포함

1. 목표 설정

  • 비즈니스 영향 분석(Business Impact Analysis, BIA): 비즈니스 중단이 조직에 미치는 영향을 평가하고 복구 우선순위를 설정
  • 복구 목표:
    • RPO (Recovery Point Objective): 허용할 수 있는 데이터 손실의 최대 한계 시간.
    • RTO (Recovery Time Objective): 시스템이나 서비스가 복구되기까지의 최대 허용 시간.

2. 재해 유형 및 위험 평가

  • 재해 유형 식별: 자연재해(지진, 홍수, 화재 등), 인재(해킹, 테러, 내부자 위협), 기술적 문제(서버 고장, 네트워크 장애) 등을 고려합니다.
  • 위험 평가: 각 재해의 발생 가능성과 비즈니스에 미치는 영향을 분석하여 우선순위를 정합니다.

3. 재해복구 전략 개발

  • 데이터 백업: 정기적인 데이터 백업 및 오프사이트(원격지) 저장소나 클라우드 백업을 활용하여 데이터 손실을 최소화
  • 복구 사이트 준비: 주요 시스템 장애 시 대체할 수 있는 복구 사이트를 준비
    • 핫 사이트(Hot Site): 즉시 사용 가능한 복구 사이트.
    • 웜 사이트(Warm Site): 단시간 내에 가동 가능한 복구 사이트.
    • 콜드 사이트(Cold Site): 필요시 시스템을 설치하여 사용할 수 있는 복구 사이트.
  • 시스템 복구 절차 문서화: 주요 IT 시스템과 애플리케이션의 복구 절차를 상세히 문서화

4. DRP 문서화 및 유지보수

  • 재해복구계획 문서화: 모든 절차, 프로세스, 연락처 정보 등을 포함한 DRP를 작성하고 주기적으로 갱신
  • 연락처 목록: 비상시 연락해야 할 주요 담당자의 연락처 정보를 포함

5. 교육 및 훈련

  • 직원 교육: 모든 직원이 DRP의 중요성을 이해하고 자신의 역할과 책임을 인식하도록 교육
  • 모의 훈련: 정기적인 모의 훈련을 통해 DRP의 실행 가능성을 확인하고 개선점을 식별

6. 정기 검토 및 감사

  • 정기 검토: 조직의 변화(예: 인프라, 비즈니스 프로세스, 기술 변화 등)에 따라 DRP를 정기적으로 검토하고 업데이트
  • 감사 및 평가: DRP의 효율성과 효과성을 평가하기 위해 내부 감사 및 외부 평가를 실시

II. DRP 구성요소 및 문서 세부내용

가. DRP 구성요소

구성요소 설명  
DRS (재해복구 사이트 ,Disaster Recovery Site)

- Disaster Recovery System 구성, 위치, 운영절차 수립

1. 재해복구시스템(Disaster Recovery System) 구성

재해복구시스템은 재해 발생 시 신속한 복구를 위해 필요한 하드웨어, 소프트웨어, 네트워크, 데이터 백업 및 복원 절차 등을 포함
  • 하드웨어: 복구를 위한 서버, 스토리지, 네트워크 장비 등.
  • 소프트웨어: 데이터 백업 및 복구 소프트웨어, 재해복구 관리 소프트웨어 등.
  • 네트워크: 복구 사이트와의 연결을 위한 네트워크 인프라.

2. 위치

- 재해복구시스템의 위치는 비즈니스 연속성 보장에서 매우 중요
- 주요 위치 전략은 다음과 같다.
- "사이트(site)"는 웹사이트가 아닌, 물리적 장소나 지역을 의미
- 조직의 데이터와 시스템을 복구하고 운영을 재개할 수 있는 재해복구 장소를 가리킴
- 각각 재해 발생 시 조직의 IT 인프라와 데이터를 복구하고 비즈니스 연속성을 보장하기 위한 물리적 장소

  • 핫 사이트(Hot Site): 실시간으로 데이터를 복제하고 필요한 하드웨어와 소프트웨어를 모두 갖춘 완전한 재해복구 사이트. 즉각적인 운영이 가능.
  • 웜 사이트(Warm Site): 주요 하드웨어와 네트워크는 준비되어 있으나 데이터는 최신 상태로 유지되지 않을 수 있음. 복구에 일정 시간이 필요.
  • 콜드 사이트(Cold Site): 최소한의 인프라만 갖추고 있으며, 필요한 하드웨어와 소프트웨어를 가져와 설치해야 함. 복구에 상당한 시간이 소요.

3. 운영 절차 수립

DRS의 운영 절차는 재해 발생 시 신속하고 체계적인 대응을 위해 명확하게 정의되어야 함
  • 복구 절차 문서화: 각 단계별로 상세한 절차를 문서화.
  • 책임 할당: 각 단계별로 담당자 및 팀의 역할과 책임을 명확히 정의.
  • 정기적인 테스트 및 검토: 정기적으로 복구 절차를 테스트하고, 결과를 검토하여 절차를 개선.
  • 교육 및 훈련: 모든 관련 인원이 절차를 숙지할 수 있도록 정기적인 교육과 훈련 실시.

- HA  FT 구성, SAN, NAS 구성, DWDM을 통한 실시간 백업

1. 고가용성(HA, High Availability) 및 무정지(FT, Fault Tolerance) 구성

  • HA 구성: 시스템의 가용성을 높이기 위해 다중 서버, 로드 밸런싱, 클러스터링 등을 사용하여 단일 장애점(SPOF)을 제거.
  • FT 구성: 시스템의 연속성을 보장하기 위해 두 개 이상의 시스템이 동시에 동일한 작업을 수행하도록 하여 하나의 시스템이 실패해도 중단 없이 운영 가능.

2. SAN (Storage Area Network) 및 NAS (Network Attached Storage) 구성

  • SAN: 고속 네트워크를 통해 서버와 스토리지 디바이스를 연결하는 시스템. 대용량 데이터 전송과 저장을 위한 효율적인 솔루션.
  • NAS: 네트워크에 직접 연결된 저장장치로, 파일 기반 데이터 접근을 제공하며 사용하기 쉽고 설정이 간단.

3. DWDM (Dense Wavelength Division Multiplexing)을 통한 실시간 백업

  • DWDM 기술: 광섬유 하나에 여러 파장(wavelength)을 사용하여 대량의 데이터를 동시에 전송. 장거리, 고속 데이터 전송에 적합.
  • 실시간 백업: DWDM을 활용하여 원격지의 백업 사이트와 실시간 데이터 동기화 가능. 이는 데이터 손실을 최소화하고, 신속한 복구를 지원.
복구계획서 (BIA반영) - 업무 복구 순서 및 복구 R&R, 재해상황통제 및 비상연락망
- H/W, S/W, N/W 복구절차, 업무복구절차 및 가동확인 절차
 
훈련계획서 - 정기적인 재해복구 훈련을 위한 계획서 및 훈련 시나리오
- 훈련 시나리오 및 업무 복구 후 정상확인 방법 기술
 

 

나. DRP 문서 효율적 관리방안

관리방안 설명
업무 복구 순서 - BIA 반영한 핵심 업무 및 후속업무 복구순서 결정
정기/비정기 모의훈련 - 정기/비정기 모의훈련을 통해 절차 내재화 및 평가/보완

 

다. DRP 문서 세부내용

문서종류 문서내용 세부내용
DRS 문서 DRS구성도 DR 센터 구성도 및 H/W, S/W, N/W 구성도
운영절차서 DR 센터 동기화방안, DRS 시스템 가동 및 운영절차
복구계획서 시스템복구 계획서 H/W, S/W, N/W 복구 순위에 따른 복구 절차서
업무복구 계획서 핵심업무와 후속업무 순위에 의한 업무복구절차
비상연락체계 상황보고절차 및 상황실 운영 절차
비상연락망 시스템 및 업무복구인원 비상연락망 벤더 연락처
훈련계획서 복구이동절차 DRS 복구 인원의 연락 및 이동 절차
복구시나리오 복구 스크립트 및 가동 후 확인방법 명시
평가 및 보완사항 훈련의 평가 및 미비사항 보완 대책

 

III. 재난 종류에 따른 대응 방안 및 DRP 테스트 유형

가. 재난 종류별 대응방안

재난(장애) 유형 대응방안
시스템 장애 Clustering
네트워크 장애 이중화
DISK 장애 RAID, Mirroring
스토리지 장애 Data Replication
어플리케이션 장애 Restore(Disk, TAPE)
DB장애 Restore(Disk, TAPE)
전산센터 재해 Remote Data Replication

 

나. DRP 테스트 유형

테스트 유형 내용 테스트 강도
Cheklist - 재난복구계획*(DRP)의 계획서 및 절차서를 각 사업단위의 담당자에게 배포되어, 계획의 절차나 오류를 점검/검토 낮음
 
 
 
 
 
 
 
 
 
높음
Structured Walk-
Through(구조적 점검)
- 사업 단위의 관리자의 대표들이 계획을 점검 및 논의하기 위해 회의를 수행하며, 구조적 점검의 수행 목적은 각 조직의 복구 능력을 성공적으로(문서상 계획서상) DRP에 반영했는지를 확인
Simulation(시뮬레이션) - 실제 비상사태가 났다는 가정하게 시스템 운영 관련 주요 관리자와 직원들이 비사 모임을 갖고 복구 절차를 검토하는 단계
Parallel Test
(병렬 테스트)
- 모든 직원을 활용하여 복구 계획에 대해 완전하게 테스트
Full-interruption Test
(전체 시스템 중단 테스트)
- 실제로 재난이 발생할 때와 동일한 운영 시스템과 데이터를 사용하여 Test를 수행

IV. BCP DRP 비교

구분 BCP DRP
목적 - Business Continuity Planning
- BCP는 심각한 중단 상황에서 복구가 진행되는 동안에 필수적인 사업을 유지하기 위한 절차를 제공
- Disaster Recovery Planning
- 정보시스템 인프라와 사업 운영에 필수적인 정보자산의 복구를 촉진하기 위한 상세한 절차를 제공
범위 -실제의 업무 프로세스와 업무 프로세스를 지원하기 위한 IT 영역에 집중 - IT 중심적이고 장기간 효과를 지속하는 중대한 중단에 국한
- IT서비스의 우선순위 선정이 중요
실행주체 -Business Unit를 중심으로 수행 - 각 업무 부서와는 별도로 정보 시스템 부서를 중심으로 수행
대상 -업무는 물론 사람, 물리적 사무공간, 중요 문서 등을 포함하여 사전에 준비하기 어려운 수많은 항목이 대상 - 명확하게 범위를 설정
- 정보시스템 운영팀을 중심으로 운영시설을 사업단위 중심으로 수행
- 최소한의 Data Backup에서부터 실시간 데이터 저장 및 운영 Server, Storage, Network device, DWWM까지 대상