HA/DR 구성의 일관성 검증

게시자: 김주철, 2011. 8. 1. 오전 2:01

HA/DR 구성의 일관성을 위한 일반적인 검증방법과 그 한계는 무엇입니까?

격차는 대부분의 기업, 심지어 변경관리 시행안을 엄격하게 적용하고 있는 기업에서도 발견되고 있습니다. 그러한 상황을 구제하기 위한 노력으로 기업들은 DR 솔루션에 대한 감사를 정기적으로 실시하고 있습니다. 운영팀은 정상적인 운영상태(즉, 예비 시스템환경, 복제 메커니즘 등)를 점검하고 규정된 SLA를 만족하고 있는지 확인하기 위해 다양한 검수목록이나 일정표를 사용합니다. 그러나 시스템의 변경은 이러한 감사절차가 따라올 수 없을 정도로 빠르고, 경우에 따라서 개별적으로 일어나기도 합니다. 결과적으로 감사 절차에 격차가 발생하게 됩니다. 이러한 이유로 전체적인 정기감사와 년간 수회에 걸쳐 실시되는 테스트를 수행하는 외부 컨설턴트를 고용하는 기업도 있습니다.

감사(Auditing)

감사는 DR 솔루션의 무결성을 유지관리하기 위해 매우 중요합니다. 일반적으로 감사는 사전에 나열한 검수목록에 따라 광범위한 점검을 시행합니다. 검수목록은 감사 전문가 의견을 토대로 만들어지고 취약점을 탐지하기 위해 설계됩니다. 그러나 비용문제로 인해, 감사는 DR 절차의 타당성을 검토하는데 충분한 주기로 시행되지 못하고 있습니다. 거기에 더해서, 감사는 완료하기까지 수주에서 수개월이 소요되므로 감사를 종료한 시점에 그 정보는 이미 효력을 상실하기도 합니다.

테스트(Testing)

테스트의 목적은 DR 솔루션이 제대로 작동하는지 실제 장애 시나리오에 따라 모의하는 것입니다. 테스트는 DR 솔루션이 실제상황에서 제대로 작동하는가에 대한 의문에 명확한 답을 제시하므로 매우 중요합니다. 테스트는 가동시스템의 가용성과 데이터보호 상황을 유지하는 동시에 실제 장애를 모의해야 하므로 보다 많은 준비를 해야 합니다. 실제 테스트는 어떤 환경을 다시 문서화하고, 각각의 팀은 어떤 문제를 담당해야 하고, 예상되는 격차를 어떻게 점검할 것인가를 결정하기 위해 몇 주간에 걸쳐 야단법석을 떤 후에야 진행이 됩니다.

테스트는 가능한 한 실제상황과 같아야 합니다. 그러나 많은 경우에 있어서 이것은 달성하기에 매우 어려운 일입니다. 쉽게 간과한 종속성이나 세부구성 등으로 인해 격차를 탐지하지 못하고 넘어가기도 합니다. 예를 들어, 테스트 중에는 도메인 서버, 파일 서버, 데이터베이스 등과 같이 DR 자원 대신에 무의식적으로 가동시스템 환경의 자원을 사용하기도 합니다. 이러한 경우에, 이들 시스템은 테스트 중에는 제대로 기능을 하겠지만, 가동시스템이 사용 불가한 실제 상황에서는 제대로 작동하지 않을 것이 확실합니다. 다른 한편, “유사 실제상황” 테스트는 가동중단과 데이터 손실을 초래할 수도 있습니다.

또한, 테스트 중에 문제를 확인하느라 완료되는 시간이 지연되기 때문에 테스트는 빈번하게 부분적으로만 진행되는 경향이 있습니다. 최상의 환경하에서 중요한 애플리케이션은 일년에 기껏해야 한 번이나 두 번 정도 테스트를 하지만, 다른 애플리케이션은 격년에 걸쳐 한번 테스트를 합니다. 거기에 더해서, 테스트는 종종 작은 부문으로 나뉘고 순차적으로 진행되기 때문에 서로 종속관계에 있는 어떤 애플리케이션들은 전혀 테스트하지 못하고 있습니다(Gartner 보고서). 그 결과로, 가장 최근의 테스트 결과도 부정확하고 위험하며, 기껏해야 변화하고 있는 환경에 대한 단순한 스냅샷에 지나지 않습니다.

결론 – 자동화 필요

많은 기업들이 광범위한 감사와 테스트를 수행하는데 필요한 시간을 할애하기가 어렵다는 것을 알고 있습니다. 단지 한가지 알려진 문제를 한 서버에서 찾아내는 것만으로도 수 시간, 심지어 하루 종일 문제해결에 매달려야 합니다. 하물며, 수백 대의 서버에 수천 건의 알려진 문제를 점검하는 데에는 그 모든 것을 처리할 시간조차 모자랍니다. 프로세스의 자동화는 완전하고 정확하며 무엇보다도 항상 최신의 상태를 유지합니다. 그러나 자동화 자체만으로는 충분하지가 않습니다. DR 환경에서 격차를 찾아내기 위해 자체적으로 준비한 검수목록은 수십 개의 항목을 나열하고는 있지만 여전히 재해복구에 위협이 될만한 잠재적인 위협을 모두 포함하고 있지는 못합니다. 오로지 수백 명의 DR 전문가들로부터 집대성해서 광범위하게 최상의 시행안을 담은 지식베이스만이 효과적일 수 있습니다. 검증은 IT 환경에서 관계성과 종속성의 실제 매핑에 기초해야 합니다. 결론적으로 자동화는 부담이 되어서는 안되며, 그렇지 않으면 오히려 그 자체가 데이터 가용성에 위험요소를 만들어 낼 것입니다.

Comments