클라우드로 서비스를 이관하는 기업이 많아지고 있다. 그러나 그 과정이 말처럼 쉽지는 않다. 데이터베이스를 옮기는 과정에서 서비스가 중단이 되는 등의 장애가 일어날 수 있고, 막상 옮기고 났더니 이전에 썼던 솔루션이 적용되지 않아 애를 먹는 경우도 생겨날 수 있다. 어떤 방법으로 클라우드에 옮겨 타야 탈 없이 서비스를 지속할 수 있을까?
바이라인네트워크가 지난 15일 개최한 웨비나 ‘AI·클라우드 시대를 위한 데이터 관리 전략’에서는 클라우드로의 안전한 무중단 마이그레이션 방안이 소개됐다. 이 일을 전문으로 하는 엑스로그의 임래송 연구소장이 발표자로 참석해 “기존에 온프레미스 환경에서 제공하는 서비스를 클라우드로 서비스 중단 없이 이관하고자 하는 요구 사항들이 계속해 많이 생겨나고 있다”며 “서비스 다운타임 없이 클라우드로 데이터를 이관하는 게 중요해진 것”이라고 강조했다.
임 소장의 말처럼 클라우드로의 이전은 세계적 현상이다. 가트너 조사 자료에 따르면, 세계 개방형 클라우드의 최종 사용자 지출액은 2022년 4909억달러(약 649조원)였던 것이 2023년에는 5973억달러(약 789조원)로 21.7%나 상승할 것으로 보인다. 글로벌 경기 침체 속에서도 1분기 주요 빅테크들은 매출 호조를 보이고 있는 상황이다. 국내도 크게 다르지 않은 모습이다. 대형 IT서비스 기업들이 클라우드 사업에 집중하면서 2027년 까지 산업 규모가 138억달러(약 18조원)로 늘어날 전망이다.
클라우드 시장이 커진다는 것은 그만큼 데이터 시장의 규모도 늘어나고 있다는 걸 말하기도 한다. 최근 국내 데이터 산업 시장의 변화를 훑어보면 ▴실시간 데이터 통합 요구 증가 ▴빅데이터 플랫폼 및 센터 구축 확대 ▴실시간 데이터 분석 수요 증대 ▴클라우드 전환 ▴탈 오라클 정책 가속 등이 눈에 띈다. 지금까지 설명한 클라우드와 데이터 시장 규모의 확대와 변화 양상을 종합해보면 핵심은 실시간으로 데이터를 동기화(CDC)하고, 무중단으로 데이터를 마이그레이션 할 수 있도록 할 수 있느냐는 것이다.
실시간 데이터 동기화
CDC(Change Data Capture) 솔루션은 데이터베이스(DB)의 리두로그(Redo log)에 직접 액세스해 데이터베이스를 실시간 동기화하는 솔루션이다. 소스 시스템의 운영계 데이터베이스 트랜잭션 로그에서 변경 데이터를 추출해서 타깃 시스템 정보계에 정보를 전달하고, 사용자 업무에 맞춰 데이터를 가공하거나 정제해 사용한다.
따라서 기존 주기적인 동기화 방식을 사용하던 방식과 달리 실시간으로 운영가능하다. 특히 변경분만 운영 DB에서 추출하기 때문에 운영 서버에 부하를 최소화하면서 복제를 수행할 수 있다는 것이 강점이다.
CDC 동기화 구축 시 고려사항도 있다. 최근에는 기업들이 다양한 DB를 쓰고 있으므로 당연히 다양한 DB를 복제할 수 있어야 한다. 당장 쓰고 있지 않다고 하더라도 향후 추가 도입할 가능성이 있는 DB 역시 고려해야 한다. 또, 특정 시간에 대량 발생하는 데이터를 신속하게 처리할 수 있어야 하고 이기종 DB와 OS 간 복제를 지원해야 한다.
효과적인 데이터 마이그레이션을 하려면?
스토리지에 있는 특정 데이터들을 다른 스토리지로 이관하는 것을 데이터 마이그레이션이라 부른다. 최근 레거시 시스템에서 DB를 클라우드로 이관하는 가장 큰 이유는 역시 비용 절감이다. 아울러 클라우드로 이관시 시스템의 리소스를 탄력적으로 운영할 수 있고, 백업이나 복구 등의 장애 조치를 편리하게 제공한다는 것을 강점으로 보고 있다.
그렇다면 어떻게 데이터 마이그레이션을 해야 할까? 특히 서비스가 24시간 운영되어야 하고, 그 사이에도 계속해 데이터에 변경이 일어나는 시스템이라면? 통상은 이런 경우 데이터 마이그레이션을 할 수 없으므로, 앞서 언급한 CDC 솔루션을 적용하게 된다.
성공적으로 클라우드 데이터 마이그레이션을 하기 위해서는 다음과 같은 작업을 수행해야 한다. 첫번째, 데이터 정제와 초기 데이터 이관이다. 가장 중요한 기초 작업인데, 마이그레이션의 전과 후에 모두 수행하는 작업이기도 하다. 불완전하고 부정확한 데이터를 교체하고 필요없는 데이터를 삭제하며, 중복 데이터를 병합하고 일관성을 부여하면서 마이그레이션의 효율화를 극대화하기 위해 시행한다.
그 다음이 서비스 다운타임의 최소화다. 사전테스트를 거쳐 다운타임을 미리 예측해야 한다. CDC를 이용해 실시간 DB를 복제하는 것도 다운타임을 최소화하기 위한 방안이다.
또, 마이그레이션을 하기 전에 신규 시스템에서 AP 단의 테스트를 충분히 해서 성능에 문제가 없을지를 체크해야 한다. 마지막으로, 이후 예상치 못한 장애가 발생할 경우 시스템을 원상복구 해야 할 수 있으므로 적절한 페일 백(Fail Back) 계획을 세워놓아야 한다.
엑스로그는 2014년 설립 이후 실시간 데이터 동기화와 이관 무중단 마이그레이션 분야를 주도적으로 해온 기업이다. 업무 분산 시스템 구축, 무중단 마이그레이션, 이기종 데이터베이스관리시스템(DBMS) 등 데이터 이슈를 계속 해결해오고 있는 곳이다.
임래송 소장은 “엑스로그는 데이터 이관과 복제를 동시에 지원하고 있고 초기 적재와 데이터 복제를 동시에 진행하므로 프로젝트 수행 시간을 단축시킬 수 있다”며 “데이터베이스에 직접 로그에 접근해서 추천하기 때문에 신속하고 안정성 있게 복제를 지원하고 있다”고 강조했다.
글. 바이라인네트워크
<남혜현 기자> smilla@byline.network