본문 바로가기
데이터 완전성 (Data Integrity)

데이터 백업과 아카이브의 차이

by doing_right 2023. 11. 24.

백업과 아카이브를 동일한 개념으로 이해하실 수 있고, 그렇게 이해하셔도 대단한 문제가 발생하진 않겠으나 백업/아카이브를 위한 시스템을 도입한다고 할 때에는 비용과 연관되기 때문에 좀 더 명확한 구분이 필요할 수 있습니다. 

 

데이터완전성 업무를 하게 되면 GMP 업무라는 느낌보다 IT 관련 업종에서 일하는 느낌이 들기도 하는 데, 가장 큰 요인 중에 하나가 '데이터백업/아카이브' 이고 또 하나는 'Windows 환경에서의 데이터 삭제 불가 설정 및 Event log 기능 활용' 입니다. 

 

오늘은 데이터 백업과 아카이브에 대한 차이에 관한 이야기 입니다.

 

 

 

 

단순히 사전적 정의만 봐도 두 개념에는 유의미한 차이가 있긴 합니다.

백업은 '대체', '사본' 의 정의를 내포하고, 아카이브는 '보관', '보관소' 의미를 갖습니다.

 

문제는 GMP에서 어디까지가 백업이고 어디서부터 아카이브 인지를 구분하는 일인데요.

각 단계에 있는 데이터를 아래와 같이 이해할 수 있습니다. 

 

[원본(Original) 데이터] = 최초 생성된 location에 위치한 전자 파일

[백업 데이터] = 최초 생성된 '원본'의 소실 시(예: 재난, 파괴 등) 대체(복원)할 수 있는 '정사본'

[아카이브 데이터] = '원본의 백업'을 장기간 안전하게 보관, 유지를 위해 수행된 결과 또는 데이터

 

 

 

여러 가지 조합/형태로 백업/아카이브 방법을 결정하고 그에 필요한 절차를 수립할 수 있습니다. 

그러나, 여기서 주의가 필요한 부분은 '백업 후 원본 데이터의 관리'라고 볼 수 있습니다. 

 

특히, Inspection 상황에서 원본 데이터의 관리는 '백업'과 별개로 중요하게 관리가 필요한데요.

 

 

▼ Inspection 예시

A(Inspector): PC 에 저장된 전자데이터는 어떻게 백업하나요?

B(SME): OOO 절차에 따라 매월 담당자가 수동으로 외장 HDD 에 Copy 후 문서보관소에 마련된 금고에 보관합니다. 

A(Inspector): 외장 HDD 에 파일 누락이나 유효성 손실 없이 Copy가 잘 되었다는 사실은 어떻게 보장하나요? 

B(SME): 담당자가 데이터 백업 시에 백업 수행 서식에 copy 한 폴더 갯수를 포함해 copy 수행이력을 기록합니다. (★ ★)

A(Inspector): 작년 AAA 제품의 안정성 시험 결과를 지금 보고 싶습니다. 

B(SME): 해당 분석 결과는 데이터 백업 후 HDD 용량 확보를 위해 삭제했습니다. 백업 데이터를 가지고와서 보여 드리겠습니다.

A(Inspector): 어떤 근거로 원본 데이터를 삭제하고 있나요? 

B(SME): 근거는 없으나 HDD 용량의 80%를 초과할 경우에는 기존 시스템 운용을 위해 백업된 데이터를 삭제해 용량을 확보하고 있습니다.

A(Inspector): 원본데이터는 누가 삭제하나요? 

B(SME): QC 부서의 백업 담당자가 삭제 합니다. (★ ★ ★ )

A(Inspector): 데이터 삭제 이력이나 Audit trail 에 대한 점검은 수행하나요? 

B(SME): Windows 기반에서 데이터 삭제 이력은 남지 않으나 시스템 사용 서식에 활동 내역을 기록합니다. ( ★ ★ ★ )


A(Inspector): 그렇다면 만약에 외장HDD 가 외부 충격이나 손상으로 고장이 날 경우에는 원본데이터는 어떻게 복구할 수 있나요? 별도의 아카이브 데이터가 있나요? 

B(SME): 네, 외장HDD 에 원본데이터를 백업하고, 해당 외장HDD 를 그대로 아카이브 목적으로 보관 유지 합니다. 보관소는 외부인의 출입이 불가하고 외부 충격에 보호를 위해 금고 내에 보관 하고 있습니다. (★ ★)

A(Inspector): 백업 데이터가 아카이브 되는 동안 완결성이 유지된다는 것에 대한 평가(RA)를 수행했습니까? 

B(SME): 별도의 RA 는 수행하지 않았으나, 외장HDD의 성능은 3년까지 보장되는 제품이며 최장 10년까지는 사용이 가능합니다.

 

DI 규정에 따라서 데이터 삭제 권한의 관리 부족, 아카이브 데이터의 손실 위험성 관리 평가 미흡, 데이터 백업 검증 절차 부족, 데이터 삭제 이력 점검 부족 등의 지적으로 판단되며, 경험 상 "데이터 삭제"라는 용어는 꼬리 질문을 매우 많이 받게 만드는 위험이 있으므로 데이터 삭제의 목적, 방법 및 해당 행위에 대한 점검 조치가 수반된 사전 평가와 절차가 수립된 상황에서 시도하는 것을 제안드립니다. 

 

데이터완전성 위험 발생 가능성 측면에서 시스템의 HDD 용량 확보를 위한 '데이터 삭제' 보다는 HDD 추가 설치 또는 NAS 연결 등을 통한 시스템 개선 방향의 접근이 훨씬 안전한 접근입니다. 특히, ALCOA++ 에서 ++ 요소 (CCEA)가 데이터 라이프사이클에서 데이터 전체 (Complete)의 보관, 유지(Enduring)를 포함한 ALCOA 전반에 대한 추적성(Traceability)을 강조하고, 요청 즉시 확인 가능해야 하는 점(Available) 때문에 원본 데이터를 삭제하는 것은 Inspection 대응 측면에서도 Weak point 가 될 수 있습니다.

 

장기적으로 안정된 방법으로 보관하는 수단은 Tape 형태(Tape, LTO), Disc 형태 (CD, Blue ray, M-disc)가 있는데, 향후에는 Cloud (예: amazon AWS 등) 방법으로도 고려할 수 있지 않을까 합니다만, 이 부분은 요즘 contact 한 적이 없어서 현재 필드에서 적용단계가 어느 정도인지는 모르겠네요.  (공급자 평가를 어떻게 할지, audit 안 받아줄 가능성도 있고..)

 

 

 

백업/아카이브는 IT 영역이기 때문에 GMP 업무 담당자로서는 절차 수립이나 운영이 사실 어렵습니다. IT 인력이 필요한 이유이기도 한데, IT 분야에서 GMP 업무 role 은 너무 한정적이고 동떨어진 영역이라서 인원을 구하기도 어렵겠다는 생각도 드네요. 그럼에도 불구하고 IT 전문가가 GMP 영역에 들어오는 것이 훨씬 현실적이라는 생각을 합니다. GMP 담당자는 GMP 기준에서 필요한 Requirement를 제안하고 반영하는 게 적절하다고 보고요. 

 

생명/생공/화학/화공 계열 분들이 IT 까지 하려면 정말 어려움이 많습니다. 

 

 

 

 

 

반응형

댓글