데이터 라이프 사이클(Data life cycle, 데이터 수명 주기) 을 알고 계시나요? 데이터 생성 후 폐기까지 전 과정에 대한 개념은 데이터 완전성 이해의 시작입니다. 본 글을 통해 "데이터" 와 "생애 주기" 개념을 확인하세요.
[목차]
Data Life Cycle (데이터 라이프 사이클)
- Data life cycle 소개
- Data creation (데이터 생성)
Data Life Cycle (데이터 라이프 사이클)
Data Life cycle 은 표현 그대로 데이터(Data) 의 생애 주기를 의미합니다. 데이터 완전성은 "데이터" 의 "완전성/무결성" 을 정의하는 개념임을 이해했다면, 데이터 완전성의 적용은 언제부터 시작하고, 어디까지 지켜져야하는 지에 대한 생각을 하게 됩니다.
한 마디로 표현하자면, [ "데이터" 로 인식되는 매 순간에 항상 완전해야한다 ] 로 말씀 드릴 수 있습니다.
완전 하다는 것은 있는 그대로를 정확히(Accurate, Legible, Orignal), 거짓없이(Comtemporaous, Consistent), 모든 내용을(Attribute, Complete) 사용할 수 있도록(Available), 유지(Enduring) 한다는 표현입니다.
Data life cycle 소개
Data life cycle(데이터 생애 주기) 는 데이터가 태어나고(생성) 부터 죽기(폐기) 까지의 모든 단계를 포함합니다. 전자데이터와 수기 기록/종이 기록을 모두 포괄합니다. GMP 활동에 따른 결과 또는 영향을 주는 모든 범주 영역이 속합니다.
정리하면, 데이터의 생애 전 주기 동안 GMP 데이터로 분류되는 모든 데이터는 ALCOA+(CCEA) 기준에 부합해야 합니다.
Data life cycle 각 단계에서 강조되어야 할 요소가 존재하며, 이는 적절한 품질 위험 관리(평가, QRM) 에 의해 결정할 수 있습니다.
각 단계의 관리(control) 요소/절차의 예로 적절한 CSV, Audit trail, Verification procedure, Disaster plan 등이 있습니다.
ISPE 가이드("Records and Data Integrity") 에서는 데이터이 이동 측면에서도 데이터 완전성이 적용되어야 하고, 이는 Risk Management 에 근거해야 함을 명시하고 있습니다.
- 시스템 간 데이터 이동 (Transfer)
- 다른 데이터 형태 이동 (수기 기록 to 전자데이터) - (Migration)
- 클라우드 시스템으로의 데이터 이동 또는 저장 (Clouding data)
- 다른 조직으로의 데이터 이동 (QC to QA)
- 제 3 회사로의 데이터 이동 (Agreement)
Data creation (데이터 생성)
기록을 남기거나 (종이 기록), 전자 시스템을 이용한 GMP 활동의 결과 (캡쳐/저장) 가 생성될 때, 이미 불완전한 데이터가 만들어 질 수 있습니다. 이런 위험을 감소시키기 위해서 적절한 절차 (종이 기록을 위한) 와 적절한 시스템 기능/설정/검증(ALCOA+ 를 가능하게 하는 기능의 적용과 기능의 교정 및 점검)이 필요합니다.
그 중에서도 중요한 요소는 Comptemporaneous (동시성) 와 Attributable (귀속성) 입니다. 데이터의 태생정보는 바뀌어서는 안 됩니다. 비밀이 없어야 합니다. 그리고 충분한 속성 (날짜/시간/부모/태생과 관련한 부가 정보(기기, 분석자 등)을 함께 가져야 합니다. 너무나 중요하지만, 가장 지켜지기 어렵습니다.
동시성이 신뢰되지 않는 데이터는 그 존재를 부정 당할 수 있습니다. 뿐만 아니라, 해당 데이터의 형제와 부모 데이터 까지 모두 신뢰하지 않게 됩니다.
GMP data 를 정의하는 것도 중요합니다. 관리가 소홀한 데이터가 발견 되었는데, 해당 데이터는 "관리하지 않아도 되는 데이터" 라고 얘기하기는 매우 어렵습니다. 데이터 완전성 기준에서 벗어나는 데이터가 있고, 해당 데이터는 GMP 수준에서 관리하고 싶지 않다면, 그 근거를 마련해야 합니다. 근거는 과학적인 관점에서 설명할 수 있어야 합니다. (Data 의 정의와 관련한 내용을 MHRA DI Regulation 에서 참고 하십시오)
가끔, 오래된 컴퓨터화 시스템에서 데이터를 생성할 때, 저장 여부를 사용자에게 묻는 경우가 있습니다. "선택적" 으로 저장하는 것은 이미 Manipulation 가능성이 열려있습니다. 해당 장비를 계속 써야한다면 Risk 평가를 통해 보완하셔야 합니다. (선택적 저장 기능의 비활성화 or 기능 접근의 권한 세분화 / 시스템 업그레이드 or 교체)
데이터는 만들어 지고 나서 부터 수많은 유혹(Change, Modification, Deletion, Move, Inactivation) 을 받습니다. 모든 Risk 를 평가하고, 보완절차/기능을 수립, 적용하는 것도 꽤나 힘든 일이 됩니다.
가장 좋은 방법은 데이터가 생성될 때, 모든 요소를 원천적으로 차단하는 것입니다. 자동 파일 생성 및 PDF 생성, 생성된 파일은 작업자의 간섭 없이 자동으로 검토자에게 넘어가고, 검토자는 수정 권한이 없도록 합니다.
데이터 완전성 수준을 높이는 가장 좋은 방법은 DI 기준을 고려하여 적절히 디자인된 기능이 탑재된 시스템의 이용하는 것입니다. 또한, 데이터 생애 주기동안 각 단계에서 사람의 간섭을 최소화 (시스템 연동을 통한 자동화) 하는 것도 필요합니다. 시스템 선정과 밸리데이션의 어려움 또는 전반적 비용 증가 측면에서는 시스템을 연동하고, 사람의 간섭을 없애는 작업은 쉽지만은 않습니다만, 아주 작은 시작부터라도 수행하는 모습은 필요합니다.
[이어서 볼 추천 글]
'데이터 완전성 (Data Integrity)' 카테고리의 다른 글
GMP 데이터 검토 (DI 규정에 따른 위험 고려 방법) (0) | 2022.04.19 |
---|---|
Data processing (데이터 가공) 이해 (DI Data life cycle 단계) (2) | 2022.04.18 |
데이터 완전성을 위한 조직과 데이터 책임감 (0) | 2022.03.28 |
데이터 거버넌스의 시작 (0) | 2022.03.24 |
Data governance 수립 단계에 대한 설명 (0) | 2022.03.22 |
댓글