본문 바로가기
데이터 완전성 (Data Integrity)

Data Integrity(DI) Scope의 Data 정의와 개념

by doing_right 2022. 1. 19.

GMP(Good Manufacturing Practice)에서 표현되는 데이터는 무엇을 의미하는지 정의 및 개념에 대한 기술을 하겠습니다. 여기서 데이터는 위 언급한 대로 GMP 활동/영역에서의 데이터에 한정되는 것이며, 개인 PC 나 노트북에 저장된 파일 데이터나 IT 개발자들이 얘기하는 데이터와는 다른 개념이니 혼동하시지 않기 바랍니다.

이전 글에서 Data Integrity(데이터 완전성)의 정의를 설명하였습니다. 데이터 완전성에서 데이터는 ALCOA(알코아, Attributable, Legible, Contemporaneous, Original, Accurate)로 표현되는 요구/기준 사항을 준수하여 전 데이터 생애주기(Data Lifecycle) 동안 생성된 데이터의 데이터 완전성(Data Integrity)이 보장되어야 하나, 이러한 데이터 완전성을 논하기 전에 주체가 되는 "데이터" 자체에 대한 이해가 우선 필요합니다.

 

목차

1. GMP Area에서의 데이터(Data) 정의

   1) FDA

   2) MHRA

2. Data = Raw data + meta data

3. 결론

 

 

1. GMP scope에서의 데이터(Data) 정의


1) FDA, 미국 식품 의약국 (21 CFR Part 11, 11.3)

 

 Electronic record means any combination of text, graphics, data, audio, pictorial, or other information representation in digital form that is created, modified, maintained, archived, retrieved, or distributed by a computer system.

전자 기록 은 컴퓨터 시스템에 의해 생성, 수정, 유지, 보관, 검색 또는 배포되는 디지털 형식의 텍스트, 그래픽, 데이터, 오디오, 그림 또는 기타 정보 표현의 조합을 의미합니다.

 

2) MHRA, 영국 의약품 및 보건의료제품규제청 (‘GXP’ Data Integrity Guidance and Definitions, Revision 1. 2018/03)

 

Facts, figures and statistics collected together for reference or analysis. All original records and true copies of original records, including source data and metadata and all subsequent transformations and reports of these data, that are generated or ecorded at the time of the GXP activity and allow full and complete reconstruction and evaluation of the GXP activity.

참조 또는 분석을 위해 함께 수집된 사실, 수치 및 통계. 원본 데이터 및 메타데이터, 이러한 데이터의 모든 후속 변환 및 보고서를 포함하여 GXP 활동 시 생성되거나 기록되고 GXP 활동의 완전하고 완전한 재구성 및 평가를 허용하는 모든 원본 기록 및 원본 기록의 진사본(true copy).

 

개인적으로는 MHRA의 Data 정의가 Data Integrity를 설명하는 데 있어, Data 자체의 정의를 잘한 것이라고 생각합니다. FDA의 오래된 규정인 21 CFR Part11 에서는 전자 기록 (electronic record)의 정의를 하고 있어, ER(Electronic Record)에 Hardcopy record를 더한 개념이 Data 개념으로 이해할 수 있습니다. MHRA에서는 Hardcopy 여부를 떠나 GMP 활동에서 발생/기록되고, 재구성 및 평가를 진행하는 기록들을 데이터(원본 기록 및 진사본)로 정의하고 있기 때문에 넓은 범주에서 데이터가 아니라고 설명하기는 어려울 것입니다. 

 

■ True copy (원본의 사본/진사본)

최초의 데이터가 Original record로 정의하고, original record의 사본은 True copy 로 정의할 수 있습니다. 

하지만, 조건이 붙게 되는데, original record 의 사본이 True copy 가 될 수 있는 전제는 Original record와 true copy 가 완전히 동일하다는 검증의 선 수행입니다. 제 3자의 Verification/Signature 가 기록 및 기록 절차가 있어야 하며, 검증된 시스템을 통해 original record 와 true copy 가 동일한 record 임을 확인 가능한 경우에 한합니다.

 

실제 필드에서 접하는 사항 중에 DI 관련 개념이 잡혀 있는 업체의 경우, DI 규정/요구사항에 대한 반영 및 평가는 어느 정도 되어 있다 보니, 실제 운영 중에 애매한 기준이나 규정 허용 여부 등이 모호한 사항이 발생하게 되는데요. 그중 하나가 True copy와 관련된 사항들입니다. 주로 언급되는 혼란 point를 아래 정리하였습니다.

 

1. True copy의 성립 범주

▷ 전자 데이터(=Original record)가 원 기록인 경우, 해당 데이터의 출력물은 모두 True copy로 인정 가능 한가?

▶ 아닙니다. Original record(=Raw data)는 원 기록/고유 정보(raw data)와 부가 정보(Metadata)로 이루어져 있습니다. 전자 데이터를 출력하는 경우에는 대부분 Report 기능이나 화면 출력 기능을 통해 Original record를 Summary 형태로 템플릿화 하여 작업자가 보기 편한 형태로 출력이 됩니다. 이때 출력물에 Original data의 모든 Metadata (Audit trail, 작업자 정보, 작업에 사용된 parameter 의 정보, Processing 시의 정보 등) 가 모두 출력되는 경우 검증자의 검증 이후 True copy 로 인정됩니다(PIC/S DI guidance P.43). 그러나, meta data 의 일부가 출력되지 않는다면, True copy 가 될 수 없습니다.

대부분의 QC 데이터는 전자 형태의 Orignal data와 부가 data 인 meta data를 모두 포함한 Data 가 Original data이며, 이에 따라 True copy의 생성은 쉽지 않음을 알 수 있습니다.

 

2. True copy 의 보관 연한 및 Original data 폐기 가능 여부

▷ True copy는 Original record와 "동일함" 을 검증한 공식적인 사본이므로, true copy를 보관하면 original record 는 폐기해도 되는지에 대한 고민이 발생합니다. True copy에 대한 정의에서 공식적인 검증 절차/Tool을 통해 original record와 동일함이 검증되었다면 삭제/폐기는 가능하나, 이에 대한 사내 정책 규정과 Original record 와 true copy의 보존 연한에 대한 방법/기준서가 우선 수립 필요합니다. 보수적인 측면에서 전자 데이터의 경우에는 물리적인 공간의 제약이 덜하기 때문에 True copy를 보통은 만드는 경우가 드물고, Hard copy record에 대해 문서고의 공간 확보나, 종이 데이터의 전자화를 진행하는 경우에 True copy (종이 데이터의 스캔 파일) 이 발생하게 됩니다.

이때 True copy 생성은 아래 2가지 중 하나의 검증을 반드시 따르도록 해야 하며, 검증 작업에 대해 불일치가 발생되거나 의심이 되는 정황이 있다면 폐기된 Original record까지 폐기 목적 및 완결성을 의심받을 수 있게 됩니다.

 

- 종이 원본 데이터를 스캔한 스캔본이 ALCOA 기준에 적합하며 동일함을 검증/서명/승인하는 것 (절차)

- 종이 원본 데이터가 밸리데이션 된 스캔 프로그램을 통해 형태 변경된 데이터와 원본 데이터 간 완전성이 보증된 스캔 파일을 생성하는 것 (검증 시스템화)

 

2. Data(Original record) = Raw data + meta data


Metadata is the contextual information required to understand data. A data value is by itself meaningless without additional information about the data. Metadata is often described as data about data. Metadata is structured information that describes, explains, or otherwise makes it easier to retrieve, use, or manage data. For example, the number “23” is meaningless without metadata, such as an indication of the unit “mg.” Among other things, metadata for a particular piece of data could include a date/time stamp for when the data were acquired, a user ID of the person who conducted the test or analysis that generated the data, the instrument ID used to acquire the data, audit trails, etc.

- FDA DI guidance (P. 6)

메타데이터는 데이터를 이해하는 데 필요한 문맥적인 정보입니다. 데이터 값은 데이터에 대한 추가 정보가 없으면 그 자체로 의미가 없습니다. 메타데이터는 종종 데이터에 대한 데이터로 설명됩니다. 메타데이터는 데이터를 더 쉽게 검색, 사용 또는 관리할 수 있도록 설명하거나 설명하는 구조화된 정보입니다. 예를 들어 23이라는 숫자는 'mg'라는 단위와 같은 메타데이터가 없으면 의미가 없습니다. 무엇보다도 특정 데이터 조각에 대한 메타데이터에는 데이터를 획득한 날짜/시간 스탬프, 데이터를 생성한 테스트 또는 분석을 수행한 사람의 사용자 ID, 데이터, 감사 추적 및 기타 기록을 생성한 기기 ID를 포함할 수 있습니다.

 

■ Data의 설명

 

얻어진(생성된) 데이터 = 23g / 2022.01.19 / 18:40 / UserID= ABC / Action= generated  라면,

 

Raw data = 23 (value에 해당하는 data)

Meta data = g (단위), 2022.01.19(생성 날짜), 18:40(생성시간), ABC(생성자 ID), gererated(활동 이력)

 

이 됩니다. 

 

3. 결론


Data의 정의에 대해 간단히 설명하였으나, Data의 정의만큼 실제 GMP에 적용할 때 어려움이 있는 것이 있습니다.

그것은 GMP data의 적용 범위입니다. 실제 GMP 활동에서 기록된 데이터는 모두 GMP data일까요? 

GMP 장비, GMP 절차, GMP 작업자로부터 생성된 모든 기록이 GMP data로 포함시킨다면 모든 GMP Data는 데이터 완전성 규정에 따라 생성/가공/전달/관리/폐기되어야 하므로, GMP 활동은 아주 어려운 직무영역이라고 할 수 있겠네요.  다음 포스팅에서는 실제 필드에서 주로 다뤄지는 데이터들의 종류와 관리의 적절성 및 위험요소 등에 대해 실제 사례를 통해 전달드려보겠습니다.

 

 

 

 

반응형

댓글