'QC 실험실에서 DI 대응을 위해 가장 우선해야 하는 것이 무엇입니까?'
여러 가지가 머릿속에 맴도는데, 주변 의견들 중에는 시간 관리 (시간 동기화)에 대한 고민이 많았습니다.
사실, DI가 주목 받기 전부터 실험실 내 장비/기기/시스템에 대한 시간 관리는 관리 point였음에도 불구하고,
DI 가 중요 관리 기준이 되어서야 더 주목받는 것 같습니다.
아마도 그 이유는 inspection/Audit 을 통해 시간 관리 및 동기화에 대한 점검이나 지적이 많아졌기 때문으로 생각합니다.
ALCOA에 따라 데이터에 기록되는 시간은 정확해야 하고, 작업 및 데이터 간 시간 역전으로 인해 데이터의 완전성을 보장할 수 없게 됩니다.
[시간 동기화 절차 없음] vs. [시간 변경 위험]
어떤 게 더 위험한지는 누구나 쉽게 이해하실 수 있을 겁니다.
뭐가 더 중요하냐/아니냐? 를 얘기하려는 건 아니었고, [시간 동기화]에 대해서 고민을 많이 하고 계시긴 한데, 혹시 더 중요한 것들은 놓치고 있지 않은지를 먼저 되돌아볼 필요가 있다고 생각합니다.
[시간 동기화?]
시간 동기화(Time synchronization) 는 시간이 표준시간과 상이할 때 (오차가 발생했을 때) , 표준시간에 맞춰 시간을 조정해 주는 것입니다.
표준시간은 협정 세계시(協定世界時, 영어: Coordinated Universal Time/Universal Time Coordinated, UTC) 로 표현되는데, 표준시는 휴대전화의 시간과 동일한 것으로 이해하시면 되겠습니다. (GPS 위성을 통한 동기화)
[시간 오차는 왜?]
QC/생산 에서 사용하는 Stand-alone 장비/기기들은 PLC/HMI를 포함해 Machine/Equipment control을 위한 Computer 가 있고, 해당 Computer에서는 최초 세팅된 날짜/시간 정보를 기준으로 작업 이력 및 데이터의 시간이 기록됩니다. 그런데, 각 Computer의 RTC (Real time clock) 정보는 CMOS (BIOS와 거의 비슷한 의미이나 약간 다름)에 포함되어 있는데, 해당 정보는 Computer 전원이 없을 때, 메인보드의 수은 전지를 통해 유지됩니다. 그런데, 수은전지의 배터리가 시간이 지날수록 소모되면 시간의 오차가 발생하게 되는 것입니다.
[시간 오차는 문제?]
'시간 오차' 자체는 문제가 안된다고 볼 수 있습니다. 왜냐하면 작업자가 어떤 의도를 갖고 임의 조정한 것이 아니고, 오차 자체도 갑자기 특정 시점에 10분, 20분 단위로 변동되지 않기 때문입니다. 다만, 시간 오차가 누적될 수록 최초 1,2분 오차에서 10분 가까이 오차가 발생하는 시점까지 아무런 조치를 하지 않음으로써 발생하는 문제 (데이터 간 시간 역전 현상)로 인해 데이터의 완전성이 보증되지 않는 것이 더 문제가 됩니다.
[시간 동기화 기준?]
시간 동기화는 그럼 어떤 기준으로 어느 주기로 해야할까요?
시간 오차로 인해 데이터간 시간 역전이 일어나지 않을 정도의 가능성 수준에서 기준과 주기를 정하면 문제가 없습니다.
예전에 '2분이상의 오차 발생 시' vs. '5분 이상의 오차 발생 시'에 대해 의견을 주고받았던 적이 있고, 당시에는 tight 하게 2분 이상 초과 오차 시에는 시간 동기화를 수행을 원했지만, 5분 이상 오차를 허용할 수 없는 이유에 대한 부분도 딱히 설명하기가 어려운 점이 있었습니다. 1분 오차는 괜찮고, 5분 오차는 안 된다? 를 명확히 설명할 기준이나 규정은 없기 때문입니다. Risk 발생 가능성을 기준으로 평가하더라도 5분 미만의 오차로 인한 데이터 기록 시간 역전이 얼마나 많이 발생하고, 어느 정도로 영향이 클지를 기술하는 것도 쉽지 않습니다. (그냥 막연히 5분은 너무 길다는 생각이 당시에는 있었습니다)
주기에 대해서도 매달/분기/연간 정도에서 결정하거나, 데이터의 시간 기록이 중요한 장비/시스템이라면 매 장비 사용 시 마다 시간 오차를 확인하는 절차가 포함된 경우도 있었습니다. (장비의 사용빈도나 데이터의 중요도 측면에서 적절히 정하면 되지만, 반드시 해당 주기에 대한 결정 근거는 필요합니다)
[시간 동기화는 누가?]
대부분 시스템 및 어플리케이션 S/W는 운영체제의 시간을 기준으로 합니다. 따라서, 시간 틀어짐은 Windows 시간의 틀어짐을 조정해야 하는 것이며, 이를 위해서는 Windows 시간을 변경할 수 있는 권한자 (=administrator)가 필요합니다. Windows의 시간은 '날짜/시간 변경' 및 '시간대 변경'으로 변경가능하기 때문에 해당 변경은 일반 User에게 제한하는 것이 필요합니다.
Administrator는 해당 시스템을 운용하는 부서에서 권한을 갖지 못하기 때문에 보통은 제3의 부서 담당자가 진행하는 것이 일반적입니다. (i.e., IT 부서)
[시간 동기화 보다 중요한 것?]
시스템간 시간 오차가 있는 것은 눈에 띄기 쉽고, DI에 대한 다른 의심이나 지적으로 이어지는 경우가 더러 있기 때문에 보이는 측면에서 관리가 필요한 것은 맞습니다. 하지만, 더 중요한 것들 (특히, 개선에 시간이 오래 걸리는 것들)이 많기 때문에 어떤 것을 우선해야 할지를 잘 고민해 봐야겠습니다.
어떤 것이 중요할지 파악하려면, 데이터의 전체 흐름을 그리고 각 과정에서 현재 절차상 DI 위험 level 이 높은 지점을 찾는 방법이 있고, 원료 입고 부터 생산 공정 및 품질 시험, 출하 절차 process에서의 데이터 흐름이나 단위를 줄여 QC 분석 시험 process 과정에서의 데이터 흐름을 그려서 평가해 보는 방법이 있겠습니다.
분석 샘플의 입고 (LIMS 데이터 입력 - 검토/승인 - 전송 - 보관) 부터 품질 시험 진행 (ELN 데이터 입력, 검토/승인, 변경 등), 기기 별 데이터 생성 및 가공, 보고, 보관 전반 과정에서 DI 위험 발생 가능성이 높은 (데이터 변경, 누락, 삭제) point를 찾아낼 수 있습니다. 이 과정에서 권한 부여의 문제나 작업자/사용자가 임의 행위를 할 수 있는 기능/상황이 있는 경우들을 종종 찾아낼 수 있다는 점에서 Flow 체크의 이점이 있습니다.
예전부터 생각했던 것이긴 한데, 시간이 자꾸 틀어지거나 빠르게 오차가 생기는 시스템을 시간 동기화 주기를 짧게 하는 것 보다는 시간 오차가 왜 빨리 생기는지 원인을 파악해서 문제를 해결하는 게 더 맞다고 생각합니다.
'데이터 완전성 (Data Integrity)' 카테고리의 다른 글
SK바이오사이언스 DI 강연 summary (icpi week 2024) (0) | 2024.04.29 |
---|---|
Audit trail 기능이 없는 장비, 기기, 시스템 처리 방법 (0) | 2024.04.23 |
Windows 환경의 Data Integrity + Windows event viewer (2) | 2024.02.20 |
Audit trail 기록 점검, 검토하는 방법 (1) | 2023.12.21 |
데이터완전성 위험평가 방법은? (1) | 2023.12.18 |
댓글