STEP1. [SUMMARY_LINK]
- 개최, 설명회, 예선, 본선,결과에 대한 일정요약
STEP2. [개인정보_비식별]
- 개인정보 비식별 조치(ARX, R 이용)
- 원본데이터 - 사용목적, 데이터속성 분석, 속성별 상관관계, 이상치 수정 및 제거
- 정제데이터 - 속성별 데이터 분석(대푯값), 유용성 및 상관관계 비교
- 비식별화 - 개인정보 속성평가(ID,QI,SA,NSA), 비식별방안수립, 비식별화(K,L,T)
- 비식별데이터 평가 - 속성별 데이터 분석(대푯값), 유용성 및 상관관계 비교, 준식별 조합에 대한 유일성 평가
- 재식별 위험도 측정, 분산 위험도 측정
STEP3. [개인정보_원본추정]
- 개인정보 원본추정(ARX, R, Python 이용)
- 비식별데이터 분류 및 분석, 비식별 기술 추정 및 결정
- 원본 데이터 비식별 기술 적용, QI식별자 설정 후 동질집합 분류, 원본과 비식별 유사도 측정
- 유사도 측정 알고리즘 -> Jaccard similarity, Euclidean distance 알고리즘
- 유사도를 기반으로 원본 추정(Key Matching), 원본 추정률 결정
- 원본추정 방지 제언