AI & GPU

데이터 익명화

Tech Crunchy 2025. 5. 4. 21:32
728x90

개요

데이터 익명화(Data Anonymization)는 데이터셋에서 개인을 식별할 수 있는 정보를 삭제하거나 변경하여, 특정 개인을 알아볼 수 없도록 처리하는 기술을 의미합니다. 데이터를 익명화 처리하여 추가 정보나 맥락이 주어져도 특정 개인과 연결될 수 없게 만드는 것이 목적입니다.

 

 

내용

데이터 익명화는 데이터에서 개인을 식별할 수 있는 정보를 완전히 제거하거나 변형하여, 특정 개인과 연결될 수 없도록 만드는 데이터 보호 기술입니다. 일반화, 마스킹, 삭제, 암호화 등 다양한 기법이 활용되며, 익명화된 데이터는 법적 규제 없이 폭넓게 활용될 수 있습니다.

  • 일반화: 데이터를 더 넓은 범위로 변환(예: 나이 27세 → 20~30세)
  • 데이터 마스킹: 민감 정보를 임의의 문자로 대체(예: 이름 → 'XXX')
  • 데이터 셔플링: 데이터의 순서를 무작위로 변경
  • 데이터 삭제: 직접 식별자를 완전히 삭제
  • 범주화: 연속형 데이터를 구간으로 묶음(예: 소득 3,000만원~4,000만원)
  • 노이즈: 데이터에 임의의 값을 더해 정확한 값을 숨김
  • 암호화: 단방향 해시 등으로 원본 데이터 복원 불가하게 변환
728x90

'AI & GPU' 카테고리의 다른 글

Pinned Memory  (0) 2025.05.06
드랍아웃  (1) 2025.05.06
RFE  (0) 2025.05.04
SMOTE  (0) 2025.05.04
슬라이딩 윈도우 메커니즘  (1) 2025.05.04