
개요SMOTE(Synthetic Minority Over-sampling Technique)는 불균형한 데이터셋에서 소수 클래스(Minority Class)의 데이터를 인공적으로 생성하여 데이터의 균형을 맞추는 대표적인 오버샘플링(Oversampling) 기법입니다. 기존의 단순 오버샘플링이 소수 클래스 데이터를 단순 복제하는 방식이라 과적합(Overfitting) 위험이 높았다면, SMOTE는 새로운 데이터를 합성하여 이 문제를 완화합니다. 내용SMOTE는 소수 클래스 데이터 중 임의의 샘플을 하나 선택 후, 해당 데이터의 K개의 최근접 이웃(KNN)을 찾습니다. 그 다음 선택한 샘플과 이웃 샘플을 선분으로 연결하고, 이 선분 위에 임의의 위치를 선택해 새로운 데이터를 생성합니다. 새롭게 생성되는 샘..