AI & GPU

머신러닝 개요

Tech Crunchy 2025. 3. 28. 01:41
728x90

개요

머신러닝(Machine Learning)은 인공지능의 한 분야로, 명시적 프로그램 없이 학습하여 특정 작업을 수행하도록 하는 기술입니다. 데이터를 사용하여 모델을 학습시키고, 그 모델을 통해 예측이나 분류와 같은 작업을 수행합니다.

 

용어

  • 특징(Feature): 각각의 아이템을 설명하기 위한 구분 가능한 특성 또는 특징의 개수
  • 데이터(Data): 문서, 사진, 음성, 영상 등
  • 특징 벡터(Feature Vector): 어떤 대상을 표현하는 특징으로 구성된 n차원의 벡터
  • 특징 추출(Feature Extraction): 학습을 위해 특징을 추출하는 과정
  • 학습 셋(Training Set): 학습용 데이터 셋

 

학습

  • 지도 학습(Supervised Learning): 지정된 클래스를 사용하여 모델을 학습
  • 비지도 학습(Unsupervised Learning): 지정된 클래스 없이 학습
  • 반지도 학습(Semi-supervised Learning): 소량의 클래스를 사용하여 모델을 학습
  • 강화 학습(Reinforcement Learning): 에이전트와 환경 간 상호작용을 통한 보상을 통해 행동 전략을 학습

 

흐름도

아래 흐름도는 머신러닝의 지도 학습 과정을 표현합니다.

 

적용 분야

  • 분류(Classification): 데이터로부터 클래스를 예측
  • 군집(Clustering): 데이터로부터 의미 있는 그룹을 분류
  • 회귀(Regression): 데이터 분석을 통해 값을 예측

 

데이터 셋 구성

  • Training Set: 모델 훈련에 사용하는 데이터 셋
  • Validation Set: 모델 훈련에 적합한 지점을 파악하기 위해 사용하는 데이터셋으로 과적합(Over Fitting) 또는 과소적합(Under Fitting)을 방지하기 위한 Stopping Point를 찾음
  • Test Set: 모델의 성능을 평가하기 위한 데이터 셋

성능평가

  • Confusion Matrix: 모델 성능을 통계적 수치로 시각화하는 방법
  • 정확도(Accuracy): 모델이 정확하게 분류 또는 예측하는 비율
  • 정밀도(Precision): 모델이 검출한 데이터 중 올바르게 검출된 데이터의 비율
  • Recall: 실제 해당 데이터 중 모델이 올바르게 검출한 데이터의 비율
  • F-Measure: Precision과 Recall을 통합해 나타낸 정확도
  • ROC Curve: 민감도와 특이도 간 관계를 파악할 수 있는 그래프
  • Root Mean Squared Error: 모델 예측 값의 오차 계산
728x90