728x90
개요
머신러닝(Machine Learning)은 인공지능의 한 분야로, 명시적 프로그램 없이 학습하여 특정 작업을 수행하도록 하는 기술입니다. 데이터를 사용하여 모델을 학습시키고, 그 모델을 통해 예측이나 분류와 같은 작업을 수행합니다.
용어
- 특징(Feature): 각각의 아이템을 설명하기 위한 구분 가능한 특성 또는 특징의 개수
- 데이터(Data): 문서, 사진, 음성, 영상 등
- 특징 벡터(Feature Vector): 어떤 대상을 표현하는 특징으로 구성된 n차원의 벡터
- 특징 추출(Feature Extraction): 학습을 위해 특징을 추출하는 과정
- 학습 셋(Training Set): 학습용 데이터 셋
학습
- 지도 학습(Supervised Learning): 지정된 클래스를 사용하여 모델을 학습
- 비지도 학습(Unsupervised Learning): 지정된 클래스 없이 학습
- 반지도 학습(Semi-supervised Learning): 소량의 클래스를 사용하여 모델을 학습
- 강화 학습(Reinforcement Learning): 에이전트와 환경 간 상호작용을 통한 보상을 통해 행동 전략을 학습
흐름도
아래 흐름도는 머신러닝의 지도 학습 과정을 표현합니다.

적용 분야
- 분류(Classification): 데이터로부터 클래스를 예측
- 군집(Clustering): 데이터로부터 의미 있는 그룹을 분류
- 회귀(Regression): 데이터 분석을 통해 값을 예측
데이터 셋 구성
- Training Set: 모델 훈련에 사용하는 데이터 셋
- Validation Set: 모델 훈련에 적합한 지점을 파악하기 위해 사용하는 데이터셋으로 과적합(Over Fitting) 또는 과소적합(Under Fitting)을 방지하기 위한 Stopping Point를 찾음
- Test Set: 모델의 성능을 평가하기 위한 데이터 셋

성능평가
- Confusion Matrix: 모델 성능을 통계적 수치로 시각화하는 방법
- 정확도(Accuracy): 모델이 정확하게 분류 또는 예측하는 비율
- 정밀도(Precision): 모델이 검출한 데이터 중 올바르게 검출된 데이터의 비율
- Recall: 실제 해당 데이터 중 모델이 올바르게 검출한 데이터의 비율
- F-Measure: Precision과 Recall을 통합해 나타낸 정확도
- ROC Curve: 민감도와 특이도 간 관계를 파악할 수 있는 그래프
- Root Mean Squared Error: 모델 예측 값의 오차 계산
728x90
'AI & GPU' 카테고리의 다른 글
NCCL (0) | 2025.04.02 |
---|---|
머신러닝에서 요구하는 선형대수학 02 - 벡터 연산 (0) | 2025.03.29 |
분산학습 (Distributed Learning) (0) | 2025.03.28 |
머신러닝에서 요구하는 선형대수학 01 (1) | 2025.03.28 |
머신러닝 모델 성능평가 (0) | 2025.03.28 |