본문 바로가기
theory 📓/딥러닝

Unsupervised learning

by 고돌한 데이터 사이언스 2024. 11. 6.
반응형

비지도 학습(Unsupervised Learning)

  • 비지도 학습은 라벨이 없는 데이터를 기반으로 데이터를 구조적으로 이해하는 방법입니다. 주요 목표는 데이터 내의 유사성이나 패턴을 찾는 것입니다.
  • 주요 예시로는 클러스터링(Clustering), 차원 축소(Dimensionality Reduction), 특성 학습(Feature Learning) 등이 있습니다.

차원 축소 기법: PCA LDA

  • PCA(Principal Component Analysis): 주성분 분석을 통해 데이터의 차원을 줄이며, 가장 큰 분산을 가진 방향으로 데이터를 투영합니다.
  • LDA(Linear Discriminant Analysis): 지도 학습 방법으로, 클래스 간 분리를 최적화하도록 데이터를 투영합니다.

클러스터링(Clustering)

  • K-평균(K-means): 데이터를 K개의 클러스터로 나누는 방법으로, 각 클러스터는 중심점을 기준으로 구성됩니다.
  • 계층적 클러스터링(Hierarchical Clustering): 데이터 포인트를 bottom-up 방식으로 군집화하는 방식으로, 덴드로그램을 통해 시각화할 수 있습니다.
  • 밀도 기반 클러스터링(DBSCAN): 밀도가 높은 영역을 클러스터로 간주하며, 밀도 경계에 있지 않은 데이터 포인트는 노이즈로 분류됩니다.

오토인코더(Autoencoder)

  • 입력 데이터를 압축하고 복원하는 비지도 학습 모델로, 차원 축소 및 노이즈 제거에 활용됩니다.
  • Denoising AE: 입력 데이터에 노이즈를 추가하여 복원하며, 더 강력한 데이터 표현을 학습합니다.
  • Stacked AE: 여러 오토인코더 층을 쌓아 특성 표현력을 향상시키고, 준지도 학습에도 활용됩니다.

 

예제)

1.True/False: 비지도 학습에서는 데이터에 라벨이 존재하지 않기 때문에, 데이터의 숨겨진 구조를 학습하는 데 중점을 둔다.

  • 정답: True. 비지도 학습은 데이터의 패턴과 구조를 파악하는 것이 목표입니다.

2. 차원 축소에서 PCA LDA의 주요 차이점은 무엇인가요?

  • 정답: PCA는 비지도 학습으로 최대 분산 방향을 찾고, LDA는 지도 학습으로 클래스 간 분리를 최적화합니다.

3. K-평균(K-means) 알고리즘의 과정 중, 초기화한 중심점(Centroid)을 계속 업데이트하는 이유는 무엇인가요?

  • 정답: 각 데이터 포인트가 가장 가까운 중심점에 할당될 수 있도록 최적의 중심점을 찾기 위해서입니다.

4. DBSCAN 클러스터링에서 노이즈 포인트란 무엇인가요?

  • 정답: 특정 반경 내에 충분한 이웃 포인트가 없어 클러스터에 속하지 않는 포인트를 노이즈 포인트로 간주합니다.

5. True/False: 오토인코더는 데이터의 차원 축소 및 복원에 사용되는 비지도 학습 모델이다.

  • 정답: True. 오토인코더는 데이터의 중요한 특징을 압축하고 복원하는 데 사용됩니다.

6. PCA의 주요 목표는 무엇인가요?

  • 정답: 데이터의 분산을 최대로 하는 방향으로 데이터를 투영하여 차원을 축소하는 것입니다.

7. True/False: K-means 클러스터링은 각 데이터가 하나의 클러스터에만 속하도록 강제하는 하드 클러스터링 기법이다.

  • 정답: True. K-means는 각 데이터가 하나의 클러스터에 속하게 합니다.

8. K-means++ 알고리즘의 장점은 무엇인가요?

  • 정답: 초기 중심점을 최적화하여 K-means의 성능을 높이고, 무작위 초기화의 영향을 줄이는 데 도움이 됩니다.

9. Autoencoder Denoising AE로 확장될 때 추가되는 기능은 무엇인가요?

  • 정답: 입력 데이터에 노이즈를 추가하여 복원 학습을 통해 더 강력한 표현을 학습합니다.

10. Stacked Autoencoder는 일반 오토인코더와 어떤 차이가 있나요?

  • 정답: 여러 층의 오토인코더를 쌓아 더 복잡한 특성을 학습하며, 준지도 학습에 활용할 수 있습니다.
반응형

'theory 📓 > 딥러닝' 카테고리의 다른 글

CNN Applications  (0) 2024.11.06
CNN  (0) 2024.11.06
Hyperparameter tuning  (0) 2024.11.06
Setup and regularization  (0) 2024.11.06
Deep neural network  (0) 2024.11.06

댓글