본문 바로가기
theory 📓/딥러닝

CNN Applications

by 고돌한 데이터 사이언스 2024. 11. 6.
반응형
  1. 객체 탐지(Object Detection)
    • YOLO (You Only Look Once): 하나의 CNN을 통해 실시간 객체 탐지를 수행하는 방법으로, 이미지 전체를 그리드로 나누고 각 그리드 셀마다 객체의 존재 여부와 바운딩 박스를 예측합니다.
    • R-CNN, Fast R-CNN, Faster R-CNN: R-CNN 시리즈는 객체 탐지를 위해 지역 제안 방법(Region Proposal)을 사용하며, Faster R-CNN은 지역 제안 네트워크(RPN)를 추가해 속도를 개선했습니다.
  2. 세그멘테이션(Segmentation)
    • Semantic Segmentation: 이미지의 각 픽셀을 특정 클래스에 할당합니다. Fully Convolutional Network (FCN) 등으로 구현되며, 다이얼레이션 컨볼루션(Dilated Convolution) 등을 통해 세밀한 픽셀 수준 예측을 수행합니다.
    • Instance Segmentation: 같은 클래스 내에서도 각 객체를 개별적으로 분리하는 기법으로, Mask R-CNN이 대표적인 모델입니다.
    • Panoptic Segmentation: Semantic과 Instance Segmentation을 결합하여 각 픽셀을 정확한 객체나 배경으로 분류합니다.
  3. 초해상도(Super-Resolution)
    • 저해상도 이미지를 고해상도로 복원하는 기술로, SRCNN, VDSR, SRGAN 등이 대표적입니다. 특히 SRGAN은 고화질 복원을 위해 생성적 적대 신경망(GAN)을 활용합니다.
  4. 자기지도 학습(Self-Supervised Learning)
    • 퍼즐 맞추기(Jigsaw Puzzle), 색상화(Colorization) 등의 사전 작업을 통해 레이블 없이도 유용한 특징 표현을 학습할 수 있습니다.
    • 대조 학습(Contrastive Learning): 서로 다른 샘플 간의 차이를 학습하여 더욱 일반화된 표현을 얻습니다.

예제)

  1. True/False: YOLO는 객체 탐지를 위해 이미지를 작은 그리드 셀로 나누고, 각 셀이 객체 존재 여부를 예측합니다.
    • 정답: True. YOLO는 각 그리드 셀마다 객체의 존재와 위치를 예측하는 방식입니다.
  2. R-CNN에서 Faster R-CNN으로 발전하면서 추가된 주요 구성 요소는 무엇인가요?
    • 정답: 지역 제안 네트워크(Region Proposal Network, RPN)로 객체의 후보 영역을 예측합니다.
  3. Semantic Segmentation과 Instance Segmentation의 주요 차이점은 무엇인가요?
    • 정답: Semantic Segmentation은 픽셀을 클래스에 할당하고, Instance Segmentation은 동일 클래스 내에서도 각 객체를 분리합니다.
  4. True/False: Mask R-CNN은 Instance Segmentation을 위해 분류와 분할을 동시에 수행합니다.
    • 정답: True. Mask R-CNN은 객체의 위치와 클래스를 예측하면서 마스크도 생성합니다.
  5. SRCNN, VDSR, SRGAN과 관련된 응용 분야는 무엇인가요?
    • 정답: 초해상도(Super-Resolution)입니다. 저해상도 이미지를 고해상도로 변환하는 기술입니다.
  6. Self-Supervised Learning에서 Jigsaw Puzzle 사전 작업의 목적은 무엇인가요?
    • 정답: 라벨 없이도 이미지를 조각 맞추기 과제를 통해 유용한 특징 표현을 학습하기 위함입니다.
  7. True/False: 대조 학습(Contrastive Learning)은 샘플 간의 유사성과 차이를 학습하여 일반화된 표현을 얻습니다.
    • 정답: True. 대조 학습은 유사한 샘플은 가깝게, 다른 샘플은 멀게 학습하는 방식입니다.
  8. YOLO 모델에서 Non-Max Suppression의 역할은 무엇인가요?
    • 정답: 중복된 바운딩 박스를 제거하여 최종 예측을 정리합니다.
  9. 딥러닝 기반 초해상도 모델이 해결하고자 하는 주요 문제는 무엇인가요?
    • 정답: 저해상도 이미지의 세부 정보를 복원하여 고해상도로 변환하는 것입니다.
  10. Panoptic Segmentation이 해결하려는 과제는 무엇인가요?
    • 정답: 이미지에서 객체와 배경을 모두 정확하게 분할하여, 픽셀마다 객체나 배경으로 구분하는 것입니다.

이 요약과 예시 문제들은 CNN 응용 분야의 주요 개념을 이해하고 시험 대비에 큰 도움이 될 것입니다.

반응형

'theory 📓 > 딥러닝' 카테고리의 다른 글

Graph Node / GNN / GCN  (0) 2024.11.08
Self Attention / Transformer / Decoding  (2) 2024.11.08
CNN  (0) 2024.11.06
Unsupervised learning  (0) 2024.11.06
Hyperparameter tuning  (0) 2024.11.06

댓글