어느 모델을 사용할 것인가에 따라 데이터셋의 annotation 포맷을 변경해줘야 한다.

예를 들어 YOLO 모델을 사용하여 학습이나 추론을 진행할 경우, 데이터셋이 PASCAL VOC 혹은 MS COCO 데이터셋 포맷이라면 각각 xml과 json 파일을 파싱하여 YOLO 포맷에 맞게 txt 파일을 생성해줘야 한다.

 

MS COCO

  • ImageNet 데이터셋의 문제점을 해결하기 위해 2014년 제안
  • ImageNet 데이터셋의 문제점
  1. 이미지 내 object가 큼
  2. object가 중앙에 위치한 경우가 많음
  3. 이미지당 object 수가 적음
  • classification, object detection, semantic segmentation, instance segmentation, pose estimation
  • 타 데이터셋에 비해 난이도가 높음
  • 80개의 Object Category, (30만 개의 image, 하나의 image에 평균 5개의 object들로 구성)
  • JSON Format
  • Train(118,000장), Validation(5,000장), Test(41,000장)

[이미지 출처 : https://velog.io/@tataki26/%EC%BD%94%EB%93%9C%EC%9E%87-whooarx7]

 

PASCAL VOC

  • PASCAL VOC challenge에서 쓰이던 데이터셋
  • PASCAL 2007과 PASCAL 2012 데이터셋이 주로 사용됨
  • 현재는 벤치마크용으로만 사용되며, 학습용으론 잘 쓰이지 않음
  • Classification, Object detection, Semantic segmentation, Action detection
  • 20개의 Object Category, (이미지 갯수 11,000개, 이미지당 평균 object 수: 2.4개)
  • XML Format
  • 개별 xml 파일은 한 개의 image에 대한 Annotation 정보를 가짐 (확장자 xml을 제외한 파일명은 image 파일명과 동일하게 매핑)

[이미지 출처 : https://daebaq27.tistory.com/52]

 

YOLO

  • YOLO 포맷은 각 이미지 파일마다 같은 파일명의 txt 파일로 라벨이 저장되어 있음 (같은 디렉토리에 저장)

 

반응형

+ Recent posts