Image Annotation Formats :: 누구나 쉽게, 인공지능

Image Annotation Formats

2021. 12. 2. 01:13

어느 모델을 사용할 것인가에 따라 데이터셋의 annotation 포맷을 변경해줘야 한다.

예를 들어 YOLO 모델을 사용하여 학습이나 추론을 진행할 경우, 데이터셋이 PASCAL VOC 혹은 MS COCO 데이터셋 포맷이라면 각각 xml과 json 파일을 파싱하여 YOLO 포맷에 맞게 txt 파일을 생성해줘야 한다.

MS COCO

ImageNet 데이터셋의 문제점을 해결하기 위해 2014년 제안
ImageNet 데이터셋의 문제점

이미지 내 object가 큼
object가 중앙에 위치한 경우가 많음
이미지당 object 수가 적음

classification, object detection, semantic segmentation, instance segmentation, pose estimation
타 데이터셋에 비해 난이도가 높음
80개의 Object Category, (30만 개의 image, 하나의 image에 평균 5개의 object들로 구성)
JSON Format
Train(118,000장), Validation(5,000장), Test(41,000장)

[이미지 출처 : https://velog.io/@tataki26/%EC%BD%94%EB%93%9C%EC%9E%87-whooarx7]

PASCAL VOC

PASCAL VOC challenge에서 쓰이던 데이터셋
PASCAL 2007과 PASCAL 2012 데이터셋이 주로 사용됨
현재는 벤치마크용으로만 사용되며, 학습용으론 잘 쓰이지 않음
Classification, Object detection, Semantic segmentation, Action detection
20개의 Object Category, (이미지 갯수 11,000개, 이미지당 평균 object 수: 2.4개)
XML Format
개별 xml 파일은 한 개의 image에 대한 Annotation 정보를 가짐 (확장자 xml을 제외한 파일명은 image 파일명과 동일하게 매핑)

[이미지 출처 : https://daebaq27.tistory.com/52]

YOLO

YOLO 포맷은 각 이미지 파일마다 같은 파일명의 txt 파일로 라벨이 저장되어 있음 (같은 디렉토리에 저장)

저작자표시 비영리 변경금지

'머신러닝_딥러닝 > Tensorflow + Keras' 카테고리의 다른 글

GPU 서버, 사용 방법 (0)	2021.11.27
(Tensorflow 2.x) LSTM 연습 1탄 (테슬라 주가 예측) (0)	2021.11.14
(Tensorflow 2.x) LSTM & GRU (0)	2021.11.14
(Tensorflow 2.x) RNN (0)	2021.11.14
(Tensorflow 2.x) 커스텀 Loss function (0)	2021.11.14

+ Recent posts

Powered by Tistory, Designed by wallel

티스토리툴바