ai competition

첫번째 Ai Competition 마무리

2주간의 짧은 시간이었지만, 계속 밤을 샜던지라 4주와도 같았던 시간이었다. 그 동안 시도했던 내용들, 다른 사람들이 사용했던 방법들을 정리해봤다. 최종 결과물 실험을 위해 구현했던 개인 코드: https://github.com/naem1023/boostcamp-pstage-image 내가 만든 모델을 통해 5위를 한 것도 너무 좋았고 그 과정에서 팀원들과 밤새면서 함께 코딩하고 실험했던 경험들이 소중했다. 교외에서 한번도
Sungho Park

마지막 점수 올리기

대회 막바지에 점수를 올리기 위해 사용했던 기법들이다. 극적인 성능 향상은 아니고 점수 굳히기 느낌이었다. TTA(Test time augmentation) ref: https://chacha95.github.io/2021-06-26-data-augmentation2/ 확정된 모델이 존재할 때 사용할 수 있는 방법이다. 확정된 모델에 대해 각종 augmentation이 적용된 이미지를 개별적으로 넣어서 나온 출력을 ensemble하는 방법론이다. ![](/assets/images/마지막 점수 올리기/
Sungho Park

CutMix vertical

CutMix 본래 cutmix는 랜덤하게 이미지 패치를 샘플링한다. 해당 방식이 마스크 이미지에선느 썩 효과적이지 못할 수도 있다. 마스크를 착용여부, 성별, 나이를 알기 위해서는 얼굴만 detection해서 patch를 하는것이 가장 효과적일 것이다. 따라서 랜덤하게 패치하고자한다면, 얼굴 영역 내에서 해야한다. 하지만 얼굴 detection을 하기 위해서는 또다른 수고가 들어간다... 막막하다. 찾아보니 다른 분들은 cutmix를 vertical하게
Sungho Park

Some tips

Data Generation Data feeding Data feeding을 잘해보자. ![](/assets/images/Data Generation/ba02679f-71ab-49da-800f-2b178061cab7-image.png) 가령, 위처럼 코딩해놨다고 하자. 두 코드 모두 비효율적이다. 첫번째는 generator의 속도가 model보다 느리기 때문에 model이 제 성능을 내지 못한다. 두번째는 model의 속도가 generator보다 느리기 때문에 generator가 제 성능을 내지 못한다. 다만, 보통 model의 성능이라하면 gpu의 성능을 의미하게
Sungho Park

Preprocessing

Preprocessing bounding box 필요 이상의 정보를 거르자. 문제는 보통 그냥 이미지만 덜렁 주어진다는 것이다. 개발자가 알아서 적절한 방법을 찾아야한다. 수업 때 배웠던 YOLO를 써도되고, 대부분 이미지 중앙에 마스크 사진이 있으니 중앙crop만 해도 되고... 이것저것 해봐야겠다. Resize 원본 크기로 계산하면 좋겠지만 이미지의 w, h, channel을 고려하면 정보의 양은 매우 크다. 즉,
Sungho Park