Naver AI Tech 7기 8

Week9 주간 학습정리 - [CV level 2 대회 진행 중]

📌Competition tip  1. mAP를 제대로 이해해서 활용해보자!! → 일반적으로 시각화를 위해서는 bbox threshold를 높게 준다→ 시각화를 할 bbox는 class score가 0.5이상인 애들만 그려라→ 깔끔하게 그려짐 → thres를 낮게 하면 거의 모든 박스를 다 그림→ map가 높음→ 좋은건가..→ 대회 성능을 높이는 데는 좋지만 실제 서비스에는 thres가 낮은게 좋을수도 있지 않나.. ⇒ map의 중요한 성질→ recall, precision을 그래프에 찍었을 때 그 아랫면적을 AP로 계산→ 이 말은 곧 RECALL이 무조건 1에 가까울수록 추가적인 성능 향상이 존재한다.→ 박스를 100개 예측하든 1000개 하든 만 개 하든 박스의 개수에 따라서는 AP의 성능이 증가 되..

Week8 주간 학습정리 - [CV level 2 대회 시작]

📌 학습 정리  1. Object Detection IN Real Time object detection은 real world와 많이 맞닿아 있기 때문에 real time 으로 구현(detection)하는 것을 중요시함.→ 성능도 중요하지만 속도도 중요하다~ 2. TP, TN,..→ 이렇게 있을 때 뒤에 붙은 부분을 모델의 예측이라고 보면 됨→ positive라고 예측한게 true 구나~ 맞구나~ → negative로 예측한게 맞구나~ 정답도 negative구나~  3. precision & recall  precision → 예측 관점recall → 정답 관점  4. AP(average precision) AP(average precision)→ pr curve 그리고 난 뒤의 아랫면적→ 그래서 최소..

Week7 주간 학습정리 - [CV level 1 대회 정리]

📌 학습 정리  1. RandomSeed 고정→ RandomSeed를 고정해야 Data Augmentation 등을 하고 나서 데이터를 다시 재현할 수 있다?2. confusion matrix다음 대회에서는 confusion matrix 사용해서 최종 결과 앙상블 할 때 어떤 모델이 어떤 데이터? 어떤 부분?을 잘 못 맞췄는지 3.  Sketch-Specific Data Augmentation for Freehand Sketch Recognition 위 논문에서 나온 BPD, MSR 기법이 스케치 이미지 데이터에 특화된 Data Augmentation 기법이라서 꼭 적용해보고 싶었다.특히 BPD의 경우에는 따로 데이터 학습이 필요없는 수학적으로 Data Augmentation을 하는 기법이라서 수학과 ..

Week6 주간 학습정리 - [CV 기초 프로젝트]

개념/code 학습 중 생긴 이슈 및 해결 방법에 대해 기록하자 개념 Issue & Solution1. 이미지의 다양한 channel투명성 판단 추가 : RGBACMYK : 인쇄물 표현모니터 표현 → 보통 RGB  위성 사진의 경우에는 10개 Channel 까지도..의학 mri ct 같은 사진, 위성 사진 등은 → 가로 세로 3 의 형태가 아닐 확률이 높음→ 이럴 때도 당황 x → 원하는 형태로 바꿀 수 있어야 함~~~이미지 데이터의 10%정도는 직접 눈으로 확인하는 습관~~~~  2. Histogram Smoothing→ 사람이 보는 것처럼 데이터도(AI? 모델?도?) 마찬가지로 구분되는 데이터를 훨씬 좋아한다~~→ GRAY 스케일에서 주로 사용→ 우리 대회도 스케치 이미지니까 이 방법도 사용하면 좋을..

Week5 주간 학습정리 - [CV 이론]

개념/code 학습 중 생긴 이슈 및 해결 방법에 대해 기록하자 개념 Issue & Solution1. Zero shot & Few shot.. Zero-shot learning (ZSL)은 모델이 학습 과정에서 본 적 없는 새로운 클래스를 인식할 수 있도록 하는 학습 방법일반적으로 딥러닝은 training에 사용된 class만을 예측할 수 있다. 따라서 unseen data가 입력되면 seen class로 예측하는 바보가 되버리는데, Zero shot은 train set에 포함되지 않은 unseen class를 예측하는 분야즉, unseen data를 입력 받아도, seen data로 학습된 지식을 전이하여 unseen data를 unseen class로 예측 가능open set recognition은..

Week4 주간 학습정리 - [CV 이론]

추후 할 것 : 강의에 나오는 많은 논문 중에 재밌어 보이는 (관심이 가는) 논문 정해서 깊게 공부 후 블로그에 정리하기  개념/code 학습 중 생긴 이슈 및 해결 방법에 대해 기록하자개념 Issue & Solution1. PyTorch에서 이미지 ShapePyTorch에서 이미지 텐서는 (C, H, W) 형식으로 나타남.C: 채널 수 (예: RGB 이미지의 경우 3)H: 높이 (Height)W: 너비 (Width)이와 반대로, PIL 이미지나 대부분의 넘파이 배열에서는 이미지 데이터가 (H, W, C) 형식으로 저장됨.  PyTorch는 텐서에서 (C, H, W) 순서를 사용하고, TensorFlow와 Keras는 (H, W, C) 순서를 사용. 2. PyTorch에서 사용하는 표준적인 이미지 데이..

Week2 주간 학습정리 - [ML LifeCycle]

개념/code 학습 중 생긴 이슈 및 해결 방법에 대해 기록하자개념 Issue & Solution 1. 선형 회귀 '정규성' 가정Issue : 그래프 해석이 헷갈림정규성 : 회귀 모델의 잔차(residuals) or 오류가 정규 분포를 따르는지 확인잔차들이 정규 분포를 따를 경우, 점들이 대각선에 가깝게 위치 -> WHY?잔차 : 오차의 추정치 : residual ; 예측값과 실제 ground truth (실제 값) 의 차이시각화하는 방법 중 하나가 바로 Q-Q (Quantile-Quantile) 플롯Q-Q 플롯이란?Q-Q 플롯은 두 개의 확률 분포를 비교하는 그래프선형 회귀 분석에서는 보통 잔차의 분포를 정규 분포와 비교하기 위해 사용됨잔차가 정규 분포를 따른다면, Q-Q 플롯에서 점들이 대각선에 가까..

Week1 주간 학습정리 - [PyTorch]

개념/code 학습 중 생긴 이슈 및 해결 방법에 대해 기록하자개념 Issue & Solution1. 매개변수(parameter) vs 인자(argument)parameter는 함수 안에서의 정의 및 사용에 나열되어 있는 변수들을 의미. -> 변수(variable)argument는 함수를 호출할 때 전달되는 실제 값을 의미. -> 값(value)def add(a, b): return a + bnum1 = 5num2 = 4total = add(num1, num2)print(total) num1, num2 : argumenta, b : 매개변수(parameter)reference : https://brunch.co.kr/@njnamju/106i = torch.tensor([2, 3, 4], dtype ..