전체 글 69

Week13 주간 학습정리 - [Semantic Segmentation 강의 정리]

📌 의료쪽에서 Unet이 많이 사용되는 이유의료 분야에서 U-Net이 많이 사용되는 이유는 주로 의료 영상의 특성과 U-Net의 구조적 특징이 잘 맞아떨어지기 때문.1. Segmentation에 최적화된 구조의료 영상 데이터는 주로 픽셀 단위로 정밀한 분할(Segmentation)이 필요합니다. 예를 들어, CT, MRI, X-ray 이미지에서 특정 장기, 병변, 또는 뼈 구조를 정확히 추출해야 합니다.U-Net은 엔코더-디코더 구조로 되어 있어, 이미지를 압축(Downsampling)한 후 다시 복원(Upampling)하며 세부 정보를 보존할 수 있습니다.2. 스킵 연결(Skip Connection)U-Net의 주요 특징은 스킵 연결입니다. 이는 엔코더에서 추출된 저수준(low-level) 특징을 디..

Week12 주간 학습정리 - [Data-Centric CV 대회 후 회고]

📌 DATA Relabeling오픈 데이터 가져와서 우리의 가이드라인에 맞게 annotation 구분선 같은거 annotation 다해서 구분선 있는 데이터 더 많이 해서 학습하는 방법도 있긴함..CVAT, Roboflow로 annotation을 수정할 수 있음을 직접 경험함.Roboflow로 직접 Relabeling 작업을 했고 Relabel 된 데이터를 가지고 학습했을 때 성능 향상이 있어서 데이터 quality가 중요함을 다시 몸소 깨달았고 성취감도 있었다.📌 Model vs Data실무에서는 data centric이 중요하다~!sample level analysis 가 중요하다.📌 아쉬운 점github 협업을 다음 프로젝트 부터는 좀 더 체계적으로 해야 겠다.슬랙과 github, notion..

Week11 주간 학습정리 - [Data-Centric CV 내용 정리]

📌 데이터 저작권github copilot → copilot 이 학습 데이터로 사용한 코드 데이터 중 저작권에 문제가 되는 자료가 있을 수도.데이터를 사용할 때 주의해야 함. 저작권.데이터 수집 단계부터 조심해야 함.📌 DATA Flywheel기업의 입장에서 서비스를 하다 보면 데이터가 지속적으로 쌓임 → 이 데이터를 모델의 학습 데이터로 가공하고 모델에게 계속 추가 학습을 진행하면서 자연스럽게 모델의 성능 UP데이터를 기반으로 모델과 상호작용을 하면서 여러 iteration하면서 모델과 데이터 둘 다 Quality가 좋아지도록 하는 것이 data flywheel⇒ 이게 data centric ai 를 real world(실무)에 적용했을 때 가장 대표적인 형태 📌 데이터의 양과 Quality + ..

Week10 주간 학습정리 - [CV level 2 대회 완료 후 회고]

📌 일단 대회를 진행하며 느낀 점들을 블로그에 남긴다. 대회에서 시도했던 가설, 실험(가설 검증) 등은 Github, Notion, Wrap up report에 기록해 두었다.📌 실험 공유저번 대회처럼 Notion으로 실험 공유를 다들 열심히 잘 해주었다. wandb를 이번 대회부터 처음 적용해보았는데 확실히 실험 공유도 잘 되고 모델 성능도 다같이 편리하게 볼 수 있어서 정말 좋았다. wandb는 이제 없으면 안 될 것 같다..나중에 필요하다면 유료 결제를 해서라도 사용할 것 같다...팀 안에서 각자 실험했을 때 유의미한 결과를 도출했다고 생각하는 실험들을 Github에 실험에 맞는 브랜치 명을 만들고 빠르게 Commit을 해서 다른 팀원들도 그 실험을 자신의 모델에 적용해 볼 수 있었다는 점이 좋..

Week9 주간 학습정리 - [CV level 2 대회 진행 중]

📌Competition tip  1. mAP를 제대로 이해해서 활용해보자!! → 일반적으로 시각화를 위해서는 bbox threshold를 높게 준다→ 시각화를 할 bbox는 class score가 0.5이상인 애들만 그려라→ 깔끔하게 그려짐 → thres를 낮게 하면 거의 모든 박스를 다 그림→ map가 높음→ 좋은건가..→ 대회 성능을 높이는 데는 좋지만 실제 서비스에는 thres가 낮은게 좋을수도 있지 않나.. ⇒ map의 중요한 성질→ recall, precision을 그래프에 찍었을 때 그 아랫면적을 AP로 계산→ 이 말은 곧 RECALL이 무조건 1에 가까울수록 추가적인 성능 향상이 존재한다.→ 박스를 100개 예측하든 1000개 하든 만 개 하든 박스의 개수에 따라서는 AP의 성능이 증가 되..

Week8 주간 학습정리 - [CV level 2 대회 시작]

📌 학습 정리  1. Object Detection IN Real Time object detection은 real world와 많이 맞닿아 있기 때문에 real time 으로 구현(detection)하는 것을 중요시함.→ 성능도 중요하지만 속도도 중요하다~ 2. TP, TN,..→ 이렇게 있을 때 뒤에 붙은 부분을 모델의 예측이라고 보면 됨→ positive라고 예측한게 true 구나~ 맞구나~ → negative로 예측한게 맞구나~ 정답도 negative구나~  3. precision & recall  precision → 예측 관점recall → 정답 관점  4. AP(average precision) AP(average precision)→ pr curve 그리고 난 뒤의 아랫면적→ 그래서 최소..

Week7 주간 학습정리 - [CV level 1 대회 정리]

📌 학습 정리  1. RandomSeed 고정→ RandomSeed를 고정해야 Data Augmentation 등을 하고 나서 데이터를 다시 재현할 수 있다?2. confusion matrix다음 대회에서는 confusion matrix 사용해서 최종 결과 앙상블 할 때 어떤 모델이 어떤 데이터? 어떤 부분?을 잘 못 맞췄는지 3.  Sketch-Specific Data Augmentation for Freehand Sketch Recognition 위 논문에서 나온 BPD, MSR 기법이 스케치 이미지 데이터에 특화된 Data Augmentation 기법이라서 꼭 적용해보고 싶었다.특히 BPD의 경우에는 따로 데이터 학습이 필요없는 수학적으로 Data Augmentation을 하는 기법이라서 수학과 ..

Week6 주간 학습정리 - [CV 기초 프로젝트]

개념/code 학습 중 생긴 이슈 및 해결 방법에 대해 기록하자 개념 Issue & Solution1. 이미지의 다양한 channel투명성 판단 추가 : RGBACMYK : 인쇄물 표현모니터 표현 → 보통 RGB  위성 사진의 경우에는 10개 Channel 까지도..의학 mri ct 같은 사진, 위성 사진 등은 → 가로 세로 3 의 형태가 아닐 확률이 높음→ 이럴 때도 당황 x → 원하는 형태로 바꿀 수 있어야 함~~~이미지 데이터의 10%정도는 직접 눈으로 확인하는 습관~~~~  2. Histogram Smoothing→ 사람이 보는 것처럼 데이터도(AI? 모델?도?) 마찬가지로 구분되는 데이터를 훨씬 좋아한다~~→ GRAY 스케일에서 주로 사용→ 우리 대회도 스케치 이미지니까 이 방법도 사용하면 좋을..

Week5 주간 학습정리 - [CV 이론]

개념/code 학습 중 생긴 이슈 및 해결 방법에 대해 기록하자 개념 Issue & Solution1. Zero shot & Few shot.. Zero-shot learning (ZSL)은 모델이 학습 과정에서 본 적 없는 새로운 클래스를 인식할 수 있도록 하는 학습 방법일반적으로 딥러닝은 training에 사용된 class만을 예측할 수 있다. 따라서 unseen data가 입력되면 seen class로 예측하는 바보가 되버리는데, Zero shot은 train set에 포함되지 않은 unseen class를 예측하는 분야즉, unseen data를 입력 받아도, seen data로 학습된 지식을 전이하여 unseen data를 unseen class로 예측 가능open set recognition은..

Week4 주간 학습정리 - [CV 이론]

추후 할 것 : 강의에 나오는 많은 논문 중에 재밌어 보이는 (관심이 가는) 논문 정해서 깊게 공부 후 블로그에 정리하기  개념/code 학습 중 생긴 이슈 및 해결 방법에 대해 기록하자개념 Issue & Solution1. PyTorch에서 이미지 ShapePyTorch에서 이미지 텐서는 (C, H, W) 형식으로 나타남.C: 채널 수 (예: RGB 이미지의 경우 3)H: 높이 (Height)W: 너비 (Width)이와 반대로, PIL 이미지나 대부분의 넘파이 배열에서는 이미지 데이터가 (H, W, C) 형식으로 저장됨.  PyTorch는 텐서에서 (C, H, W) 순서를 사용하고, TensorFlow와 Keras는 (H, W, C) 순서를 사용. 2. PyTorch에서 사용하는 표준적인 이미지 데이..