Naver AI Tech 7기/LEVEL2 6

Week13 주간 학습정리 - [Semantic Segmentation 강의 정리]

📌 의료쪽에서 Unet이 많이 사용되는 이유의료 분야에서 U-Net이 많이 사용되는 이유는 주로 의료 영상의 특성과 U-Net의 구조적 특징이 잘 맞아떨어지기 때문.1. Segmentation에 최적화된 구조의료 영상 데이터는 주로 픽셀 단위로 정밀한 분할(Segmentation)이 필요합니다. 예를 들어, CT, MRI, X-ray 이미지에서 특정 장기, 병변, 또는 뼈 구조를 정확히 추출해야 합니다.U-Net은 엔코더-디코더 구조로 되어 있어, 이미지를 압축(Downsampling)한 후 다시 복원(Upampling)하며 세부 정보를 보존할 수 있습니다.2. 스킵 연결(Skip Connection)U-Net의 주요 특징은 스킵 연결입니다. 이는 엔코더에서 추출된 저수준(low-level) 특징을 디..

Week12 주간 학습정리 - [Data-Centric CV 대회 후 회고]

📌 DATA Relabeling오픈 데이터 가져와서 우리의 가이드라인에 맞게 annotation 구분선 같은거 annotation 다해서 구분선 있는 데이터 더 많이 해서 학습하는 방법도 있긴함..CVAT, Roboflow로 annotation을 수정할 수 있음을 직접 경험함.Roboflow로 직접 Relabeling 작업을 했고 Relabel 된 데이터를 가지고 학습했을 때 성능 향상이 있어서 데이터 quality가 중요함을 다시 몸소 깨달았고 성취감도 있었다.📌 Model vs Data실무에서는 data centric이 중요하다~!sample level analysis 가 중요하다.📌 아쉬운 점github 협업을 다음 프로젝트 부터는 좀 더 체계적으로 해야 겠다.슬랙과 github, notion..

Week11 주간 학습정리 - [Data-Centric CV 내용 정리]

📌 데이터 저작권github copilot → copilot 이 학습 데이터로 사용한 코드 데이터 중 저작권에 문제가 되는 자료가 있을 수도.데이터를 사용할 때 주의해야 함. 저작권.데이터 수집 단계부터 조심해야 함.📌 DATA Flywheel기업의 입장에서 서비스를 하다 보면 데이터가 지속적으로 쌓임 → 이 데이터를 모델의 학습 데이터로 가공하고 모델에게 계속 추가 학습을 진행하면서 자연스럽게 모델의 성능 UP데이터를 기반으로 모델과 상호작용을 하면서 여러 iteration하면서 모델과 데이터 둘 다 Quality가 좋아지도록 하는 것이 data flywheel⇒ 이게 data centric ai 를 real world(실무)에 적용했을 때 가장 대표적인 형태 📌 데이터의 양과 Quality + ..

Week10 주간 학습정리 - [CV level 2 대회 완료 후 회고]

📌 일단 대회를 진행하며 느낀 점들을 블로그에 남긴다. 대회에서 시도했던 가설, 실험(가설 검증) 등은 Github, Notion, Wrap up report에 기록해 두었다.📌 실험 공유저번 대회처럼 Notion으로 실험 공유를 다들 열심히 잘 해주었다. wandb를 이번 대회부터 처음 적용해보았는데 확실히 실험 공유도 잘 되고 모델 성능도 다같이 편리하게 볼 수 있어서 정말 좋았다. wandb는 이제 없으면 안 될 것 같다..나중에 필요하다면 유료 결제를 해서라도 사용할 것 같다...팀 안에서 각자 실험했을 때 유의미한 결과를 도출했다고 생각하는 실험들을 Github에 실험에 맞는 브랜치 명을 만들고 빠르게 Commit을 해서 다른 팀원들도 그 실험을 자신의 모델에 적용해 볼 수 있었다는 점이 좋..

Week9 주간 학습정리 - [CV level 2 대회 진행 중]

📌Competition tip  1. mAP를 제대로 이해해서 활용해보자!! → 일반적으로 시각화를 위해서는 bbox threshold를 높게 준다→ 시각화를 할 bbox는 class score가 0.5이상인 애들만 그려라→ 깔끔하게 그려짐 → thres를 낮게 하면 거의 모든 박스를 다 그림→ map가 높음→ 좋은건가..→ 대회 성능을 높이는 데는 좋지만 실제 서비스에는 thres가 낮은게 좋을수도 있지 않나.. ⇒ map의 중요한 성질→ recall, precision을 그래프에 찍었을 때 그 아랫면적을 AP로 계산→ 이 말은 곧 RECALL이 무조건 1에 가까울수록 추가적인 성능 향상이 존재한다.→ 박스를 100개 예측하든 1000개 하든 만 개 하든 박스의 개수에 따라서는 AP의 성능이 증가 되..

Week8 주간 학습정리 - [CV level 2 대회 시작]

📌 학습 정리  1. Object Detection IN Real Time object detection은 real world와 많이 맞닿아 있기 때문에 real time 으로 구현(detection)하는 것을 중요시함.→ 성능도 중요하지만 속도도 중요하다~ 2. TP, TN,..→ 이렇게 있을 때 뒤에 붙은 부분을 모델의 예측이라고 보면 됨→ positive라고 예측한게 true 구나~ 맞구나~ → negative로 예측한게 맞구나~ 정답도 negative구나~  3. precision & recall  precision → 예측 관점recall → 정답 관점  4. AP(average precision) AP(average precision)→ pr curve 그리고 난 뒤의 아랫면적→ 그래서 최소..