정리할 때 참고하기
<aside>
🔎
대회 기록 가이드라인
- Subject
- Introduction
- Training
- 어떻게 학습했는지 상세히 설명
- 모델 학습 설정에 대한 구체적인 정보를 제공하되, 성능 지표나 결과를 강조하지 않는다
- 상세 내용
- (데이터) 데이터셋의 출처, 크기, 특성, 전처리 과정에 대해 설명한다
- (모델) 사용한 모델의 구조 및 하이퍼파라미터에 대해 설명한다
- (방법) 최적화 알고리즘과 손실 함수에 대해 설명한다
- (과정) 에폭 수, 배치 크기, 학습률 조정 등을 설명한다
- (성능) 성능 변화를 기록한다
- Inference
- 실험 결과 해석하고 의미를 논의
- 얻은 결과의 의미에 대해 논의하되, 반복적으로 언급되는 수치나 설정을 피하고 더 깊은 해석에 집중한다
- 상세 내용
- (해석) 실험 결과가 의미하는 바를 해석한다
- (분석) 연구 결과와 기존 연구 결과를 비교한다
- (성찰) 한계와 문제점에 대해 성찰한다
- Experiments
- 성능 평가와 실험 상세 설명을 수치적으로 보고
- 실험의 수행 결과에 초점을 맞추고, 성과와 비교를 통해 실험의 유효성을 증명한다
- 상세 내용
- (설계) 실험의 목적과 목표를 설정한다
- (지표) 성능 평가의 지표와 결과를 설명한다
- (분석) 다른 모델과의 성능을 비교한다
- (결과) 결과를 표나 그래프로 제시한다
- Conclusion
대회 참여 시 매일 보기
<aside>
🔎
대회 참여 가이드라인
- 문제 해결력을 기르기 위한 대회
- 문제 정의 → 가설 → 실험 → 결론 도출 → … 이 반복된다 볼 수 있다
- 이론도 중요하지만 실전에서 이론만이 중요한 것은 아니기 때문에 대회는 그 간극을 좁혀줄 수 있는 좋은 경험이 될 수 있다
- 여러 참가자들이 함께 문제 해결의 방향을 함께 의논한다
- 그러므로 어떤 문제를 마주하더라도 잘 헤쳐나갈 수 있는 능력을 기르는 것이 중요하다
- 점수가 아니라 무엇을 얻었는지를 돌아보고, 어떤 것을 얻었는지 생각해본다
- 성능 개선은 보조지표일 뿐이다
- 다 똑같은 커리어가 아니라 나만의 특별한 강점을 찾아가는 것이 중요하다
- 뭘 잘하는지, 뭘 못하는지를 파악하고 자신의 강점을 기르는 것이 좋다
- 클린 코드? 데이터 분석? 정리?
</aside>
문제 분석 시 참고하기
<aside>
🔎
문제 해결 가이드라인
- 제시된 목표를 통해 데이터셋으로 무엇을 해야하는지 방향을 잡을 수 있다
- 문제 해결이 필요한 배경을 통해 해결해야 하는 문제가 무엇인지 알 수 있다
- 보이는 것이 전부가 아니다
- 데이터의 종류와 특수성을 보고 이로 인해 발생할 수 있는 여러 상황을 가정한다
- 입력 데이터를 원하는 형태로 추론하기 위한 적절한 방법을 찾아서 적용한다
- 좋든 나쁘든 끝까지 진행하여 결론을 내보는 것이 중요하다
- 결과가 올바르게 작동할 지 확인할 수 있는 최적의 평가 방식(Evaluation Metric)을 고려한다
</aside>
<aside>
🔎
데이터 분석 가이드라인
- 모든 데이터가 깨끗하게 잘 정리되어 있을리가 없다
- 데이터를 잘 이해하고 파악하려는 자세가 필요하다
- 데이터가 어떻게 만들어진 이미지인가, 포맷은 문서인가 그림인가
- 반드시 일반적인 형태의 이미지가 아닐 수 있다
- 문서를 이미지로 변환한 것일 수 있고 컴퓨터 그래픽을 캡쳐한 이미지일 수 있고 카메라로 찍은 이미지일 수도 있다
- 차원/채널/이미지 사이즈/파일 포맷 등을 알아본다
- 데이터의 생김새와 특징을 알아본다
- 이미지를 하나하나 확인하다보면 새로운 관점을 발견할 수도 있다
- 크기가 충분히 큰지, 너무 작은지, 일정한지, 비율이 같은지 등등
- 해결해야 하는 목표와 관련있는 내용인지 확인하고 구성 요소 중 필요없는 내용이 있다면 굳이 포함할 필요가 없다
- 레이블이 존재하는 경우 클래스의 분포(불균형 여부)를 확인해본다
- 해시함수를 활용하여 중복되는 이미지는 제거할 수 있다
- 구체적인 질문을 통해 앞으로 무엇을 해야할지 주제를 좁혀나간다
- 데이터를 분석하여 얻은 인사이트를 글로 표현하고 코드로 나타낸다
- 부족한 데이터를 보충할 방법을 생각해본다
- 데이터 특징을 바탕으로 어떤 메트릭을 사용할 것인지도 생각해본다
- 특정 도메인에 활용되는 데이터라면 해당 도메인에 대한 지식을 쌓는다
- EXIF Metadata 활용 또는 제거 단계를 거칠 수도 있다
- 스마트폰/디지털 카메라로 찍은 사진의 표준 메타데이터로 촬영 위치, 장비 정보, 시간, 이미지 정보, 설정값 등이 포함되어 있다
- 개인정보 보호 문제로 삭제하거나 촬영 사진에서 위치를 추출하여 지도를 그려 활용할 수 있다
</aside>