오늘 한 일
- 이전 기수의 프로젝트 레포지토리 확인해보기
- 어제에 이어서 오늘은 모든 팀원이 대대적으로 레포지토리를 조사해보는 시간을 가졌다.
- 조사한 바에 의하면 Back Translation이나 Easy Data Augmentation을 통한 데이터 증강은 성능이 오히려 안좋아지는 것 같다는 생각이 들었다.
- 체계적으로 잘 정리된 레포지토리를 보며 저렇게 잘 관리를 할 수 있으면 좋겠다고 생각이 들었다.
- WandB라는 툴을 이용하면 sweep이라는 걸 할 수 있는 것 같다.
- sweep은 일종의 자동 하이퍼 파라미터 튜닝인 것 같다.
- 그 외에도 실험 관리나 데이터셋 관리를 할 수 있어서 잘 찾아보면 좋을 것 같다.
- 또 Pytorch Lightning 이라는 게 있다. 좀 더 추상화된 PyTorch 같다. 많이들 사용한 것 같긴 한데 굳이 (특별한 이유없이) 써야하나 싶긴 해서 일단은 보류.
- 개인 프로젝트 목표 설정
- 멘토님의 조언에 따라서 각자 이번 프로젝트를 통해 달성하고자 하는 목표가 무엇인지 생각해보기로 했다.
- 잠깐 생각해본 개인 목표는 다음과 같다:
- 나중에 혼자서도 프로젝트를 재현할 수 있도록 메모의 습관화
- 내가 했던 과거의 프로젝트들은 모두 까먹어버려서 더 이상 포트폴리오로써 사용할 수 없었다.
- 그러한 일을 막기 위해 충분한 양의 메모를 남기면 좋을 것 같다.
- 충분한 이유와 함께 의사 결정하기
- ‘남들이 다 쓰니까 우리도 이렇게 하자’와 같은 의사결정은 되도록 지양하고 싶다.
- 적어도 면접에서 곤란하지 않을 만큼은 이유가 필요할 것 같다고 생각했다.
- 프로젝트 전체적인 흐름을 파악하고 그에 따른 협업 도구의 필요성 체감하기
- EDA부터 하이퍼 파라미터 튜닝까지 경험하는 프로젝트는 이번이 처음이라 좋은 경험이 될 것 같다.
- 멘토님께서 말씀하신 협업 도구가 어디서 쓰일 수 있고 우리의 프로젝트를 어떻게 개선할 수 있을지 고민해보고 싶다.
내일 할 일
진짜 뭐할지 모르겠다…
- 일단은 프로젝트의 내막이 하나도 공개되지 않은 만큼, 이전 기수 프로젝트를 더 살펴 보는 것은 오히려 over-fitting이 걱정된다…
- 따라서 팀 단위로 사용할 수 있는 협업 툴(ex. Jira, WandB, Github Project, …)을 어떻게 사용하는지 알아보는 시간을 가질 수 있으면 좋을 것 같다…
- 아 허깅페이스 어떻게 쓰는지도 좀 고민을 해봐야 할 것 같기도 하고 …
- 이러면 또 이전 기수 레포를 참고하는 게 맞으려나… 흠…