오늘 한 일
오전
데이터 이슈
- 자고 일어나면 데이터를 다운로드 모두 완료했을 줄 알았는데 뭔가 오류가 있었는지 3개는 실패하고 말았다….
- 그래서 확인하자마자 다시 데이터 다운로드 코드를 실행시켜놓았다.
- 아침에 켜놨는데 서버 트래픽이 오래 걸리는지… 아직 하나도 다운로드가 안됐다.
리더보드 등록
- 강 모 캠퍼님께서 어제 계속 코드를 붙잡고 씨름하고 계셨는데 결국 디버깅에 성공하셔서 inference를 진행할 수 있으셨다고 한다.
- 다만 체크포인트를 불러오지 않아서 출력이 굉장히 이상했는데, 노타 측에서 제공해준 체크포인트를 사용하니 꽤 적절한 답변을 내는 것을 확인할 수 있었고 바로 제출해보았다.
- 처음 제출 한 팀이 1.02 이렇게 나오길래 어떻게 word error rate가 1% 대로 나오는지 궁금했었는데, 알고보니 102% 였던 것 같다… 우리가 제출해보니 0.06? 정도로 나왔다.
코드리뷰 방향성
- 이후에는 코드를 어떻게 보면 좋을지 서로 이야기를 나누어봤다.
- 파일 별로 나누어서 보면 좋을지, 아니면 적용할 수 있는 방법론 단위로 나누어 보면 좋을지 고민을 해봤는데…
- 결과적으로는 일단 코드를 이용해서
train이나 evaluate, inference를 할 수 있는 실질적인 방법을 먼저 알아보는 것을 목표로 코드를 보는 것으로 했다.
- 지난 날의 실패를 답습하지 않게 이번엔 내일 피어세션까지 마감 기한을 잡아놨다.
오후
피어세션
- 각자 코드를 보고 나서 드는 의문 같은 걸 공유하면서 그거에 대한 질의응답을 서로 진행하는 시간을 가졌다.
- 또 코드를 보면서 어떻게 경량화를 하면 좋을지에 대한 아이디어가 떠오른 것이 있으면 이에 대한 아이디어를 나누어 공유하는 시간을 가졌다.
- 일단 Q-former에서 경량화를 시도해보는 방법과 Audio Encoder를 하나만 쓰는 구조로 바꾸는 등의 이야기 정도가 오갔다.
- latency를 줄이기 위한 방법으로 하이퍼파라미터를 건들여보는 것도 이야기해봤다.
- 하이퍼파라미터 다루는 것은 너무 당연한 것이긴 하다.
- 그리고
Dataset 코드를 보면서 특정 예외처리가 일어나는 부분이 얼마나 자주 일어나는지 확인(EDA)도 필요할 것 같다.
두런두런
- 수료 이후의 어떻게 하면 좋을지에 대한 힌트를 주는 특강을 들었다.
- 길게 정리한 문서도 있지만 그걸 공개하는 건 마스터님에 대한 예의가 아닌 것 같아서 키워드 정도로 요약하자면 다음과 같다: 기업 리서치, 프로젝트, 커리어
- 가장 마음에 와닿았던 것은 현재 취업시장이 불황이니 당장 취업이 안되도 그게 온전히 내 탓이라고는 할 수 없다는 내용이었다.
- 물론 내 주위 사람들 보면 다 하나 둘 취업하고 계시긴 하지만… 그건 어디까지나 그 분들 능력이 뛰어났기 때문일테니까…
- 특강을 통해, 너무 취업에 대해서만 걱정하고 있었는데 그걸 넘어 앞으로의 내 삶을 어떻게 살아가면 좋을지에 대해 고민하는 시각을 가질 수 있게 되었던 것 같다.
- 그냥 당장 취업 안되더라도 너무 좌절하지말고 순간순간에 할 수 있는 최선을 다 해보자. (늘 그랬던 것처럼…)
- 2~3개월 뒤에 내가 취업으로 인해 너무 스트레스 받지 않으면 좋겠다. 인생은 기니까….
- 마스터님께서 말씀해주신 ‘손석구’ 배우님의 이야기를 가슴 속에 새기자.
멘토 세미나
- 원래 멘토 세미나를 잘 안 듣는데…, 제목이 ‘살면서 느낀 점’…!
- 취업을 위한 이력서, 면접 대비 등을 어떻게 하면 좋을지에 대한 이야기를 해주셨다.
- 사실은 그것보다 취업 후에 어떻게 살아가야 하는지가 더 메인이었던 것 같다. 이것도 역시 열심히 필기를 해놨다.
- 가장 기억에 남았던 것은 발표 끝자락에 말씀해주신 반드시 재태크 공부를 하라는 것(ㅋㅋ)과 육아 바이럴(ㅋㅋㅋㅋ)이었다.
다음에 할 일
- 데이터 다 다운로드 받기 (ㅋㅋ;)
- 코드를 보다가 말아서 피어세션 전까지 빠르게 다 훑어볼 수 있도록…!
- 그 이후 할 일에는 내일 피어세션때 뭘 하면 좋을지 이야기를 나누기