오늘 한 일
오리엔테이션
- 이번 기업 해커톤은 캐글에서 진행된다고 한다.
- 마지막까지 리더보드에서 경쟁해야 되는 게 좀 피로해서… 그게 좀 아쉽다.
- 그리고 데이터셋이 대충 500GB 정도 되어서 현재 서버에서 사용하기에는 무리가 있을 것 같은데 나누어서 학습해야 할 것 같다… 고 생각했는데
- NCP에서 더 업그레이드된 서버를 제공해주신다고 하셔서…! 그걸 쓰게 될 것 같다. (무려 하드가 900GB다.)
- 근데 사용할 수 있는 GPU의 총량은 줄어든 것 같아서 진짜 업그레이드인지 뭔지는 좀 지켜봐야할 것 같다.
피어세션
- AAC(Automated Audio Captioning)에 대한 metric으로 SPIDEr라는 걸 사용하는데 이게 뭔지 모르겠어서 논문을 따로 보는 게 어떠한지 토론을 해봤다.
- 근데 metric 자체를 완벽하게 이해한다고 해서 모델 성능을 높일 수 있다는 건 또 의문이라는 의견이 많았어서, 따로 시간이 남게 된다면 보는 걸로 했다.
- 당장은 서버를 사용할 수 없는 상황이라 이론적으로 백그라운드를 넓히는 방향으로 잡았다.
- 그래서 베이스라인 모델인 SALMONN에 대한 논문을 주말동안 읽어보고 월요일에 이야기를 나눠보기로 했다.
다음에 할 일
- SALMONN읽고 월요일에 이야기를 해보기 (+ 코드까지 읽어볼 수 있으면 금상첨화)
- 노션에 서버 현황판을 달 생각이었는데 서버가 하나밖에 없어져서 이건 필요없을 듯
- DVC…를 해보기? 로컬에만 저장할 수 있어도 좋을 듯.