오늘 한 일
오전
- 어… 오늘 오전까지 서버를 안줬다…. 이건 좀 변수였을지도….
- 모델 부품을 바꿔끼우더래도 파이프라인을 SALMONN 그대로 활용할 것인지에 대한 논의가 있었다.
- 그래서 SALMONN을 인용한 다른 논문들을 위주로 사용할 수 있는 모델을 확인해보고자 하였다.
- 근데 ASR이랑 AAC를 동시에 하는 모델 자체가 그렇게 많지 않은 것 같았다…. 일단 논문 몇 개를 골라놨고 팀원들이 나누어서 논문을 보는 중이다.
- 아마 그냥 SALMONN으로 가게 될 것 같다.
- 다른 팀원이 진행한 EDA를 보고 함께 이야기를 나누어 보기도 했다. (링크1|링크2)
- Phone Recognition Task에 대한 데이터도 포함되어있는데, 이게 다른 데이터들에 비해 너무 길어서 그냥 빼고 해도 될 것 같다는 의견이 있었다. (나도 동의했다.)
오후
- 점심 먹고 돌아왔을 때도 서버를 안 준 상태라, 어제 보던 코드를 마저 보고 있었는데 서버가 열렸다!
- 데이터셋이 500GB로 엄청 큰데, 이게 드라이브로 공유해주셔서 서버에서 직접 다운 받을 수가 없었다.
- 이걸 로컬로 받자니 일단 물리적으로 하드에 다 실는 것도 정말 어려운 상황이라… selenium을 이용하여 서버에서 OTP를 입력하게끔 해서 억지로 다운받을 수 있도록 코드를 구현하였다.
- 그거 하고 나니까 하루가 다 갔다….
다음에 할 일
- 피어세션 중에 학습 안 된 베이스라인 모델을 이용해서 inference를 시도해보려고 했는데 잘 안 되서, 그 방법을 조사해볼 생각이다. (코드 분석)
- 그거 다 하고 나서는 QFormer 마저 코드 읽어볼 것 같다.