오늘 한 일

기업 해커톤 대비

  • DVC 공부를 위해 개인 레포지토리를 팠다.
  • 직접 모델 훈련하는 예시 코드를 기반으로 DVC 실습을 하려고 했다.
  • 근데 코드가 잘 실행되지 않아서 이것저것 찾아보다가 DVC 실습은 못하고 음성인식 모델 쪽 공부를 했다.
  • 알아본 모델이 facebook의 Wav2Vec2.0이랑 OpenAI의 Whisper였다.
    • 좀 조사해보니 Wav2Vec2.0은 파인튜닝이 영어에 최적화되어 있는 기분이었다.
      • hello, world를 음운(?) 단위로 쪼개서 labeling을 해야 되는 것 같았다.
    • 그리고 Whsiper는 꽤 작은 사이즈에서도 준수한 성능을 보이는 것 같아서 베이스모델을 바꿀 수 있다면 이걸 써보는 게 꽤 좋을 것 같다고 느꼈다. (+ 한국어도 꽤 잘한다.)

다음에 할 일

  • Whisper 모델 파인튜닝 해보기
  • DVC, precommit, lint도 적용하기