오늘 한 일
기업 해커톤 대비
- DVC 공부를 위해 개인 레포지토리를 팠다.
- 직접 모델 훈련하는 예시 코드를 기반으로 DVC 실습을 하려고 했다.
- 근데 코드가 잘 실행되지 않아서 이것저것 찾아보다가 DVC 실습은 못하고 음성인식 모델 쪽 공부를 했다.
- 알아본 모델이 facebook의
Wav2Vec2.0이랑 OpenAI의Whisper였다.- 좀 조사해보니
Wav2Vec2.0은 파인튜닝이 영어에 최적화되어 있는 기분이었다.hello, world를 음운(?) 단위로 쪼개서 labeling을 해야 되는 것 같았다.
- 그리고
Whsiper는 꽤 작은 사이즈에서도 준수한 성능을 보이는 것 같아서 베이스모델을 바꿀 수 있다면 이걸 써보는 게 꽤 좋을 것 같다고 느꼈다. (+ 한국어도 꽤 잘한다.)
- 좀 조사해보니
다음에 할 일
Whisper모델 파인튜닝 해보기- DVC, precommit, lint도 적용하기