오늘 한 일
- label에 따른
dev.csv의 L1Loss가 어느 정도인지 확인하였다.
- 당연히 데이터셋이 가장 부족했던 상위(
label >= 4.4) 데이터에 대해 loss가 가장 클 줄 알았는데 의외로 label이 1.0 ~ 3.0 사이의 데이터셋에 대해 loss가 제일 컸다.
K-TACC라는 데이터 증강 도구를 사용하고자 하였다.
- 근데 이것도 알고보니 부캠 4기 선배님께서 만드신 도구였다…
- 20일에도 느꼈던 건데 데일리 스크럼 시간이 점점 길어지고 있다.
- 싫다는 얘기는 아니고 프로젝트에 관해서 의견을 교환하는 시간이 기니까 더 좋은 것 같다.
- 역번역(Back Translation)은 역시나 효과가 별로라고 보여졌다.
- 음… 많은 일이 있었는데 팀 노션에 정리를 많이 해놔서 별로 쓸 말이 없는 것 같다.
- 아. L1Loss로도 20 epochs 돌려봤는데 아쉽게도 순위 갱신은 못했다.
- 오늘은 뭔가 기운이 없어서… 내일은 팀 단위로 한 일을 간단히 정리해봐야겠다.
다음에 할 일
- 오전까지 데이터 증강 해보고, 오후에는 하이퍼파라미터 튜닝이랑 앙상블 진행할 생각이다.