오늘 한 일

프로젝트

  • 앙상블를 준비하기 위해서 어제 데이터셋을 분리하여 고정된 validation 데이터셋을 만들어 놓고 잤다.
  • 근데 자고 일어나보니까 input_ids를 기준으로 필터링을 하고 train_test_split이 일어나서 이미 학습해둔 모델이 고정된 훈련용 데이터셋으로 학습되지 않은 것 같다는 생각을 했다.
  • 그래서 오늘… 지금까지 좋은 성적을 나왔던 모델에 대해서 전부 학습을 다시 진행하는 중이다.
  • 사실 모델 돌리면서 내가 하는 일은 딱히 없어서… GPU만 바쁘고 난 안 바쁜 하루였던 것 같다.
  • 그리고 validation 데이터셋을 기준으로 inference를 한 다음 박 모 캠퍼님께서 EDA를 진행해보셨는데, 본문 길이가 짧으면 잘 못 맞추는 경향을 확인할 수 있었다.
    • 사실 지금까지 생각해온 우리 가설에서 벗어나는 건 아닌데… 너무 또 EDA의 중요성을 망각했던 것 같다. 왜 이게 잘 안될까?
    • 더 빨리 알았으면 RAG 같은 거 할 때 특정 길이 이하인 데이터에만 적용할 수 있었는데… 또 이거 말고도 EDA 해볼만한 게 많았을 것 같은데 너무 늦게 생각했던 것 같다…. 징징거릴 시간에 좀 더 집중했더라면…

컴퍼니데이

  • 오늘은 좀 집중이 안됐다
  • 근데 마지막에 AI 엔지니어가 필요한 역량에 대해서 이야기한 부분이 있어서 그것만 좀 정리해두는 걸로
    1. 공유: 내가 보기 편한 공유 말고 남들도 잘 볼 수 있도록
    2. 개발자로서의 역량
    3. 어떻게든 문제를 해결하겠다는 집념? 문제해결능력?
  • 그리고 채용절차도 신기한 부분이 많았다. 딥러닝 코딩테스트라니…

다음에 할 일

  • 프로젝트의 마지막 날…
  • 앙상블 딸깍 말고 할 게 있을까요…