오늘 한 일

프로젝트

  • 모듈 통합 테스트하는 클래스를 만들었다.
    • 이거 생각보다 오래걸렸다…
    • 주석까지 쓰고 이것저것 신경쓰면서 하다보니까 좀 오래 걸린 것 같다. 너무 처음부터 완벽하게 하려고 해서 그런 걸지도? 그냥 암 생각없이 하는 게 더 빠를 수는 있겠다.
  • Data-centric이라는 주제가 너무 생소해서 여러가지 고민을 해보게 하는 것 같다.
    • 일례로 label correction을 위해서 새로운 모델을 사용하면, 그건 model-centric한 것이 아닌가 하는 의문이 들어서 토론을 나누었다.
    • 근데 문의 결과 data-centric이 맞다고 한다.
  • label correction을 noise를 복원한 데이터가 없어서 성능을 못 찍어보고 있는데, 그냥 klue-tc 데이터셋을 이용해서 임의로 label을 바꿔놓고 맞추게 하면 성능을 측정할 수 있지 않을까 하는 생각을 했다.

다음에 할 일

  • LangChain과 구글 Gemini를 이용해서 노이즈 복원 작업을 해볼 생각이다.
  • 그리고 강의를 다 봤어야 했는데, 그… 주말에는 강의를 못본다는 걸 까먹었다. 그래서 좀 틀어놔야 할 것 같다.