오늘 한 일

프로젝트

  • 어제 작업을 하려고 보니까 합의된 브랜치 전략이 없어서 오늘 오전에 거의 1시간 가량 그런 이야기를 나누었던 것 같다.
  • 또 어제 해볼 생각이 있었던 것이 답을 내기 전에 답에 대한 이유를 말하도록 해서 모델에 CoT를 적용해보기 위한 작업을 진행했다.

CoT

  • 사실 자세한 건 깃헙 Discussion 탭을 따로 만들어서 거기다가 적어놨는데, 간단히만 말하자면 다음과 같다.
  • logit 기반 추론을 하면서도 CoT를 하기 위해서 모델을 나누어 사용하는 전략을 취해볼까 한다.
  • 먼저 CoT를 하기 위해 추론을 생성해내는 모델을 만들어서 테스트 데이터셋마다 정답과 관련된 추론을 뽑아낸다.
  • 그럼 그 추론을 프롬프트에 포함시켜서 정답: 으로 프롬프트를 끝내고 다음에 올 토큰이 선지의 번호가 되도록 학습시키는 방법을 사용해볼까 한다.

다음에 할 일

  • 일단 OpenAI API키에 돈이 좀 남아서 그걸로 추론을 뽑는 작업을 할 것 같다.