오늘 한 일

프로젝트 마무리

  • 어제 프로젝트가 끝났다. 퍼블릭 12등, 프라이빗 12등으로 다소 아쉬운 마무리라고 생각이 들었다.
  • 프로젝트가 끝나고, 팀원들이랑 ‘언이괜’을 진행했다…. 이에 대한 내용은 어제자 프로젝트 회고 녹여서 잘 풀어보도록 하자.
  • 성능이 좋았던 팀들은 아마 32B 모델을 사용했던 것 같다. 다들 ‘이런 방법론을 썼을 때, 크게 올랐다!’ 같은 느낌은 아니었고, 그냥 모델이 커지고 먹이는 데이터가 많아지니 성능이 비벼볼 수도 없게 높게 오르는 것 같더라….
  • 그래서 오늘은 하루종일 랩업 레포트를 썼다.
    • 원래는 구글 독스로 작업하다가, 이번에는 노션으로 (자유도는 적어도 편의성이 높다는 점을 높게 사서) 작업을 해보았다.
    • 이전 조에서 쓰셨던 랩업 레포트를 공유해준 것 중에 엄청 잘 쓰셨다 싶었던 게 바로 이 레포트였다. 물어보니 구글 슬라이드로 작업하셨다고… 아주 씽크빅인 것 같다.

마스터클래스

  • 두 팀이 발표를 하셨다. 두 팀 모두 32B 모델을 사용하셨다고 한다.
    • unsloth? 라는 걸 사용하셨다고 하는데 GPU 서버에 설치하기 정말 어려운 것 같긴 하더라….
  • 두 팀 발표를 종합적으로 정리하면서 되게 적극 반영해보고 싶었던 내용을 아래에 정리했다.
    • 데이터를 하나하나 다 라벨링을 하셨더라… 구글 스프레드시트로 엄청 체계적으로 하신 게 인상 깊었다.
    • 그리고 되게 Data-driven이라는 팀 목표에 부합하게 데이터 기반의 의사결정이 이루어진 것 같아서 이 점을 적극 반영해보고 싶었다.
    • Jira & Confluence로 일정 관리하신 것도 놀라웠다.
      • 우리도 그날그날 하루 있었던 일을 문서로 정리해서 회의때 그걸 보면서 이야기 하는 형식이면 되게 좋을 것 같다.
    • 그리고 GPU 서버랑 노션이랑 연동한 거… 진짜 GOAT인 것 같다.
      • 슬랙에 관련 내용 정리해주셔서 올려주셨으니 그걸 보고 공부하는 것도 되게 도움이 될 것 같다.
    • LLM 여러 대 이용해서 문제를 풀도록 한 다음에 얼마나 맞추는지를 보고 데이터 품질을 측정하려는 시도도 인상 깊었다.
    • 그리고 PTQ? 라는 생소한 양자화 방법을 사용하셨던데 이것도 써봤으면 어떨까 하는 생각이 든다.

다음에 할 일

  • 이력서 쓰기
  • ‘수능형 문제 풀이 모델 생성’ 프로젝트를 마치며 완성하기
    • 개인회고는 이거 바탕으로 조금만 수정하면 될 것 같다.
  • 캠퍼 피드백
  • 놀기
    • 림버스 컴퍼니 스토리 밀기
    • 아케인2, 흑백요리사 보기
  • 12월 목표!
    • 운동하기
    • 블로그 공사
    • 1일 1백준 → 구현이 너무 느려졌다…!