오늘 한 일

  • LimBERT 프로젝트 시작
    • 오전에 bs4를 이용해서 적당히 디시인사이드 html을 파싱하는 코드를 만들어보았다.
    • 크롤링은 의외로 금방할 것 같은데, 데이터 어노테이션 작업이 더 빡쎌 것 같다….
  • 네트워킹 데이
    • 여러 기업 채용 설명회를 들어봤다.
    • 아쉬운 점은 데이터 엔지니어는 채용이 좀 적은 것 같아서 아쉬웠다.

오늘 점수

  • 사실 오전에만 좀 프로젝트를 했고… 오후에는 네트워킹 데이하느라 많이 못했다.
  • 그래도 순수하게 코딩한 시간으로 점수를 주자면 100점 만점에 50점 정도?
  • 몇시까지는 집중을 해보자와 같은 가이드라인이 있으니 확실히 집중이 더 잘되는 것 같다.
  • 그리고 직접 코드를 짜는 것도 한몫을 하는 것 같고… 100점을 향해 화이팅~

다음에 할 일

  • 디시인사이드 댓글까지 크롤링하게 하고 자동으로 검색해서 파싱할 수 있도록…
    • 예상 용량이나 이런 걸 좀 추려봐야 할 것 같다.
  • 데이터 엔지니어에 필요한 역량을 보고 그 기술 위주로 리서치를 해보면 좋을 것 같다.