오늘 한 일
- LimBERT 프로젝트 시작
- 오전에 bs4를 이용해서 적당히 디시인사이드 html을 파싱하는 코드를 만들어보았다.
- 크롤링은 의외로 금방할 것 같은데, 데이터 어노테이션 작업이 더 빡쎌 것 같다….
- 네트워킹 데이
- 여러 기업 채용 설명회를 들어봤다.
- 아쉬운 점은 데이터 엔지니어는 채용이 좀 적은 것 같아서 아쉬웠다.
오늘 점수
- 사실 오전에만 좀 프로젝트를 했고… 오후에는 네트워킹 데이하느라 많이 못했다.
- 그래도 순수하게 코딩한 시간으로 점수를 주자면 100점 만점에 50점 정도?
- 몇시까지는 집중을 해보자와 같은 가이드라인이 있으니 확실히 집중이 더 잘되는 것 같다.
- 그리고 직접 코드를 짜는 것도 한몫을 하는 것 같고… 100점을 향해 화이팅~
다음에 할 일
- 디시인사이드 댓글까지 크롤링하게 하고 자동으로 검색해서 파싱할 수 있도록…
- 예상 용량이나 이런 걸 좀 추려봐야 할 것 같다.
- 데이터 엔지니어에 필요한 역량을 보고 그 기술 위주로 리서치를 해보면 좋을 것 같다.