오늘 한 일
- dcinside 댓글 크롤링
- 처음 bs4로 긁어올 때는 html 상으로는 댓글이 없는 문제가 있었다.
- 그래서 이것때문에 계속 고치고 있었는데…
- 개발자 도구에서 networks 탭을 보니 댓글들을 불러올 때 쓰는 요청 방식이 따로 있다는 걸 확인할 수 있었다.
- 그거대로 요청했는데 계속 안되다가… 아는 백엔드 고수 후배한테 좀 봐달라고 하면서 같이 고쳐보니까
- 그냥 됐다? 분명 아까는 안되는 코드였는데 하다보니까 되버렸다.
오늘 점수
- 풀집중했다고는 못하겠지만… 그래도 계속 코드 디버깅하면서 시간 알차게 보낸 것 같다.
- 아쉬운 점이 있다면 결국 기능 하나 구현한 게 전부라는 거? 디버깅하는데 시간을 너무 많이 쓴 것 같아서 아쉬웠다.
- 그런 거 고려하면… 대충 60점? 정도 아닐까?
다음에 할 일
- 다운로드 받은 이미지에서 feature를 뽑을 수 있도록 학습을 해야하는데…
- 사실 게임 이미지가 동적으로 바뀌는 것도 아니고 그래서 이건 학습 데이터를 그냥 내가 원하는 만큼 무한히 많이 만들어줄 수 있을 것 같다.
- 그걸로 YOLO 학습 한 번 시켜보는 게 좋을 것 같다.
- 댓글 크롤링한 거 작성자 이름 같은 거 해쉬값으로 가려주기
- dcinside 웹 검색 하면서 특정 날짜 구간 별로 게시글 들어가면서 크롤링할 수 있게 고치기