Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- piplining
- 관측가능성
- 백준
- 누적합
- 프로그래머스
- 구현
- 디버깅
- 크롤링
- 베타적락
- AWS
- ai agent
- spring event
- JPA
- docker
- 아키텍쳐 개선
- next-stock
- 결제서비스
- gRPC
- 알람시스템
- langgraph
- 몽고 인덱스
- ipo 매매자동화
- 추천 검색 기능
- 카카오
- 완전탐색
- dau 3만명
- 쿠키
- 셀러리
- BFS
- 이분탐색
Archives
- Today
- Total
목록2024/09/16 (1)
코딩관계론
Virtual Thread를 사용한 크롤링 성능 80% 향상
최근에 네이버 금융 테마 페이지를 크롤링하는 작업을 진행했는데, 한 페이지를 크롤링하는 데 약 1분 정도가 소요되었습니다. 한두 페이지를 크롤링하는 것이라면 감내할 수 있는 시간이지만, 해당 작업은 주로 새벽 시간대에 실행되었기 때문에 사용자 트래픽이 적은 상황에서도 처리 시간이 길었습니다. 하지만 크롤링해야 할 페이지 수가 N개로 증가할수록, 전체 크롤링 시간은 선형적으로 증가하는 문제가 있었습니다. 이를 해결하기 위해 비동기 요청, 병렬 처리, 경량 스레드 등의 다양한 최적화 방법을 고민하게 되었고, 그 과정에서 얻게 된 경험과 성과를 공유하고자 합니다. 여담이지만, 개인적으로 작업이 완료되지 않으면 잠을 못 자는 성격이라, 성능을 최대한 단축하는 것이 필요하다고 판단했습니다.첫 번째 시도: @Asy..
개발/Hot-Stock
2024. 9. 16. 18:09