본문 바로가기 메뉴 바로가기

advenoh

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

advenoh

검색하기 폼
  • 분류 전체보기 (54)
    • algorithm (3)
    • database (6)
    • git (2)
    • java (31)
    • javascript (1)
    • node.js (1)
    • mac (1)
    • python (4)
    • spring (4)
    • virtualization (1)
  • 방명록

pysocks (1)
웹 스크래핑하면서 차단 방지하는 방법

Gatsby로 블로그 마이그레이션을 하여 이 링크를 클릭하면 해당 포스팅으로 갑니다. 감사합니다. http://blog.advenoh.pe.kr 1. 소개스크래핑하면 사이트에 접속하여 데이터를 추출해야 해서 어떻게 작성하느냐에 따라 서버에 많은 부하를 줄 수도 있게 됩니다. 웹 서버를 담당하는 측에서는 서버에 많은 부하를 줄이기 위해 악의적으로? 접속하는 곳을 차단할 수밖에 없습니다. 이번 포스트에서는 웹 스크래핑을 하면서 사이트로부터 차단되지 않는 여러 방법에 대해서 알아보도록 하죠. robots.txt 체크하기 User Agents 설정하기 잠시 sleep해서 부하 줄이기IP rotation - Tor 2. 웹 스크래핑시 차단 방지하는 방법2.1 robots.txt 체크하기robots.txt 파일은 ..

python 2018. 8. 13. 20:26
이전 1 다음
이전 다음
«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday

Blog is powered by Tistory / Designed by Tistory

티스토리툴바