본문 바로가기

HTML2

Python으로 크롤링(Crawling)하기 이번 포스팅은 Python으로 크롤링하기 위해 함수 몇 가지를 다뤄볼 것이다. 그전에 이전 포스팅에서 작성한 HTTP 요청(GET, POST)과 태그 구조를 보고 오자. 2021.05.29 - [분류 전체보기] - 웹 기본 지식 웹 기본 지식 웹사이트와 관련된 기본 용어를 알아보자. HTML(Hyper Text Markup Language): 웹사이트를 생성하기 위한 언어로 문서와 문서가 링크로 연결되어 있고, 태그를 사용하는 언어 HTTP(Hyper Text Transfer Protocol):.. memoleeyu.tistory.com HTML 문서에서 원하는 내용을 크롤링하기 위해서는 아래와 같이 세 단계의 과정이 필요하다. HTTP 요청 태그 검색 내용 추출 HTTP 요청을 해서 크롤링할 페이지의 .. 2021. 6. 7.
웹 기본 지식 웹사이트와 관련된 기본 용어를 알아보자. HTML(Hyper Text Markup Language): 웹사이트를 생성하기 위한 언어로 문서와 문서가 링크로 연결되어 있고, 태그를 사용하는 언어 HTTP(Hyper Text Transfer Protocol): HTML 문서 등의 리소스를 전송하는 통신규약 클라이언트가 서버에 페이지를 요청하면, 서버가 해당 페이지를 클라이언트에 응답한다. 이때, 클라이언트가 응답받은 페이지는 HTML이고, 이를 보기 쉽게 렌더링 한 결과가 우리가 보는 페이지다. 브라우저(클라이언트)가 서버에 요청하는 모든 기록은 개발자도구의 Network 탭에서 확인할 수 있다. [그림 2]는 www.google.com 페이지를 요청한 네트워크 기록이다. 구글 페이지 요청 및 구글 페이지를.. 2021. 5. 29.