Scrapy Tutorial - 다중페이지 크롤링
개요
- 이번에는 Scrapy를 통해서 다중 페이지를 크롤링 하도록 한다.
Target 페이지
- 타겟 웹사이트 : https://www.audible.com/search

프로젝트 시작
- 프로젝트 시작은 다음과 같이 할 수 있다.
$ scrapy startproject multiCam_tutorial
New Scrapy project 'multiCam_tutorial', using template directory 'C:\Users\j2hoo\OneDrive\Desktop\your_project_folder\venv\Lib\site-packages\scrapy\templates\project', created in:
C:\Users\j2hoo\OneDrive\Desktop\your_path\multiCam_tutorial
You can start your first spider with:
cd multiCam_tutorial
scrapy genspider example example.com
- 해당 multiCam_tutorial 경로에서 다음 명령어를 실행하여 타겟 사이트를 설정한다.
$ scrapy genspider audible www.audible.com/search
Created spider 'audible' using template 'basic' in module:
multiCam_tutorial.spiders.audible
audible.py 파일을 찾아 코드를 확인한다.

