需求背景

根据固定的ASIN和站点信息，爬取对应亚马逊网站的ASIN详情页面的数据。目前已实现爬取的站点共9个：US,CA,MX,DE,IT,FR,ES,UK,JP。

项目环境初始化

1、搭建mysql库，建库DDL见mysql_ddl.sql。mysql数据库连接信息请配置settings.py。

2、python版本，Python 3.6.8

3、手动配置cookie信息，修改settings.py中的cookie_*值，可以添加多个cookie值。根据亚马逊网站特性，cookie信息有效期一般能用6个月，除非网站有较大改动，cookie失效时需重新手动更新。

以下2个办法均可以运行程序

1、编译环境，运行main.py文件

2、进入项目目录下，命令行执行scrapy crawl amazon_crawl

cd ./amazon_spider
scrapy crawl amazon_crawl