PgmailCrawler

###Summary 我的第一个Python爬虫，作用是从PostgreSQL官网的邮件归档页面中扒取所需信息(邮件标题，送信人，送信时间，邮件的归档地址)，并将这些信息记录在指定的PostgreSQL数据库中.

★★备注★★ 目前PostgreSQL的官网似乎升级了反爬虫策略，目前该爬虫在爬了100个不到的页面后就会被发现并被屏蔽。因此需要强化其反侦察策略

###Usage (Current version)

该爬虫的启动方式如下：

$python3 PgmailCrawler.py -y 年份 -m 月份 -h PostgreSQL服务器域名 -p PostgreSQL实例端口 -d 数据库名 -u PostgreSQL用户名 -w 密码

下面两个选项用于指定从哪年哪月的归档邮件开始扒取信息

下面的选项用于指定用于保存数据的PostgreSQL数据源(风格与psql尽量保持一致).

###Dependencies

###TODO 眼下考虑待改进的项目如下:

takedaiori/pgmail_crawler