analy_crawler

微舆情分析安装部署文档

一.技术选型

1.requests作为爬虫程序处理网络请求的框架

2.Beautiful作为解析网页的dom解析器

3.数据库用postgresql

二.开发环境

1.下载安装python3,debian9最新发行版自带python3.5版本，可通过在终端输入python3测试；若系统没有python3，使用以下命令安装:

# apt-get install python3

2.安装python包管理工具pip

# apt-get install python3-pip

3.下载安装psycopg2、psycopg2-binary、、python-dateutil、requests、bs4、selenium、lxml包

# apt-get install python3-pandas
# pip3 install python-dateutil
# pip3 install requests
# pip3 install bs4
# pip3 install psycopg2
# pip3 install psycopg2-binary
# pip3 install lxml

三.前期准备

1.创建数据库表：在pgadmin III使用analy_creat.sql中建表语句创建table

2.数据库初始化操作：同样的方法执行analy_init.sql中初始化语句

四、项目工程目录

系统各个模块之间的联系如下：