EySpider

适合新手的基础爬虫框架

改自Python爬虫开发与项目实战（范传辉）

模块功能分析

爬虫调度器：负责统筹其他四个模块的的协调工作
URL管理器: 负责管理URL
HTML下载器：负责网页的下载，分为动态页面和静态页面
HTML解析器：负责网页的解析
数据存储器：负责数据的存储，里面封装了对没意思mysql数据库的存储

py文件简要介绍

HtmlDownloader.py：
1. 针对静态网页，使用Requests库
2. 针对动态网页使用 selenium和phantomjs
DataSave.py:

使用pymysql 封装mysql的基本操作主要分装了插入操作
EySpider

使用示例

如何使用

直接下载，在HtmlParser.py文件中定制你的爬虫规则。

推荐使用Beautiful解析网页

在EySpider.py中统筹各个模块

如果觉得有点帮助，给个Star

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
__pycache__		__pycache__
1.png		1.png
DataSave.py		DataSave.py
EySpider.py		EySpider.py
HtmlDownloader.py		HtmlDownloader.py
HtmlParser.py		HtmlParser.py
README.md		README.md
URLManager.py		URLManager.py
__init__.py		__init__.py
config.py		config.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

EySpider

适合新手的基础爬虫框架

改自Python爬虫开发与项目实战（范传辉）

模块功能分析

py文件简要介绍

如何使用

About

Uh oh!

Releases

Packages

Languages

coder-syl/EySpider

Folders and files

Latest commit

History

Repository files navigation

EySpider

适合新手的基础爬虫框架

改自Python爬虫开发与项目实战（范传辉）

模块功能分析

py文件简要介绍

如何使用

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages