Skip to content

baifachuan/policy_pyspider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

项目介绍

关注国内官方政府网站,获取政策动向,将获取的数据存储支数据库。

样例

样例如上所示。

如何运行

通过 scrapy crawl gov 命令即可运行,如果需要保存成本地文件,可使用类似:

scrapy crawl gov -o gov.json

保存成不同格式,如果需要将数据保存至数据库,先创建表结构:

create database if not exists policy_db;
use policy_db;
create table if not exists policy(id int  AUTO_INCREMENT PRIMARY KEY, name varchar(256), link varchar(256), publishDate varchar(256), policyType varchar(256), reqeustURL varchar(256), created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP)

修改settings.py文件中的数据库连接信息。

About

国内国家政策数据抓取项目,方便实时关注国家政策动向,快速了解信息。

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages