Skip to content

PythonSpiderMan/Zhihu

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

知乎用户和关系

项目说明

本项目为个人学习使用, 计划使用tornado做数据可视化后端, 采集了一部分知乎用户信息和关注/粉丝关系数据, 采集用户200w及关系4000w后停掉了爬虫

使用scrapy和scrapy-redis, mysql做存储

用户 关注关系

运行流程

  • 搭建环境
conda create --name=zhihu python=3.5
source activate zhihu
pip install -r requirements.txt
  • 修改settings.py中的mysqlredis连接
  • 如果有代理修改proxyMiddleware.py或降低抓取频率
  • python run.py

About

知乎用户和关系

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages