Skip to content

Latest commit

 

History

History
21 lines (21 loc) · 1.49 KB

File metadata and controls

21 lines (21 loc) · 1.49 KB

总结1

历时1个月的学习周期,对Python的认识又更进一步,所以想记录下自己这一个月来的收获。

os, shutil, glob包,还有open用法

从最基础的开始学起,并生成了基本的数据存储读取系统。

urllib, requests, re, bs4包

从解析网页源码学起,爬取网页数据,并爬取了PM2.5数据存入Mysql数据库,利用百度API爬取经纬度,爬取书评、影评、图片等等。

hashlib, selenium包

学习如何生成md5码,并实现浏览器自动化操作。

matplotlib包

对matplotlib的用法进一步掌握,并结合GDP爬取的历年数据生成走势图。

win32com包

用python对word文件进行操作,调整格式、批量生成、批量替换多文件内容等等。

jieba包

分词、统计词频、采集关键字、制作词云图,十九大报告词云图、上海2035规划词云图。

pandas包

做数据挖掘用的最多的包,再次熟悉了pandas的用法,对日后数据挖掘帮助很大。

opencv包和tesseract-orc

学会图片的基本处理,以及利用opencv自带的模型实现了人脸识别的后续开发,当然算法是核心,日后会自己训练一个模型的。比如做了人脸识别的抓拍、人脸登录。
但是很遗憾tesseract-orc在做验证码识别时,需要对图片进行灰度和黑白处理,没成功,就先搁置了。

其他

期间,还做了个抽奖小程序,包含随机抽样、概率分布抽样、随机不重复抽样三种类型。