历时1个月的学习周期,对Python的认识又更进一步,所以想记录下自己这一个月来的收获。
从最基础的开始学起,并生成了基本的数据存储读取系统。
从解析网页源码学起,爬取网页数据,并爬取了PM2.5数据存入Mysql数据库,利用百度API爬取经纬度,爬取书评、影评、图片等等。
学习如何生成md5码,并实现浏览器自动化操作。
对matplotlib的用法进一步掌握,并结合GDP爬取的历年数据生成走势图。
用python对word文件进行操作,调整格式、批量生成、批量替换多文件内容等等。
分词、统计词频、采集关键字、制作词云图,十九大报告词云图、上海2035规划词云图。
做数据挖掘用的最多的包,再次熟悉了pandas的用法,对日后数据挖掘帮助很大。
学会图片的基本处理,以及利用opencv自带的模型实现了人脸识别的后续开发,当然算法是核心,日后会自己训练一个模型的。比如做了人脸识别的抓拍、人脸登录。
但是很遗憾tesseract-orc在做验证码识别时,需要对图片进行灰度和黑白处理,没成功,就先搁置了。
期间,还做了个抽奖小程序,包含随机抽样、概率分布抽样、随机不重复抽样三种类型。