-
Notifications
You must be signed in to change notification settings - Fork 38
Description
你是否已经阅读并同意《Datawhale开源项目指南》?
- 我已阅读并同意《Datawhale开源项目指南》
你是否已经阅读并同意《Datawhale开源项目行为准则》?
- 我已阅读并同意《Datawhale开源项目行为准则》
项目简介
本项目将提供一个因果推断的教程,兼具友好性和深度。在介绍经典图模型的因果推断方法的同时,向学习者提供使用Python进行因果推断的解决方案。使得学习者可以经过这个教程拥有一个看待问题的新视角——因果透镜的视角。
立项理由
大多数人对于“数据就是一切”这个论断深信不疑。因果这个词经受历史上诸多哲学上和统计学上的思辨之后被一度认为是“模糊”和“不严谨”的。然而人类对世界的建模是基于因果的模型——我们从小就学会了这一点。Judea Pearl教授等领衔了新世纪的因果革命,而现在因果推断已成为很多数据科学研究者的必备技能。
项目受众
任何掌握大学《概率论与数理统计》的学习者,掌握一定的算法知识和图论等相关知识的学习者更佳。
项目亮点
中文社区缺乏因果推断相关方面的系统性书籍和教程。Datawhale 内部没有相关开源教程。在市场上存在的中文书籍有《因果推断入门》《因果推断》《因果推断:基于图模型的分析》《因果论》(Judea Pearl教授)著作的中译版。在bilibili视频平台上,有up主饺子博士and饭老师发布的因果推断段教程,而其他因果推断的中文材料教程寥寥。现存的书籍大多作为科普书籍浅尝辄止,读者知因果,而难以对复杂的因果模型进行分析,遑论编程实现。Judea Pearl教授所著《因果论》则较为厚重,而本教程主要参考的《因果推断:基于图模型的分析》则相对适中,而其中存留不少问题,例如书中采用R语言编写,对不熟悉者添加了新语言学习的负担;以及书中的部分符号体系不慎严谨、伪代码不甚简练美观。
本教程不求出类拔萃(毕竟本人也在学习中),而意在寻求某种平衡点,尝试着应对上述问题的可能解决方案:在易懂和严谨之间的平衡、在简单和深度之间的平衡、在短篇和长篇之间的平衡以及在理论和实践中的平衡。
项目规划
1 目录及预计完成日期(草案,在开发过程中可能出现因为某章过长而拆分成两章的情况,也有可能在后期添加新章节的情况)
- (4月01日)绪论
- (4月08日)数学基础
- (4月13日)图模型和结构因果模型
- (4月20日)图模型的分析
- (4月27日)图模型的概率分布和图模型分析的简单编程实现
- (5月04日)反事实
- (5月11日)干预
- (5月18日)因果关系的概率分析
- (5月25日)复杂条件下的因果推断
- (6月3日)图模型的学习
- (6月10日)因果推断和应用
2 负责人
何瑞杰
4 可预见的困难
可预见的困难为第一阶段的学习本身的时间消耗不定,且与其他个人事务的时间排期和冲突导致的延期。期望延期时长为一个月。在完成后,若可能,将会因在最初用到《因果推断:基于图模型的分析》及相关著作的作者取得联系以获取许可,并(如果可能的话)联系出版社沟通出版相关事宜。
项目负责人
姓名:何瑞杰
Github主页:https://github.com/hrjtju
微信:gravitas_tju
备注:发起立项申请后DOPMC成员将会在7天内给出审核意见,若7天内无反对意见则默认立项通过~
- 我已知悉上述备注