这是一个系统性的统计学习与自然语言处理(NLP)算法学习项目,逐步实现各种机器学习算法。本项目旨在帮助学习者深入理解算法原理,并通过代码实践掌握算法实现细节。
th-nlp-learning/
├── 1. 统计学习方法/
│ ├── book/ # 相关书籍资料
│ └── codes/ # 算法代码实现
│ ├── 第02章 感知机/
│ ├── 第03章 k近邻法/
│ ├── 第04章 朴素贝叶斯法/
│ ├── 第05章 决策树/
│ ├── 第06章 逻辑斯蒂回归与最大熵模型/
│ └── ...
└── README.md
欢迎关注我们的微信公众号「三黄工作室」,获取更多技术分享、学习资源和算法解析!
在这里你可以找到:
- 📘 深度技术文章解析
- 📚 系统化的学习路线
- 🔥 最新AI技术动态
- 💡 实用编程技巧
| 章节 | 算法 | 状态 | 说明 |
|---|---|---|---|
| 第02章 | 感知机(Perceptron) | ✅ | 原始形式实现,带可视化 |
| 第03章 | k近邻法(KNN) | ✅ | KD-Tree实现,支持低维高效搜索 |
| 第04章 | 朴素贝叶斯法 | ✅ | 多项式模型,拉普拉斯平滑 |
| 第05章 | 决策树 | ✅ | ID3(信息增益)、C4.5(信息增益率)、CART(基尼指数) |
| 第06章 | 逻辑斯蒂回归与最大熵模型 | ✅ | 二分类、多分类模型(手写+sklearn对比) |
| 第07章 | 支持向量机 | ✅ | 线性SVM(原始形式)、非线性SVM(RBF/多项式/Sigmoid核) |
| 第08章 | 提升方法 | ✅ | AdaBoost、GBDT(手写实现+对比) |
| - | - | 🚧 | 努力更新中... |
本项目使用 uv 管理依赖:
# 安装 uv(如果未安装)
pip install uv
# 同步依赖
uv sync- Python >= 3.11
- matplotlib >= 3.10
- numpy >= 2.2
- scikit-learn >= 1.7
本项目采用 MIT License。
⭐ 如果这个项目对你有帮助,请给我们一个Star!
欢迎提交 Issue 和 Pull Request!
如有问题或建议,请通过以下方式联系我们:
- 提交 Issue
- 关注微信公众号「三黄工作室」
