机器学习相关知识点
-
常见的传统机器学习模型
- LR
- Softmax
- SVM
- AdaBoostTree
- 决策树(c45,ID3)
- 随机森林
- gbdt
- xgboost
- lightGBM
- ensemble集成模型(bagging,boosting,stacking)
- 关联规则挖掘(apriori, fp-growth)
- 半监督模型,基于图的模型
- 协同过滤
-
神经网络模型
- MLP
- CNN
- RNN(LSTM)
- Attention
- GAN
- word2vector(层次霍夫曼树,负采样), doc2vector
- fasttext
- ctr: LR, gbdt+LR, fm, ffm, PNN, Deep&Wide, DeepFm
- rank: point, pair(rankSVM), list, 基于文本生成的方案。
- online learning: FTRL(Follow-the-regularized-Leader)
-
聚类模型
- kmeans
- 层次聚类
-
主题模型
- plsa
- LDA
- 对数损失函数
- 平方损失函数
- 指数损失函数
- Hinge损失函数
- 交叉熵损失函数
- 梯度下降(批量,随机,小批量):自动调整学习率的(Adagrad,RMSprop,Adam)
- 牛顿法,拟牛顿法
- 共轭梯度法
- 拉格朗日乘数法(约束优化问题)
- SMO优化算法(SVM)
- 正则化,归一化
- 欠拟合与过拟合
- 特征选择(卡方检验)
- 距离计算方法
- BN,droupout
- 词法,句法,语法
- CRF,HMM
- 分词, 词性标注,命名实体识别
- 分类
- 聚类
- 搜索+排序
- 匹配(相似匹配,问答匹配)
- 推荐
- 摘要
- 文本生成
- 翻译
- 问答
- 推理