这个系列是李航统计学习方法一书中的主要算法的python手工实现,主要是用来增加对基础机器学习算法的理解程度,包括以下几个方面: 多分类 KNN 数据集为sklearn中的iris(鸢尾花)分类 朴素贝叶斯 决策树 二分类 感知机 数据集为sklearn中的iris(鸢尾花)分类 逻辑回归 SVM Adaboost(提升树) 回归模型 1.梯度提升树(GBDT)(包含了回归树的实现)(波士顿房价数据集) 中文分词 1.隐马尔可夫模型(中文分词,人民日报1998语料库) 聚类: 1.层次聚类(hierarchical_clustering)与K-means(对鸢尾花数据进行聚类) 降维: 1.PCA(基于svd奇异值分解) 参数估计: 1.GMM(EM算法应用)