首页 » python机器学习 » python机器学习全文在线阅读

《python机器学习》本章小结

关灯直达底部

本章的开始着眼于正确处理缺失数据的有用技术。在我们将数据导入到机器学习算法之前,应保证已对类别变量进行了正确的编码,我们还分别讨论了如何将有序特征和标称特征的值映射为整数的方法。

此外,我们还简要地讨论了L1正则化,它可以通过降低模型的复杂度来帮助我们避免过拟合。作为另外一种剔除不相关特征的方法,我们使用了序列特征选择算法从数据集中选择有意义的特征。

在下一章中,读者将学到另外一种降维的有效方法:特征提取。它使得我们可以将特征压缩到一个低维空间,而不是像特征选择那样完全剔除不相关特征。