首页 » python机器学习 » python机器学习全文在线阅读

《python机器学习》3.1 分类算法的选择

关灯直达底部

由于每个算法都基于某些特定的假设,且均含有某些缺点,因此需要通过大量的实践为特定的问题选择合适的算法。再次借用一下“没有免费午餐”理论:没有任何一种分类器可以在所有可能的应用场景下都有良好的表现。实践证明,只有比较了多种学习算法的性能,才能为特定问题挑选出最合适的模型。这些模型针对不同数量的特征或者样本、数据集中噪声的数量,以及类别是否线性可分等问题时,表现各不相同。

总而言之,分类器的性能、计算能力和预测能力,在很大程度上都依赖于用于模型训练的相关数据。训练机器学习算法所涉及的五个主要步骤可以概述如下:

1.特征的选择

2.确定性能评价标准

3.选择分类器及其优化算法

4.对模型性能的评估

5.算法的调优

由于本书通过循序渐进的方式讲解机器学习的相关内容,因此本章将重点介绍不同分类算法的基本概念,并再次回顾特征选择、预处理及性能评价标准等内容,而关于超参调优等更详细的内容将在本书的后续章节讨论。