首页 » python机器学习 » python机器学习全文在线阅读

《python机器学习》6.2 使用k折交叉验证评估模型性能

关灯直达底部

构建机器学习模型的一个关键步骤就是在新数据上对模型的性能进行评估。现在假设我们使用训练数据集对模型进行拟合,并且使用同样的数据对其性能进行评估。回忆一下3.3.4节,如果一个模型过于简单,将会面临欠拟合(高偏差)的问题,而模型基于训练数据构造得过于复杂,则会导致过拟合(高方差)问题。为了在偏差和方差之间找到可接受的折中方案,我们需要对模型进行评估。在本节,读者将学到有用的交叉验证技术:holdout交叉验证(holdout cross-validation)和k折交叉验证(k-fold cross-validation),借助于这两种方法,我可以得到模型泛化误差的可靠估计,即模型在新数据上的性能表现。