在前面的章节中,我们学习了许多关于监督学习的概念,并且针对分类问题训练了许多不同的模型来预测成员分组或样本的类别归属。本章我们将进入监督学习的另一个分支:回归分析(regression analysis)。
回归模型(regression model)可用于连续型目标变量的预测分析,这使得它在探寻变量间关系、评估趋势、作出预测等科学及工业领域应用中极具吸引力。具体的例子如:预测公司在未来几个月的销售情况等。
在本章,我们将介绍回归模型的主要概念,将涵盖如下主题:
·数据集的探索与可视化
·实现线性回归模型的不同方法
·训练可处理异常值的回归模型
·回归模型的评估及常见问题
·基于非线性数据拟合回归模型