![机器学习公式详解(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/870/48600870/b_48600870.jpg)
上QQ阅读APP看书,第一时间看更新
1.3 假设空间
本节的重点是理解“假设空间”和“版本空间”,下面以“房价预测”举例说明。假设现已收集到某地区近几年的房价和学校数量数据,希望利用收集到的数据训练出能通过学校数量预测房价的模型,具体收集到的数据如表1-1所示。
表1-1 房价预测
![](https://epubservercos.yuewen.com/017289/28243954404459306/epubprivate/OEBPS/Images/f1-1.jpg?sign=1738924346-4MCkPihZkSfSGabGlftHfFuD32YA40RG-0-f4ab5c96f29abac37de0fff9d5a97e9d)
基于对以上数据的观察以及日常生活经验,不难得出“房价与学校数量成正比”的假设。若将学校数量设为,房价设为
,则该假设等价表示学校数量和房价呈
的一元一次函数关系,此时房价预测问题的假设空间即为“一元一次函数”。在确定假设空间以后,便可采用机器学习算法从假设空间中学得模型,即从一元一次函数空间中学得能满足表1-1中数值关系的某个一元一次函数。学完第3章的线性回归可知,当前问题属于一元线性回归问题,根据一元线性回归算法可学得模型为
。
除此之外,也可以将问题复杂化,假设学校数量和房价呈的一元二次函数关系,此时问题变为线性回归中的多项式回归问题,按照多项式回归算法可学得模型为
。因此,以表1-1中的数据作为训练集可以得到多个假设空间,且在不同的假设空间中都有可能学得能够拟合训练集的模型,我们将所有能够拟合训练集的模型构成的集合称为“版本空间”。