![快乐机器学习](https://wfqqreader-1252317822.image.myqcloud.com/cover/216/32375216/b_32375216.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
技术附录
A.真实误差分解
回顾3.2.2节中的例子,对于所有房子面积x和真实房价y,真实误差的表达式为
真实误差=Ex,y[(y-hw(x))2]
需要注意的是,每次的训练集也都是随机选择的。假设有1000个数据,今天选择前100个数据,明天选择后100个数据,后天选择中间的100个数据,每次拟合得出的模型都不同。因此,我们要用不同的训练集来计算真实误差(拟合得出不同的房价h和真实房价y),然后求平均值,这被称为预期误差,其严谨的数学公式为:
![](https://epubservercos.yuewen.com/45CD09/17493186306223006/epubprivate/OEBPS/Images/37590_89_1.jpg?sign=1738989951-TkEvx7CSlqPEgICr45k0v6B5w2RT40Ku-0-f1f80dd557cba0a9022cfa2c1d80b63c)
接下来,我们从数学上来推出真实误差是偏差、方差和噪声的总和。
![](https://epubservercos.yuewen.com/45CD09/17493186306223006/epubprivate/OEBPS/Images/37590_89_2.jpg?sign=1738989951-GfYhvWABV22afUxPcJpk2lz4uHQs0k0O-0-55931a4a5170e90d027fbfe829a4224a)
![](https://epubservercos.yuewen.com/45CD09/17493186306223006/epubprivate/OEBPS/Images/37590_90_1.jpg?sign=1738989951-otqg1GXoTrT0fYYGXI5ixhpXklgTdlVo-0-161daeb6a609f0cfa655cf62d607af5c)
假设数据没有噪声,真实误差只被分解成偏差和方差,那么证明更加简单。
![](https://epubservercos.yuewen.com/45CD09/17493186306223006/epubprivate/OEBPS/Images/37590_90_2.jpg?sign=1738989951-eWk2ODjYndedqQ6eH5IWuh1V6ZMjAm6p-0-2214ea79dab92c0e2f41042a3ad1c77b)