![智能计算:原理与实践](https://wfqqreader-1252317822.image.myqcloud.com/cover/961/45852961/b_45852961.jpg)
上QQ阅读APP看书,第一时间看更新
1.1.1 机器学习问题的基本框架
机器学习(Machine Learning)是现代智能技术中重要的一个方面,是一个系统自我改进的过程,可以从观测样本去研究、分析对象,去预测输出。机器学习问题的基本模型框架如图1.1.1所示。输入信号x经过系统得到输出信号y,学习机根据训练样本对系统的输入/输出做出估计,得到最准确的预测输出。其数学表述为:输入变量x与输出变量y之间存在一定的未知依赖关系,即服从某一未知的联合概率密度pXY(x,y)。机器学习的目的就是根据N个独立同分布的观测样本(x(1),y(1)),(x(2),y(2)),…,(x(N),y(N)),在一组函数{f(x,w)}中求出最优的函数f(x,w0)对依赖关系进行估计,使期望风险R(w)最小。
![](https://epubservercos.yuewen.com/2C2AFB/24975619809585106/epubprivate/OEBPS/Images/14_02.jpg?sign=1738964902-zetRgtBEe30CBxf1yjCSvNH5l7hmgsWY-0-c7c7a6a5bbcf96677e3ab800271c83bf)
图1.1.1 机器学习问题的基本模型框架
![](https://epubservercos.yuewen.com/2C2AFB/24975619809585106/epubprivate/OEBPS/Images/14_03.jpg?sign=1738964902-e1P1n8W8kOcm54n7eSQ7wRzIF2miWNMt-0-85e3479a7461eb94ec8e7a50cb63d239)
式中,{f(x,w)}为预测函数集,w为函数的广义参数,所以{f(x,w)}可表示为任何函数集。L(y,f(x,w))为损失函数,表示由于对y进行预测而造成的损失。
机器学习问题根据不同的学习目的可分为三类基本的学习问题,即模式识别、函数拟合及概率密度估计。
在模式识别问题中,输出变量y即为类别,可用二值函数{0,1}或{-1,1}来表示。此时,预测函数f(x,w)称为指示函数,损失函数定义为
![](https://epubservercos.yuewen.com/2C2AFB/24975619809585106/epubprivate/OEBPS/Images/14_04.jpg?sign=1738964902-XAWHKZqbHqjBMJu3rBfcry34HavoUGTj-0-9977db5f2a532519c1bda4ba4f56ddb8)
在函数拟合问题中,变量y是x的函数,y是连续变量,所以损失函数可以用平方误差表示,即
![](https://epubservercos.yuewen.com/2C2AFB/24975619809585106/epubprivate/OEBPS/Images/14_05.jpg?sign=1738964902-17i0OGHR9hZlgftk4RMLp5VlCI6d80Tm-0-22e5e2bd8f84e954168141341edbd218)
在概率密度估计问题中,学习的目的就是根据训练样本确定输入变量x的概率密度,所以设估计的概率密度函数为p(x,w),则损失函数可定义为
![](https://epubservercos.yuewen.com/2C2AFB/24975619809585106/epubprivate/OEBPS/Images/14_06.jpg?sign=1738964902-xX2ebr81iGY2TZPrcXFu4tljUzLHNOaY-0-241a23375c4323b52062e3c57fa7b850)