![模式识别](https://wfqqreader-1252317822.image.myqcloud.com/cover/195/37669195/b_37669195.jpg)
4.2 Fisher线性判别函数
Fisher 线性判别分析是R.A.Fisher于1936年提出来的方法[2]。两类的线性判别问题可以看作把所有样本都投影到一个方向上,然后确定一个分类的阈值。过了这个阈值点且与投影方向垂直的超平面就是两类样本的分类面。如何通过不同投影方向成功地将两类样本分开?
从图4-7中可以看出,按图4-7(a)所示的方向投影后,两类样本混在一起,而按图4-7(b)所示的方向投影后,两类样本很容易区分。显然,图4-7(b)所示的投影方向是更好的选择。Fisher线性判别的思想就是选择投影方向,使得投影后两类样本相隔尽可能远,同时使同一类别的样本尽可能聚集。
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_67.jpg?sign=1738840503-KDYEoGgChhZyztppQEQcnS9h3BdqqJsF-0-58578f2eef57c1e7359af4c9266d609a)
图4-7 样本投影后的区分程度比较
这里只讨论两类分类的问题。设训练样本集={x1,…,xN},每个样本是一个d 维向量,其中第一类样本
=
,第二类样本
=
。找一个投影方向
(
也是d维向量),投影以后的样本变为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_75.jpg?sign=1738840503-WDQRutOynKTc3ljiYp325Nu3XB2E6uXG-0-536571561f0673f9ecce654bd897d639)
(4-10)
其中,i=1,2,…,N。在原样本空间中,类均值向量为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_76.jpg?sign=1738840503-f8zxC1zKa7ZrPDq1NDA5P22ePdeNnzBm-0-16b9221f87a225b0295bb8f158e1d64e)
(4-11)
其中,i=1,2。定义各类的类内离散度矩阵(Within-Class Scatter Matrix),即样本协方差矩阵为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_77.jpg?sign=1738840503-tOikgvN6gCJqppJA69DR2czKRSfGpDoI-0-34b68612d03ca03b85b99b7b0f2b9cee)
(4-12)
总类内离散度矩阵(Pooled Within-Class Scatter Matrix)为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_78.jpg?sign=1738840503-viQobn0VYuHoQF4NZTDC4ki2234K8KTq-0-56b504f1c17f8cf82690bb8f9a30cade)
(4-13)
类间离散度矩阵(Between-Class Scatter Matrix)为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_79.jpg?sign=1738840503-8QcOMSygOmvpH8gp4yiO41VRlVAwqlts-0-47f4cfa404930600dcd744bf61b200a2)
(4-14)
在投影后的一维空间中,两类的均值分别为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_80.jpg?sign=1738840503-J0TAUMHWgBpmci3HEErVhSCQBL27pHGl-0-853c443725beb8877b680a1fca4938bb)
(4-15)
其中,i=1,2。此时,类内离散度为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_81.jpg?sign=1738840503-QgEzX30sP9TqNFxrmJifc70wLftMEWsF-0-1c201707c4fd9d7ec9eb4b6e96120a14)
(4-16)
其中,i=1,2。总类内离散度为,而类间离散度就成为两类均值差的平方,即
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_83.jpg?sign=1738840503-Mzsxd9SYd9c1bcSU2XpWUG7M37JgtPQf-0-1192dfa43fb582b33283283a397be627)
(4-17)
因为人们希望寻找到的投影方向可使投影后的两类样本尽可能分开,而各类内部又尽可能聚集,所以这一目标可以表示成如下的函数。
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_84.jpg?sign=1738840503-mqUVHyjsaFojXKwKGipK2AaDGBb7Kwch-0-c7f762f75e1481ed727d75b062a0fea0)
(4-18)
这就是Fisher判别函数。
把式(4-10)代入式(4-16)和式(4-17)得到
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_85.jpg?sign=1738840503-kO657l1IaS1VOWNVqt9SypuN0VpAxVWo-0-df84c05252481af4e98787bbee0a73e1)
(4-19)
以及
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_86.jpg?sign=1738840503-Qd9cr7O45LaPjqmbKsBHdI3jNmmGXzqs-0-136269f4bf9bb5279798b0020f3c840e)
(4-20)
因此Fisher判别函数变为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_87.jpg?sign=1738840503-FLXi56dRjMKhGAlStVWI4Nmb3cAVWW4t-0-df65091902298529e474a4d15cd697d2)
(4-21)
应注意到,我们的目的是求使式(4-21)最大的投影方向。由于对
幅值的调节并不会影响
的方向,即不会影响
的值。因此,可以设定式(4-21)的分母为非零常数而最大化分子部分,即把式(4-21)的优化问题转化为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_92.jpg?sign=1738840503-llmWtVixayhOTfXEd1ld9mZPrXmIzY0i-0-82017cb0b31606efb8a8cc09fd021c0e)
(4-22)
这是一个等式约束下的极值问题,可以通过引入拉格朗日(Lagrange)乘子转化成以下拉格朗日函数的无约束极值问题。
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_93.jpg?sign=1738840503-WJafPdn5KH287qMZl9aw7HGEcWKTQlDS-0-b70c6e7530a3debc9739f67ba02536d9)
(4-23)
在式(4-23)的极值处应满足
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_94.jpg?sign=1738840503-wBdGuZyroTnSurkBtJWADoFalcMZFIQQ-0-bf66e82dbc7f923e5ced30ecbbe2e579)
(4-24)
由此可得,极值解应满足
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_96.jpg?sign=1738840503-ax99WcK6smkOoCBWQvWPl17Zmo28xQOW-0-6abfc377924fe6c9b4c10e7db73fe2b7)
(4-25)
假定是非奇异的,把式(4-14)变为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_98.jpg?sign=1738840503-WLBWDvvuQNpLrMurbYSENWk6ihRUIO7R-0-1ed7d6905bced5889277eff75a316517)
(4-26)
其中,的方向是由
决定的。我们要求解的是
的方向,因此可以取
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_102.jpg?sign=1738840503-Pi65UNqC2AtlUujiFYzcTDkTfDcP0p4V-0-753ed5465c7d45ceb32a1171ec07b65f)
(4-27)
这就是Fisher判别准则下的最优投影方向。
需要注意的是,Fisher线性判别函数最优的解本身只给出了一个投影方向,并没有给出我们要的决策面,想要得到决策面,需要在投影后的一维空间上确定一个分类阈值。若不考虑先验概率的不同,则可以采用阈值
,其中
是所有样本在投影后的均值。
直观地解释,Fisher线性判别就是把待决策的样本投影到Fisher线性判别的方向上,通过与两类均值投影的平分点进行比较做出分类判别。在先验概率相同的情况下,以该平分点为两类样本的分界点;在先验概率不同的情况下,分界点向先验概率小的一侧偏移。
Fisher 线性判别并不假设样本分布,但在很多情况下,当样本维数比较高且样本数较多时,投影到一维空间后,样本接近正态分布。此时可以在一维空间中用样本拟合正态分布,并用得到的参数来确定分类阈值。