![Python机器学习算法与应用](https://wfqqreader-1252317822.image.myqcloud.com/cover/455/34752455/b_34752455.jpg)
上QQ阅读APP看书,第一时间看更新
2.4.3 主成分的导出
根据主成分分析的数学模型的定义,要进行主成分分析,就需要根据原始数据以及模型3个条件的要求,求出主成分系数,以便得到主成分模型。这就是导出主成分所要解决的问题。
(1)根据主成分数学模型的条件①要求主成分之间互不相关,为此主成分之间的协差阵应该是一个对角阵。对于主成分,
F=AX
(2.49)
其协差阵应为,
![](https://epubservercos.yuewen.com/E04642/18562448708360306/epubprivate/OEBPS/Images/ZQ-185-009_inline_0109.jpg?sign=1738818301-j7qbUiWaBw5e7ttR27SW7dEpsd9GwU3H-0-c95366dfa2badbfbb027072d06850657)
(2.50)
(2)设原始数据的协方差阵为V,如果原始数据进行了标准化处理,那么协方差阵等于相关矩阵,即有
V=R=XX'
(2.51)
(3)根据主成分数学模型条件③和正交矩阵的性质,若能够满足条件③最好要求A为正交矩阵,即满足
AA'=I
(2.52)
将原始数据的协方差代入主成分的协差阵公式,得
![](https://epubservercos.yuewen.com/E04642/18562448708360306/epubprivate/OEBPS/Images/ZQ-185-009_inline_0112.jpg?sign=1738818301-iKyMKGSYmxXX2jXLnL96AzmtfyobYxh8-0-1746bfdc6538e3057baa848adda3255d)
(2.53)
展开上式,得
![](https://epubservercos.yuewen.com/E04642/18562448708360306/epubprivate/OEBPS/Images/ZQ-185-009_inline_0113.jpg?sign=1738818301-C1aK93EKQ8iodGvX0WrR8MJHAVHTH34R-0-e981150fbcbf9e3a01bc376aeb39f717)
(2.54)
展开等式两边,根据矩阵相等的性质,这里只根据第一列得出的方程为:
![](https://epubservercos.yuewen.com/E04642/18562448708360306/epubprivate/OEBPS/Images/ZQ-185-009_inline_0114.jpg?sign=1738818301-8B5gTmx8nhRPG3Zym73lAjGPgDZ7vY2d-0-8fc0c64e6c6afb73ef92b4cdf5f7b4a4)
(2.55)
为了得到该齐次方程的解,要求其系数矩阵行列式为0,即
![](https://epubservercos.yuewen.com/E04642/18562448708360306/epubprivate/OEBPS/Images/ZQ-185-009_inline_0115.jpg?sign=1738818301-T3aliafnlCqoyPcfyk3Md7AJR8VMQoKq-0-074bac766f8cbb3ba3cc80e1edadb354)
(2.56)
|R-λ1I|=0
显然, 是相关系数矩阵的特征值,
是相应的特征向量。根据第二列、第三列等可以得到类似的方程,于是
是方程|R-λI|=0的p个根,
为特征方程的特征根,
是其特征向量的分量。