回上層

Enterprise Guide

主成分分析

在多變量分析中,主成分分析(Principal components analysis, PCA)是一種分析、簡化數據集的技術。利用原有的變數組合成新的變數,以達到資料縮減的目的,但卻能夠保留住數據本身所提供的重要資訊。由於主成分分析主要依賴數據提供的訊息,所以數據的準確性對分析結果影響很大。

資料說明:

此例中的資料是選定某些城市在一月和七月的日平均氣溫。主要用來說明主成分分析是如何將原始變量做正交旋轉成新的變數。

 

1

 

下圖是資料中一月和七月的日平均氣溫所繪製的散佈圖,由圖中可觀察到各城市一月和七月之日均溫的關係。

 

2

 

在工作的快捷選單中選擇<分析>→<多變量>→<主成分(P)>

 

3

 

於左側的選單中選擇<資料>,將要指派的變數(A)中的<January>和<July>變數拖曳至右側工作角色(T)中的分析變數欄中

 

4

 

在左側的選單中選擇<分析>,在分析(A)中選擇<共變異數>。

 

5

 

在左側的選單中選擇<標繪圖>,勾選<建立主成分計分的散佈圖(M)>及<建立模型成分圖(C)>選項,按一下<執行>

 

6

 

結果如下表所示:

總變異數為163.474,其中第一主成分解釋了約94%的總變異,而第二主成分解釋的變異約只有6%。在特徵向量表中,PRIN1中一月(January)所占的比例比較高,因為一月的資料比七月的資料有更高的標準差(Std)11.7124。

 

7

 

由模型成分圖可以看出原始變數和對應的主成分變數之間的關係。

 

8

 

由成分計分圖中可看出主成分是原始變量的和,第一主成分具有比所述第二主成分較大的方差正交旋轉。

實際上,第一主成分比各自原始變量(七月和一月)有較大的變異。另外,我們可觀察到落在橢圓外的3筆資料為可能的離群值。

 

9

 

回上層