回上層

Enterprise Guide

簡單線性迴歸分析實例(迴歸假設)

迴歸分析是統計學上常用的分析方法,主要在建立一個函數(最能夠代表變數間的所有觀測資料),並用此函數來代表應變數和自變數之間的數學模式,以便觀察特定的變數來預測我們所感興趣的變數。若特定的變數(X)和有興趣的變數(Y)的數目都為一個,則我們稱此模型()為簡單線性迴歸分析。

另外要注意的是,建立迴歸分析前須檢查資料是否符合迴歸分析的三個假設-獨立、常態及均質。

 

範例中,我們使用SAS EG的範例資料CLASS。請選擇伺服器清單->伺服器->本機->資料館->SASHELP->CLASS

 1

 

在工作的快捷選單中選擇分析->迴歸->線性迴歸

 2

 

在左側的選單中選擇資料,將要指派的欄(A)中的Height和Weight兩變數,分別拖曳至右側工作角色(T)中的應變數及解釋變數的變數欄中。

 3

 

在左側的選單中選擇統計值,勾選不等變異性檢定(H)

4 

 

在左側的選單中選擇預測,勾選原始樣本(O)及殘差值(U),按下執行(R)。

5 

 

進行迴歸分析前,我們要先檢測資料是否有滿足迴歸分析的3大假設-獨立、常態及均質。其中獨立的部分,應視分析者對資料的了解來判別資料間有無獨立。而常態的假設可以檢視殘差的圖形(直方圖、QQ-Plot、箱型圖) 或是利用其他統計方法(SW,KS,CV,AD)檢定殘差值來判別。均質的假設可以由殘差圖的檢視或是利用SAS的不等變異性檢定之。

以下我們對三個假設作進一步的說明。

  1. 均質性

由SAS分析的結果圖表(RStudent*預測 for Height)中看出,殘差均勻分布在-2~2之間,故我們可以推論殘差具有均質性。

 6

或者我們可以利用第一和第二動差規格的檢定來檢定殘差是否均質,由下表得知p-value=0.282 > ,在假設檢定中我們不拒絕,也就是我們沒有充份證據顯示該資料不具有均質性。故我們接受均質性的假設。

 

 7

2. 常態性

由QQ-Plot圖中,看出殘差和常態分位數的分布,散落在45度的直線上。所以由此推斷殘差也具有常態性。

 8

或者我們可以利用SAS的常態性檢定(Shapiro-Wilk)來檢定殘差。

在流程圖中點選SASHELP.CLASS 的線性迴歸預測及統計值

 9

選擇描述->分配分析

 10

 

在左側的選單中選擇資料,將要指派的欄(A)中的residual_Height變數拖曳至右側工作角色(T)中的分析變數的變數欄中。

11  

在左側的選單中選擇表格,勾選常態性檢定後選擇執行(R)。

 12

  

由下表得知p-value=0.1063 > ,故在假設檢定中我們不拒絕Ho,也就是我們沒有充份證據顯示該資料不具有常態性。所以我們接受常態性的假設。

 13

3.獨立性

本次分析沒有執行獨立性的檢定,因為作者認為該資料具有獨立性,並不需要利用統計分析證明之。

若是無法判定資料是否具獨立性而需藉由統計檢定輔助,我們可以在迴歸分析的步驟中,於左側的選單中選擇統計值,勾選Durbin-Watson統計值選項,即可獲得一階自我相關值來判定之。

 14

 

回上層