Dr. SAS專欄

【資料處理篇】如何運用SAS EM進行變數處理與衍生變數產生(中)

2014/04/03

  Transform Variables node變數轉換的案例情境說明 變數轉換的資料處理,若資料有遺漏,建議先透過 Impute node 處理缺失值問題,再進 ...

【資料處理篇】如何運用SAS EM進行變數處理與衍生變數產生 (上)

2014/03/17

資料探勘分析是一種科學方法,然而在資料處理與流程設計卻是門藝術。同一份資料集,不同的分析人員即便選用同一種分析工具,都極可能會產生不同的模型分析結果與應用方向,差異在於分析者對各資料解讀的深度、變數的 ...

【資料處理篇】如何運用SAS EM進行遺失值處理(下)

2014/03/02

Impute node遺失值補值的方法 本期將針對 Impute node 的各種方法的使用建議再做詳細說明: ■  母體的統計量補值方法: 平均數(Mean)為最常用來做連 ...

【資料處理篇】如何運用SAS EM進行遺失值處理(上)

2014/02/18

在真實資料現況裡,分析資料並非完美無虞,往往會有許多資料品質上的問題,難以著手分析,尤其是 遺失值 (Missing value) 的問題在資料預處理階段更是常見處理議題。 交易 ...

【資料處理篇】如何運用SAS EM進行各式抽樣及過度抽樣(下)

2014/01/26

抽樣的適當與否對於模型的準確性與可解釋性有很大的影響,因此抽樣設計在模型建置程序裡是很重要的研究議題,也因此Dr.SAS特闢系列專欄來詳細介紹抽樣方法與SAS EM sample node的各種抽樣方 ...

【資料處理篇】如何運用SAS EM進行各式抽樣及過度抽樣(中)

2014/01/14

接續上期抽樣方法介紹,本期Dr.SAS將將繼續介紹在EM Sample node裡如何進行分群抽樣、分層抽樣,以及運用Sample node進行過度抽樣的方法。   5 分群抽樣:Clu ...

【資料處理篇】如何運用SAS EM進行各式抽樣及過度抽樣(上)

2014/01/02

本期開始Dr. SAS將會系列介紹如何運用SAS EM進行模型建置前的各項資料處理,首先將介紹Sample node的使用方法。在SAS EM建模方法論SEMMA的工作循環裡,SAS EM告訴我們分析 ...

活學活用分群分析--如何運用SAS EM Cluster node進行客群分析(下)

2013/12/14

分群結果重在行銷命名與應用 分群分析的結果產出通常不會一次就滿足分析者的需求,往往會透過多次的產出結果的解讀與群集的調整,來找到最適合的群集結果。 分群的結果追求的不是模型的準度而是它的應用性,哪 ...

活學活用分群分析--如何運用SAS EM Cluster node進行客群分析(上)

2013/11/30

前幾期介紹的決策樹、迴歸分析、類神經網路等都屬於資料探勘中預測模型的演算方法。所謂模型預測,即是有所謂的預測目標變數值的產出。  這種有預測對象的演算方法,我們又稱之為監督式學習方法。另外 ...

類別資料轉數值資料

2013/11/28

我們在建立數學模型分析時,常常會需要將類別資料轉成啞變數(dummy variable)。下面我們將提供一個簡單的程式,可以讓SAS自動的將類別資料轉成啞變數。   範例中,我們使用SA ...

1 2 3