Dr. SAS專欄

【資料處理篇】如何運用SAS EM 進行變數篩選(下)

2014/10/07

Variable Selection node案例情境說明 根據上篇的介紹,接下來將透過案例情境詳細展示 Variable Selection node 的變數篩選結果,輔助說明的資料集為 SAMP ...

【資料處理篇】如何運用SAS EM 進行變數篩選(上)

2014/09/25

擬定分析主題後,在正式進入分析之前,分析材料的準備是資料探勘中極重要的工作環節,分析者須針對欲研究主題列示一份的變數清單,應依分析目的與假設、研究對象與範圍等列式出研究主題可能的相關變數。 在大型的 ...

【資料處理篇】如何運用SAS EM繪製圖表以快速瀏覽大量資料

2014/09/29

在SAS EM匯入分析資料後,建議讀者先運用幾個EM分析節點進行資料的檢視與瀏覽,檢視原始資料集其實是資料分析很重要的基本功能,可以培養對資料的敏感度,每一筆資料都是一個行為發生,透過直接的檢視資料, ...

【資料處理篇】如何運用SAS EM 進行樣本預區隔與極值偵測(下)

2014/08/18

  延續『【資料處理篇】如何運用SAS EM 進行樣本預區隔與極值偵測(上)』文章說明   Filter node案例情境說明    接下來將透過案例情境詳細展示 ...

【資料處理篇】如何運用SAS EM 進行樣本預區隔與極值偵測(上)

2014/08/18

  SEMMA 方法論第一步的「S」即為Sample,此處的Sample有多個意涵,一為分析樣本的定義,如何從分析母體抽取適當的樣本資料,以及如何選擇最適抽樣。SEMMA方法論告訴分析者當進行分析建模 ...

【資料處理篇】如何運用SAS EM進行變數處理與衍生變數產生(下)

2014/07/18

  Transform Variables node變數轉換的案例情境說明   延續『如何運用SAS EM進行變數處理與衍生變數產生(中)』文章說明   4. ...

【資料處理篇】如何運用SAS EM進行變數處理與衍生變數產生(中)

2014/07/03

  Transform Variables node變數轉換的案例情境說明 變數轉換的資料處理,若資料有遺漏,建議先透過 Impute node 處理缺失值問題,再進 ...

【資料處理篇】如何運用SAS EM進行變數處理與衍生變數產生 (上)

2014/06/17

資料探勘分析是一種科學方法,然而在資料處理與流程設計卻是門藝術。同一份資料集,不同的分析人員即便選用同一種分析工具,都極可能會產生不同的模型分析結果與應用方向,差異在於分析者對各資料解讀的深度、變數的 ...

【資料處理篇】如何運用SAS EM進行遺失值處理(下)

2014/06/02

Impute node遺失值補值的方法 本期將針對 Impute node 的各種方法的使用建議再做詳細說明: ■  母體的統計量補值方法: 平均數(Mean)為最常用來做連 ...

【資料處理篇】如何運用SAS EM進行遺失值處理(上)

2014/05/18

在真實資料現況裡,分析資料並非完美無虞,往往會有許多資料品質上的問題,難以著手分析,尤其是 遺失值 (Missing value) 的問題在資料預處理階段更是常見處理議題。 交易 ...

1 2 3 4