SPSS 統計分析資料探勘教學與分享技術問題解決產品諮詢: 11月 2012

2012年11月15日星期四

IBM SPSS Statistics Base 21新增功能

分析方法

● 蒙地卡羅模擬方法(Monte-Carlo Simulation)：當模型擁有不確定性的因子，可透過蒙地卡羅(Monte-Carlo)模擬方法建立更好的模型並進行風險評估。

● 快速執行敘述統計：透過資料編輯視窗點擊右鍵或是快捷鍵即可操作敘述統計。

檔案讀取功能

● 支援匯入IBM Cognos Business Intelligence資料。

● 輸出結果可匯出至Excel 2007/2010。

資料處理功能

● 比較資料集：可比較兩資料檔之間觀察值和文件記錄的所有差異，並詳細的在輸出視窗中列出所有差異資訊。

● 改進及加快合併檔案功能：使用新增變數合併多個檔案前，不需事先對關鍵變數進行排序。

軟體系統功能

● 檔案加密：透過密碼保護增加資料檔和輸出檔的安全性。

● 壓縮資料檔減小檔案大小，提昇硬碟空間利用率。

表格繪圖功能

● 新增多種樞紐表格設定：表格欄位排序、變數名稱與標記切換、切換表格語言、表格視窗導覽、可搜尋表格的註腳標記、可完全刪除表格中整列的維度、可在表格中插入空白欄與列、匯出成HTML檔可維持表格的欄位寬度、匯出成Word檔可保留已定義的中斷點。

外部程式語言擴充

● 透過Java Plug-in增加IBM SPSS Statistics編程能力。

2012年11月9日星期五

SPSS不同版本能否在同一台電腦上執行？

相信有許多朋友都有這個問題,

答案是可以的! 請參照以下的安裝流程~

你並不需要解安裝舊版本的IBM SPSS Statistics，然後再安裝新的版本。
多個版本是可以安裝與運行在同一台電腦。但是，不要安裝新版本在以前安裝版本的同一個目錄底下。

如何知道我購買SPSS Statistics 包含那些模組 ?

SPSS解答

1. 請開啟SPSS Statistics 語法檔並在語法編輯位置輸入『SHOW License』並執行即可看到您所購買的模組。

多變量統計分析（Multivariate Statistical Analysis）簡稱多變量分析，為統計學的一門，更是應用統計中的重要骨幹。統計分析又可粗略分為「單變量」與「多變量」，一般大學生所修習之初等統計學，包括敘述統計、機率論、推論統計、無母數統計…等，均屬於單變量統計，而多變量統計分析主要泛指同時分析兩個以上變數的計量分析方法，探討資料彼此之間的關聯性或是釐清資料的結構，而有別於傳統統計方法所著重的參數估計以及假設檢定。由於多變量統計分析比初等統計學更為複雜，亦能更精確地探討議題，故更具實用價值，常應用於管理科學、生命科學和社會科學等領域中，多變量統計可說是研究應用科學的最重要的統計工具之一。

在本課程中，將會介紹一般常用之多變量統計概念，整合並區分各個多變量分析方法的特色，建立一完整架構，藉由範例的操作演練，打破過往學習者對多變量恐懼及不清晰的印象。並針對論文陳述最常犯的統計錯誤及觀念，進行討論與說明，讓學習者能更加精熟多變量統計，並搭配IBM SPSS 20.0軟體進行資料處理，以達到更嚴謹與正確的統計分析。

課程時間地點

課程訂價：8,000元整
課程時間：11/30(五)~12/01(六)
課程地址：台北市中正區館前路
課程天數：2天；上午 9：30 至下午 4：30 中午休息 1 小時

上課即可有以下好康

課程精美講義
SPSS專業用書
SPSS產品折扣
學員免費午餐
結業證書，可登錄研習時數證明

課程大綱

迴歸分析(Regression Analysis)：本單元先探討迴歸模型評估，其次，介紹迴歸分析的概念，迴歸分析的主要目的在做預測與解釋，目標是發展一種能以一個或多個預測變項的數值來對效標變項進行預測與解釋的統計分析方法。
平均數差異考驗：一般研究者較為熟悉的是單變量統計(即只有一個依變項)的平均數差異考驗，如t檢定、變異數分析，在此介紹的是多個依變項的平均數差異考驗方法。
共變數分析(ANCOVA)：共變數分析是一種統計控制方法，這是單變量的統計分析方法。在實驗設計中，因真實的實驗情境存在某些無法排除、但卻又會影響實驗結果的無關干擾變項，即必須利用統計控制的方法，來彌補實驗控制的不足。
多變量變異數分析(MANOVA)：當欲比較各組平均數之差異是否達到顯著時，依變項有兩個以上時，則就必須使用多變量變異數分析（Multivariate Analysis of Variance，MANOVA）進行考驗，故可以說MANOVA是ANOVA的延伸使用。若自變項只有一個時，就是單因子多變量變異數分析（one- way Multivariate Analysis of Variance），若自變項有兩個以上時，則稱為多因子多變量變異數分析。
主成分分析(Principal Component Analysis；PCA)：主要目的是將 p個變數，縮減到 m個主成份或轉換成p個成份，且需同時儘量保留p個變數的變異性。
探索性因素分析(Exploratory Factor Analysis；EFA)：因素分析的主要目的也是縮減變數，但採用的方式不同於主成分分析。因素分析的概念是將p個變數用m個因素所組成的線性關係來表示。
羅吉斯迴歸分析(Logisitc Regression Analysis)：羅吉斯迴歸分析（Logistic Regression，又名邏輯迴歸分析）適用於效標變項（criterion variable）為名義變數，預測變項（predictor variable）為連續變數情況。
區別分析(Discriminate Analysis)：區別分析是用來瞭解依變項中類別（組別）的差異，並找到區別函數，以作為判斷未來新樣本加入時應該歸屬於哪一類別（組別）的分析方法。
集群分析(Cluster Analysis)：集群分析並無依變項或自變項之分，而是將所有資料納入計算，並進行分類。大多數的統計分析方法都在做統計推論的工作，但集群分析不作統計推論工作，而是將變項或觀察值的結構予以量化。
多元尺度分析(Multi-Dimensional Scaling)：是一種可幫助研究者找出隱藏在觀察資料背後的「結構」之統計方法。其目的即在於發掘一組資料集所隱藏的結構，希望在低向度空間畫出構面圖來表達資料所含的資訊，尤其當資料很多時，利用MDS更合適，因為以圖解方式比資料本身更能讓人一目了然，更能瞭解資料間的相關性。

第一天		第二天
迴歸模型評估多元迴歸分析平均數差異考驗共變數分析多變量單因子變異數分析		探索性因素分析主成份分析 Logisitc迴歸分析區別分析集群分析多元尺度分析

2012年11月1日星期四

海量資料與金融商機

每天500萬筆信用卡交易，每秒12萬筆生理健康資訊，每天27億個讚。這些數字，僅是一間銀行、一間醫院、一個網站所面對的海量資料。善用海量資料即時性分析，這些資料就能轉變成金融詐騙的防火牆，早產兒重症感染預警資訊，或是無窮無盡的商機！

全世界都在討論海量資料(Big Data)，卻沒有看見海量資料的全貌。當討論焦點集中在龐大資料量(Volume)與異質資料多樣性(Variety)時，經常忽略了另外一項差異化競爭的關鍵特性—即時性(Velocity)。

數億支智慧型手機、超過十億台電腦、數兆個感測器，每分每秒創造新的動態資訊。掌握這些動態資料串流(In-motion Streaming)，就能快人一步做出當下最有價值的決策。這些決策，將可能提升營收、防止客戶流失、紓解城市交通阻塞、甚至預防一場犯罪！

江河運算，以微秒為單位的動態淘金術

這種異動頻繁、流量極大、且須即時回應的海量資料應用，稱為「江河運算」(Streams Computing)。「江河運算」源自於IBM與美國國土安全部合作研發的反恐系統，能夠針對動態性質的海量資料進行即時性、高複雜度的分析，最快可在微秒內做出反應與決策。

「分析這些資料就好像在滾滾河流中篩取砂金，要在最短時間內分辨篩網中是泥沙還是金沙，並精準挑揀出來；」IBM軟體事業處副總經理林世偉形容，「如果錯失機會，下一秒就隨著河水流逝，不再復返。」

人命關天的醫療業，首先受惠於「江河運算」帶來的即時優勢。加拿大安大略理工大學醫院採用IBM「江河運算」技術來建立早產兒健康監護系統，每天監控分析超過十億條生理資訊，協助醫護人員提前24小時預防早產兒加護病房中敗血症引發的感染。

即時分析，當下創造最大價值

電子製造業也有龐大需求。林世偉表示，當製程微縮(Die Shrink)需求大增時，資料量與複雜度會瞬間擴大百倍以上。製造業慣用的EDA工程數據分析系統無法有效應用這些瞬間湧入的海量資料，交由「江河運算」便能協助製造業改善製程、提升良率、減少物料浪費。

政府機構更將江河運算發揮得淋漓盡致。犯罪率居高不下的紐約市與IBM合作，將犯罪資料系統、反恐監控與交通管制整合為獨立犯罪打擊系統，即時分析犯罪模式以決定最佳警力派遣規劃，紐約犯罪率因此下降40%！

以上文章分享自 http://www.managertoday.com.tw/?p=13337

更多海量資料分析方法可參考 IBM SPSS 分析軟體

何謂海量資料？
我們每天建立 2.5 百萬兆位元組的資料 — 數量之多，光是過去兩年所建立的資料就佔當今世界總量的 90%。這些資料來源廣泛，像是用於搜集氣候資訊的感應器、社交媒體網站的貼文、數位圖片與影像、採購交易記錄以及行動電話 GPS 訊號等，不一而足，這類的資料就是海量資料。

白皮書下載: 打破迷思，從 3V 重新定義巨量資料

海量資料含括三種層面：巨量、即時性及多樣性。
巨量 – 海量資料的特色就在於：龐大。企業資料包羅萬端，很容易便達到數兆位元組，甚至千兆位元組之譜。
即時性 – 海量資料通常具有時效性，一旦串流至企業便須立即使用，方能發揮其最大價值。
多樣性 – 海量資料的範疇不僅止於結構化資料，還包含各類非結構化的資料：諸如文字、音訊、視訊、點擊串流 (click stream)、日誌檔等等。

挑戰還是機會？
海量資料不只是一項挑戰，更是絕佳的機會，讓您能夠洞悉新興的資料類型、使企業運作更加靈敏並為過往所無法企及的問題提供解答。但在此之前，這種機會並無實際方法可以掌握。

SPSS 統計分析資料探勘教學與分享技術問題解決產品諮詢

2012年11月15日星期四

IBM SPSS Statistics Base 21新增功能

2012年11月9日星期五

SPSS不同版本能否在同一台電腦上執行？

如何知道我購買SPSS Statistics 包含那些模組 ?

課程分享~多變量統計分析

上課即可有以下好康

2012年11月1日星期四

海量資料與金融商機

著作人

2012年11月15日 星期四

IBM SPSS Statistics Base 21新增功能

2012年11月9日 星期五

SPSS不同版本能否在同一台電腦上執行？

如何知道我購買SPSS Statistics 包含那些模組 ?

課程分享~多變量統計分析

上課即可有以下好康

2012年11月1日 星期四

海量資料與金融商機

2012年11月15日星期四

2012年11月9日星期五

2012年11月1日星期四