2012年11月1日 星期四

海量資料與金融商機


海量資料與金融商機
每天500萬筆信用卡交易,每秒12萬筆生理健康資訊,每天27億個讚。這些數字,僅是一間銀行、一間醫院、一個網站所面對的海量資料。善用海量資料即時性分析,這些資料就能轉變成金融詐騙的防火牆,早產兒重症感染預警資訊,或是無窮無盡的商機!
全世界都在討論海量資料(Big Data),卻沒有看見海量資料的全貌。當討論焦點集中在龐大資料量(Volume)與異質資料多樣性(Variety)時,經常忽略了另外一項差異化競爭的關鍵特性—即時性(Velocity)。
數億支智慧型手機、超過十億台電腦、數兆個感測器,每分每秒創造新的動態資訊。掌握這些動態資料串流(In-motion Streaming),就能快人一步做出當下最有價值的決策。這些決策,將可能提升營收、防止客戶流失、紓解城市交通阻塞、甚至預防一場犯罪!
江河運算,以微秒為單位的動態淘金術
這種異動頻繁、流量極大、且須即時回應的海量資料應用,稱為「江河運算」(Streams Computing)。「江河運算」源自於IBM與美國國土安全部合作研發的反恐系統,能夠針對動態性質的海量資料進行即時性、高複雜度的分析,最快可在微秒內做出反應與決策。
「分析這些資料就好像在滾滾河流中篩取砂金,要在最短時間內分辨篩網中是泥沙還是金沙,並精準挑揀出來;」IBM軟體事業處副總經理林世偉形容,「如果錯失機會,下一秒就隨著河水流逝,不再復返。」
人命關天的醫療業,首先受惠於「江河運算」帶來的即時優勢。加拿大安大略理工大學醫院採用IBM「江河運算」技術來建立早產兒健康監護系統,每天監控分析超過十億條生理資訊,協助醫護人員提前24小時預防早產兒加護病房中敗血症引發的感染。
即時分析,當下創造最大價值
電子製造業也有龐大需求。林世偉表示,當製程微縮(Die Shrink)需求大增時,資料量與複雜度會瞬間擴大百倍以上。製造業慣用的EDA工程數據分析系統無法有效應用這些瞬間湧入的海量資料,交由「江河運算」便能協助製造業改善製程、提升良率、減少物料浪費。
政府機構更將江河運算發揮得淋漓盡致。犯罪率居高不下的紐約市與IBM合作,將犯罪資料系統、反恐監控與交通管制整合為獨立犯罪打擊系統,即時分析犯罪模式以決定最佳警力派遣規劃,紐約犯罪率因此下降40%!
更多海量資料分析方法可參考  IBM SPSS 分析軟體
何謂海量資料?
我們每天建立 2.5 百萬兆位元組的資料 — 數量之多,光是過去兩年所建立的資料就佔當今世界總量的 90%。 這些資料來源廣泛, 像是用於搜集氣候資訊的感應器、社交媒體網站的貼文、數位圖片與影像、採購交易記錄以及行動電話 GPS 訊號等,不一而足, 這類的資料就是 海量資料
海量資料含括三種層面: 巨量、即時性及多樣性。
巨量 – 海量資料的特色就在於: 龐大。 企業資料包羅萬端,很容易便達到數兆位元組,甚至千兆位元組之譜。
即時性 – 海量資料通常具有時效性,一旦串流至企業便須立即使用,方能發揮其最大價值。
多樣性 – 海量資料的範疇不僅止於結構化資料,還包含各類非結構化的資料: 諸如文字、音訊、視訊、點擊串流 (click stream)、日誌檔等等。
挑戰還是機會?
海量資料不只是一項挑戰, 更是絕佳的機會,讓您能夠洞悉新興的資料類型、使企業運作更加靈敏並為過往所無法企及的問題提供解答。 但在此之前,這種機會並無實際方法可以掌握。

沒有留言:

張貼留言