發表文章

目前顯示的是 7月, 2015的文章

從巨量資料分析方法找台日韓兌美元匯率機率密度函數

圖片
話說台灣是以出口為導向的國家,新台幣匯率的穩定與否與國際情勢深深地影響台灣出口狀況。所以在匯率相關文獻上,例如,王泓仁( 2005 )使用結構式自我迴歸模型探討央行持有國外資產淨額變動率、銀行隔夜拆款利率、M2變動率、自然對數下之CPI、自然對數下之工業生產指數、新台幣兌美元匯率、外貿比例、貿易條件為內生變數進行匯率與其他變數關係討論,另外使用GARCH討論新台幣匯率成長率之波動。 蔡聰勇( 2006 )以ARCH模型分析日本央行干預日元兌美元匯率對新台幣匯率波動影響。何棟欽( 2001 )則是建立誤差校正模型(ECM),使用隔夜拆款利率、基本放款利率、存款利率與10年期中央公債次級市場利率,發現台灣央行的存放款利率調整無僵固性,短期利率傳遞至公債利率效果不佳,但長天期存款利率則較為理想。傅澤偉、黃國安、林曼莉( 2014 )比較僵固型價格貨幣理論模型、資產組合平衡模型與行為均衡匯率模型,認為僵固型價格貨幣理論模型為佳。 不過這些分析匯率之模型多仍建構在 線性模型上,即使是GARCH模型也是一樣。 誤差是常態分配上。 事實上,在資料定序的基礎上,各國匯率不太可能是常態分配,即使解釋變數放入後的迴歸模型也是一樣。這不只是假迴歸問題,而需要從根本討論起。 在巨量資料分析下,若選擇1779/1/1至2015/04/17期間的日資料,可發現新台幣匯率之機率密度函數是可以被找到的。 左圖為日元兌美元匯率之機率密度函數圖、中間圖為韓元兌美元匯率之機率密度函數圖、右圖為新台幣兌美元匯率之機率密度函數圖。觀察圖形可知, 從全距與變異數來看,新台幣兌美元匯率 < 日元兌美元匯率 < 韓元兌美元匯率 從偏態、峰態與變異係數來看,新台幣兌美元匯率 < 韓元兌美元匯率 < 日元兌美元匯率 從機率密度函數圖來看,台日韓匯率都有雙峰傾向 從特定匯率值出現機率來說,台灣有39.83%最大機率盯住特定匯率值、日本有3.87%最大機率盯住特定匯率值、南韓僅有0.58%最大機率盯住特定匯率值 南韓在外匯市場上的干預是最少的,這是起源於1997年南韓為了度過東南亞金融風暴而向IMF借款救經濟時,要求依據國際組織之外匯管制規範,不再高度干預外匯市場。因此,在匯率的機率密度函數圖表當中特別明顯可以看到這樣的結果。 詳情參考 李堯賢、王譯賢、 李玫郁 ,2015,大數據資料下新台幣匯率...

資料如何算巨量?

圖片
巨量資料顧名思義即是大量的資料,然而資料量多大才算是巨量呢? 誰能說得清?1個億?10個億? 現階段的開放資料(open data),哪個是有上億資料?若整個資料庫來說確實有,但對於分析人員來說,特定幾個資料表才是重點。例如,貨幣政策的研究員在意利率、貨幣供給量、國內生產毛額、發行定期存單量。若由最大時間單位的變數決定(季),且假設從1955年至2014年皆有資料,則60年*4,此時,每個變數有240筆資料,本例有4個變數,所以共計960筆資料。 這不算是巨量資料,但可視為母體資料,並且資料量會隨時間而增加,所以每次估算就需納入最新資料。這無法預測非常準確,但可以增加準確性。 不過,這可否使用巨量資料分析呢? 答案是可以的!王冠先與李玫郁(2015)提出之巨量資料分析方法可以應用在此分析上。 步驟1:建立各變數之機率分配 步驟2:由各分配生成1億筆資料,共計4億筆資料 步驟3:跑數學模型,得到資料特徵之數學模式 在這過程中,對軟體商來說, 資料要讀得進; 能為資料定序。 對分析人員來說, 資料代表性與正確性; 能為資料檢測。 總而言之,巨量資料方法的應用將不侷限樣本大小或僅能模擬出來的資料。 另一種資料就是財務金融資料,例如,股票現階段的記錄上可細分至20秒一筆記錄值,累積資料起來就相當驚人,動輒上百萬筆資料,更近似於巨量資料概念。於是,在分析與研究上,更需要巨量資料分析方法。 巨量資料分析方法的免費電子書已經在  PUPU電子書商城  上架。對巨量資料來說,定序是非常重要的,這樣才能從中找到資料的數學模式,繼續從事相關研究分析,提供策略參考。