台積電和台股指數相關性
我們在看相關性時,統計學的相關係數是個非常不錯的衡量指標,雖然僅是說明線性關係,但仍足夠協助我們知道兩組數字之間的情況。
所謂的相關係數是指兩組數據之間的線性相關程度,其值介於-1至1。用數值可以區分出
- 相關係數為0 → 兩組數據無線性相關
- 相關係數為1 → 兩組數據有完全正的線性相關(同向)
- 相關係數為-1 → 兩組數據有完全負的線性相關(反向)
所以想知道台積電收盤價和台股收盤指數數據之間的相關性,使用相關係數是個不錯的方法。不過若要使用相關係數,我們就得先確定數據量要多少。所以我在這邊根據【股市動態資訊軟體】繪製相關係數走勢圖的計算方法,選擇從Google Finance 可獲得的最新資料(2020/07/03)做為起始資料點,然後開始往前推10筆,也就是10天的收盤價(或收盤指數)計算出相關係數值。此時因為數據量很少,所以想要表現出兩者的線性關係並不容易,這也就是為什麼圖形上會有比較大的波動。
橫軸是最新資料的日期開始往前推N天,N≧10,所以看似原點的位置,其實是從10開始的。至於縱軸則是表現出相關係數值,由於其值介於-1至1,所以我選擇將相關係數值轉為*100,變成百分比的概念。
為什麼我要用百分比的概念呢?因為這都是歷史數據資料,不是用於預測使用,所以相關係數其實代表在我選擇的資料筆數內,台積電收盤價和台股大盤收盤指數之間的相關性有多少。如果我計算出相關係數為89.56,代表台積電漲,則大盤有89.56%機會也是漲的。在這邊,我是根據業界常說的概念;權值股推動大盤,所以寫出「台積電漲,則大盤有89.56%機會也是漲的」。
那麼89.56同時也代表雖然台積電漲,但大盤仍有10.44%可能下跌的。所以朋友們可以看著下圖的相關係數走勢圖看出台積電和台股收盤指數的相關性。
那麼我們還能怎樣計算他們的相關性呢?有些人可能覺得漲跌影響性比較大,那麼就讓我們看看吧。
下圖是台積電收盤價計算出的漲跌,以及台股收盤指數計算出的漲跌。所謂的漲跌是以當日的收盤價 - 前一日收盤價計算得到。然後我同樣根據相關係數走勢圖的相關係數計算方法,以最新資料日期開始往前推N天的數據跑相關係數。
上圖可以看出兩者的漲跌關係在超過80天的數據量較能有穩定的關係。至於最近50天的相關係數顯示的走勢關係則比較混亂。除了資料量比較少會有影響外,當然也是台股收盤指數漲跌和台積電收盤價漲跌之間的關聯性沒有那麼強烈。不過,仍可看出維持在相關係數超過83%,不高於90.6%。