恐慌指數和S&P500指數的相關性
想衡量兩變數的相關性,第一個想到的就是「相關係數」(Correlation coefficient)。所謂相關係數是兩變數的直線相關程度。愈趨於1或-1就代表兩變數之間的線性相關愈強烈。
恐慌指數和股價指數的研究認為兩者存在負相關,也就是一個指數的數字愈高,另一個指數的數字就會愈低。這邊我得特別說明一下,這樣的負相關是指兩者存在負的線性相關。而線性相關不代表每個數對都是符合這樣的特性。這是什麼意思呢?
統計學的相關係數是需要一定數對量才能計算相關係數。如果只有兩個數對,那相關係數不是正1就是負1,超過兩個數對就產生介於-1和1之間的數字了。
另外,你加入的數對量會有規律性,也就是累加性出現。這裡指的累加性是數字量帶來的數字規律,在一開始可能不明顯,隨著數對愈來愈多,之前的影響就會逐漸累積產生。
當你使用相關係數時就得考慮要如何界定時間序資料放入計算相關係數的資料量。在這,我提出三種方法:
- 從時間序的起始日開始,固定此起始日,開始加入新的數對資料,直到結束日。
- 從時間序的結束日開始,固定此結束日,開始加入最近的舊數對資料,直到起始日。
- 從時間序的起始日開始,固定N日,每計算完N日的相關係數後,丟棄前一日的數對,加入新一日的數對,繼續計算。
這三種對計算相關係數的資料量定義將帶來不同的相關係數計算方式。而彭博提供的技術指標當中,也有相關係數的計算。有使用彭博資料庫的朋友,再留言分享一下它的計算方法吧。
下圖藍點為第一種方法,紅點為第二種方法得到的相關係數走勢圖。
你看無論是第一種還是第二種的相關係數從22年2月1日開始的相關係數都介於-1到-0.4之間。這代表恐慌指數和S&PP500指數之間確實是負的線性相關。
藍點結果
那我們來看藍點的結果。藍點從22年2月1日開始,第一個相關係數值由五天的數對計算得到,然後繼續增加到6天、7天,依此類推。從22年2月28日到4月29日持續落在-1至-0.9之間,屬於高度負相關。
隨著S&P500指數因通貨膨脹從7月中開始下滑,中間也有超過4000點的期間,但和恐慌指數的相關係數卻下降,甚至出現新聞所謂的關鍵相關性斷裂。不過,從22年9月27日後,相關係數回到-0.6和-0.5之間。
橘點結果
第二種方法從最後的結束日,22年10月13日往前看相關係數的規律性。圖形的橘點從右往左看。在9月和10月中,僅有9月27日至10月3日五筆相關係數高於-0.9,以及近5日的相關係數高於-0.9外,5月26日到9月26日從結束日一直增加天數,計算的相關係數都介於-1和-0.9之間。
這表示從最新一筆指數數對資料往前推,涵蓋到5月26日,兩者的相關係數都是高度負的線性相關。
透過上圖藍點和橘點在5月12日和5月13日產生交錯。這是否說明5月中公告4月的8.3%通貨膨脹率 —第二個超過8%的通貨膨脹率—已經對美國股市造成結構性影響?!
每N天計算相關係數
如果我們固定每N天計算一次恐慌指數和S&P500指數的相關係數能不能出現像前兩種方法的規律呢?結果一看,是個混亂的規律結果。這表示如果每N天計算相關係數,並不能得到有規律的相關係數情況,反而讓人無法判斷。
結論
恐慌指數和S&P500指數的相關性,我們可以用相關係數來解讀。在三種計算資料量方式中,僅有第一種和第二種能產生因為數對累積的影響,產生穩定規律。若使用每N天計算的相關係數則是混亂的規律。
新聞報導所言的關聯性斷裂,其實只是其中一種計算資料量方法去看相關係數。如果像本篇文章這樣做,第一種和第二種方法比對,更能理解這是兩個時期的影響。
--
希望這樣的分析結果大家會喜歡。覺得不錯請分享。