前言
當你看到各種的數字走勢圖時,明明都是來自一個指標在時間軸上,有的很清楚看得出來隨著時間向上或向下,有的卻是波動的很厲害,看不出什麼規律。你想解讀這些數據時總覺得哪裡不對勁?如果你有這樣的困擾,我想這篇文章值得你收藏起來。
就讓我直接剖析為什麼明明都是數字,為什麼有的數字有明顯走勢,有的卻沒有呢?
1. 我們的數字觀
我們的數字可以用數學概念去看,分為整數、分數、小數、有理數、無理數等。講這又得回到國小、國中和高中階段了。那我簡單用下面的描述來幫大家整理一下數字觀。
一般人對數字的觀念是計數用,例如幾顆蘋果,多少錢。這些都是計數用的數字,具有加減乘除功能的累加性數字。並且這樣的數字通常是十進位的數字。這是我們日常生活中最常見的數字體系。
另一種則是非十進位的數字,例如時間。一天24小時,1小時60分鐘,1分鐘60秒。不過這種數字同樣也具有加減乘除的功能,所以累加性數字的一種。
除此之外,有些數字沒有具備加減乘除的運算功能,只有排序意義,這種就是順序尺度的數字。例如,成績的排名、問卷上詢問的滿意度,或是河川從北到南的編號。這類數字只能做排序用,你將第1名和第9名的1和9加起來並沒有意義。
實際操作上,當我們在統計局看到的經濟數據或金融數據時,那些數據都是順著時間記錄下來後,形成先後排序的意思,不代表你將某兩個時間點的數字加起來就能變成另一個時間點的數字。
順著上述的數字觀念,最後所提到的時間點下紀錄的數字,通常都會幾個數字被計算出加權平均數,或是根據其他公式計算出一個數字。那麼問題來了,這樣計算得到的新數字是哪個時間點的?
2. 多個數字轉換成一個數字
我們其實很常將多個數字轉換成一個數字。例如,手邊有一顆蘋果和兩顆柳橙。那麼你有幾顆水果?你說會3顆。這是因為問題中的單位讓數字可以加起來。同樣的,如果是第5天的數字,一直記錄到第5天。這時候我們能不能用一個數字表示呢?當然可以,例如,
- 這5天下來,你記錄的數字加總起來是多少呢?
- 或者是這5天的數字平均來說是多少呢?
- 還有這5天的數字經排序後,取正中間的數字是多少呢?
- 以及這第1和2天的數字,前後相減,以前值做分母計算出新值,那麼數字又會是多少呢?
這前三個問題的結果剛好對應統計學敘述統計的總數、平均數、中位數。那麼接下來的問題是,這裡有5天的位置,你將5個數字變成1個數字後,該放在哪天?第一天?第三天?還是第五天呢?
以目前習慣成慣例的情況來說,都是放在第五天,但以統計學來說,平均數和中位數是要放在第三天。隨著你的紀錄天數增加,是不是有了原本紀錄數字的序列,還多增加了平均數(總數、中位數)的序列呢?
至於第四個問題的數字叫做比率。因為這是相鄰時間計算的比率,稱為成長率。不過後來又發展出「與去年同期」相比的比率計算方式,如果原數字是每天紀錄就稱為「日增率」,每週紀錄就稱為「週增率」,每月紀錄就稱為「月增率」,每年記錄就稱為「年增率」。
如果有在投資理財的人有沒有覺得很熟悉呢?
3. 出現在時間軸上的數字序列
這第三點就是讓人困惑和難以理解的地方,也就是圖形上以時間為軸呈現出來的數字序列。只要是數字並且隨著固定時間被記錄下的數字就能用時間走勢圖繪製出來。
讓我使用台灣物價指數來說明數字問題。上圖波動劇烈的是消費者物價指數年增率,從左下到右上的走勢方式是消費者物價指數原數值。這兩個數字只有後者才是真真實實隨著時間被記錄下來的數字,前者則是將消費者物價指數經過轉換後的比率值。
當它們都被顯示在時間軸上,只有一個是真實的!你們猜到哪個了嗎?
忘記得趕緊往上重新閱讀一次。
是的,那就是消費者物價指數才能在時間軸上看,並且你會感覺到從左下到右上的趨勢感。但是,消費者物價指數年增率即使顯示在時間軸上,看起來有規律,只是很亂。這卻是虛假的。原因是消費者物價指數年增率被稱為是消費者物價指數的增長率,也就是相當於斜率的意思。
什麼意思呢?原本消費者物價指數年增率被當做通貨膨脹率,也就是衡量物價上漲的速度。這個做確實沒有什麼問題。有問題的是圖形呈現方式!
因為消費者物價指數是隨著時間被記錄下來,所以呈現在時間軸上非常合理。當我們看著消費者物價指數的時間走勢圖時,看出從左下到右上的趨勢,我們知道物價在上升。這個上升是代表物價隨著時間在增加。此時的斜率就是以兩時間點下的消費者物價指數,計算出斜率值,代表物價上漲的速度。這也是一般民眾的感覺。下方公式的52和53是時間排序的代號,也是物價指數各自對應的時間點。
而前述的消費者物價指數年增率不也表示物價上漲的速度?
是的!但這種年增率是以去年同期的物價指數為基準,計算得到的數字。
也就是說消費者物價指數年增率的基準不是「時間」,而是去年同期的數字。
4. 怎麼解讀這些轉換後的數字
第一個是從時間軸而來的消費者物價指數斜率,本身就很難求得,即使你會統計學的迴歸分析也沒有用。原因在於這樣的斜率必須代表性很高,也就是迴歸的估計線代表性要很高。那麼你就得為上圖的消費者物價指數在時間軸上找出不同期間,期間內的迴歸估計線代表性最高。
看我描述得很簡單,但卻非常難做到。這就是為什麼到現在除了我和團隊才有講這趨勢,其他專家學者所講的趨勢不敢顯示迴歸估計線。
 |
2018年3月到2023年2月台灣消費者物價指數趨勢圖 |
想要求得消費者物價指數轉換成在時間軸上的斜率值,需要AI的協助。不然以人力來說,可能需要一個研究生做個2天才可能得到結果。這也就是為何很多人,甚至軟體,apps,網站都是給所有人看時間走勢圖,但卻無法真的做到時間趨勢圖的理由。
第二個是消費者物價指數年增率。這樣的增長率的看法是單獨一點看。例如上方公式的2021年2月消費者物價指數是比2020年2月的物價指數增長多少比率。從主計處查得為1.38%,這代表以2020年2月的物價指數97.94相比,2021年2月的物價指數增加1.0138,得到99.29。
另外,我們還可以做到最為簡單的「兩點比較法」。也就是任兩個時間點下的消費者物價指數年增率進行比較。不過,我想大家也不想從上圖波動劇烈的線圖中去找出兩個時間點下的年增率進行比對吧。所以這種作法通常都會回到表格上,或用文字描述說明。
換句話說,開出消費者物價指數年增率的時間走勢圖其實意義不大,單純就是讓一般民眾覺得你說的年增率是有趨勢的,並且很有數據依據。但事實就是你只是在講那一個時間點下的年增率,或兩點比較在進行說明而已。
5. 小結
看完上面的說明後,相信大家能了解能找到原數字的序列並顯示在時間軸上是正確的方法,至於轉換後的數字序列呈現在時間走勢圖上時,就要謹慎看待,並小心解讀。特別是一般人已經習慣累加性數字,而不習慣轉換後數字出現在時間軸上,需要更加注意轉換公式是什麼,才能了解這些數字是否和時間有關,以及作用為何。
最後,仍要提到的是不忘初心。只要掌握好自己想要解答的問題是什麼,自然就不會因為走勢圖而認同似是而非的觀點。