[掃雷]人工智能在估計上做的事情

我使用「疫情模式與20200412_預期未來一週台股」的部份影片內容來說明人工智能在估計上做什麼事情。很多人都認為人工智能好像就是比對、辨識使用的技術,大多用在人臉辨識、車牌辨識、語音辨識等。但探究其本質,你知道是什麼嗎?

只要是人就可以做得到,只是我們改成讓電腦做而已。那就讓我揭開秘密吧!

人工智能的兩個主要功能就是
  • 做到人類做不到的
  • 比對判定
為什麼使用人工智能的理由就是可能太過於費時,可能人力所不能及,可能過於複雜,可能很制式,所以我們可以使用電腦取代人力。那麼電腦本身就可以根據程式所寫的內容進行運算,並且過程的前中後根據一些原則進行判別。這很類似在使用Excel的篩選或是vlookup搜尋功能。

用台股指數為例

為了讓大家看得比較了解,所以我選擇用時間為自變數,台股收盤指數為應變數的簡單函數,亦即 台股收盤指數 = f(時間),我在這設定好函數形式為直線型。這種直線估計是標準的迴歸分析,不過在這過程,我不是一次性將資料都放入跑迴歸,而是有以下的特性!

  1. 一個一個數值放進去。每增加一組時間和新的台股收盤指數值,就跑一次迴歸。換句話說,如果我將增加1000個台股收盤指數,我就得跑1000次迴歸。
  2. 選擇時間區段的判斷標準是MSE最小。
這兩點保證時間區段不是我主觀挑選,而是由數據自己決定。而且這雖然可以使用人工跑迴歸,但資料量大時就需要耗費很長時間,也需要研究者細心比對的耐心。因此,使用電腦才能幫助我們在很短暫的時間內完成此事。其次,無論是時間區段或估計結果的比對都是建立在人工智能的本質:比對與判斷上。所以這是人工智能在股市價格指數走勢的估計應用。




上圖是100筆資料人工智能分段估計分析結果。每次估計線都是最佳的配適結果,並同時保存MSE。時間區段也是由電腦經由MSE比對得到的。不過直線型不是最好的模式,本身誤差就是會太大。

我們可以抽出在最後的13筆資料形成的時間區段估計結果(如下圖所示)。這在100筆資料當中,屬於第8條直線估計線,其斜率為81.315,代表在13天內台股收盤指數平均每天上漲81.315點。如果看到MSE則可清楚了解誤差非常大,開根號得到的標準差為165.77。這意味著台股指數估計線在圖形上看似代表性很好,但MSE卻能知道代表性沒有非常理想。



怎說這第8條估計線的代表性不理想?我以非線性的結果來做比對,第8條估計線的MSE為10883,相比於直線型的第8條迴歸線,MSE下降非常多。當MSE愈小就代表估計得愈準確,由此可見台股收盤指數使用非線性的人工智能分段分析更為合適。



有關此估計分析的相關內容,可參考「統計談股市」粉絲專頁下載「疫情模式與20200412_預期未來一週台股」的資料,或是參考「LEE統計談股市」YouTube頻道的影片。