發表文章

目前顯示的是 7月, 2020的文章

[掃雷]什麼是建模,有什麼注意事項

很多人都會講建模,但是為什麼要建模?這樣的目的需要確認的,特別是在人工智能或大數據分析時。那我簡單的說明一下。

金融大數據分析-第二講

當我們遭遇到統計學的那些假設與要求時,而資料不知道是否符合,或是已經知道不符合,我們能怎麼做?我將從大家熟悉的統計學開始說明,然後比較統計分析和大數據分析的差異,最後說明大數據分析的流程。

金融大數據分析-第一講

圖片
大數據分析在於「大數據」和「分析」二字的組成。原本數據分析就是客觀從數據當中分析出一些現象,只是當數據量過於龐大時,人類難以從中尋找出數據的規律時,就需要調整現有的分析法,以符合巨量數據量的多且雜亂特性。

[掃雷]人工智能在估計上做的事情

我使用「疫情模式與20200412_預期未來一週台股」的部份影片內容來說明人工智能在估計上做什麼事情。很多人都認為人工智能好像就是比對、辨識使用的技術,大多用在人臉辨識、車牌辨識、語音辨識等。但探究其本質,你知道是什麼嗎? 只要是人就可以做得到,只是我們改成讓電腦做而已。那就讓我揭開秘密吧!

[掃雷]誰說變異數異質性只能檢定

圖片
計量經濟學當中,談到變異數異質性就是架構在線性迴歸模型上的假設被破壞後所造成的問題,而我們希望能夠解決這樣的問題,所以延伸出變異數異質性的檢定。 為什麼會有變異數異質性問題呢?以下有幾個原因是常見並且被提出的理由: 我們應該選擇衡量個人的數據,但因為獲取不到而使用替代數據。替代數據可能來自平均概念,例如平均家戶就不等於平均每人,造成變異數受到干擾。 自變數數據可能受到其他因素影響,造成自變數應被視為隨機變數,並且其變動會被納入變異數當中,造成異質性發生。 解釋變數是來自偏態係數不為0的分配時,也會造成變異數異質性。 錯誤的數據轉換或是錯誤的模型形式造成變異數異質性。(David Hendry) 第1到3點都是數據的問題,第4點有數據問題,也有模型錯誤問題。 一般的做法就是認為在估計完迴歸模型[註1]後,認為殘差具有變異數的代表性,所以透過檢定殘差確認是否有變異數異質性。常見的檢定方法有Batlett test, Breusch Pagan test, Goldfeld Quandt test, Glesjer test, White test, Ramsey test, Szroter test. 我在這僅說明前四種檢定方法,所有的檢定方法都可以在維基百科上找到。 無論是哪種檢定,虛無假設都是n個變異數值皆相等,那麼對立假設就是至少有一變異數值不相等。 Bartlett's test Bartlett's test的模型為 如果每次有mi個樣本就能夠跑一次上式,所以這代表我們將會有n組的上式進行估計,得到殘差後,利用變異數的計算方法得到估計值。 第二步運用Bartlett's test 上式會有極限分配存在,然後進行檢定。 Breusch Pagan test Breusch Pagan test則認為變異數是解釋變數(或稱為自變數)的線性方程式,亦即 所以我們可以先不管變異數異質性,直接先跑迴歸模型,然後計算出殘差。 第二步建立個別殘差平方除以(殘差平方和除以n) 第三步設定Z為自變數的組合,然後用第二步的g為應變數,跑迴歸模型,計算出殘差與殘差平方和。 第四步產生檢定統計量Q為(g的平方和 - 第三步的殘差平方和) / 2。此時同樣是使用卡方分配,自由度為p - 1去做檢定。 Goldfeld Quandt test Goldfeld t...

人工智能?人工智慧?大數據?巨量資料?大資料?

最近發現總有人會用名詞來針對。這就像寫論文時,有的人總說不能使用We 或是 I,一定要使用the paper, the article或this study之類的。可是,我所看的期刊論文,全部都有人使用,沒有一定要強制讓We變成the study之類的情況。這應該是個人在寫作時的風格才對。 所以,我就在這篇網誌的標題上以這些常見的名詞來說明一下吧。

股市收盤漲跌關係

圖片
股市的每個交易日都可以看到「漲」或「跌」。所謂的漲跌是指今日收盤價 - 前一日收盤價,計算出漲或跌,以及對應的漲跌數字。不過,我們也想知道漲跌之間的關係,所以可以透過每個交易日的盤後結果,重新計算當日與前一日的漲跌,獲得他們之間的關聯。 那麼到底是怎麼做到的?其實這個方法很簡單!那就是使用「條件機率」或「貝氏定理」。我先說明這兩者是什麼,然後再說明怎麼完成。

台積電和台股指數相關性

我們在看相關性時,統計學的相關係數是個非常不錯的衡量指標,雖然僅是說明線性關係,但仍足夠協助我們知道兩組數字之間的情況。 所謂的相關係數是指兩組數據之間的線性相關程度,其值介於-1至1。用數值可以區分出 相關係數為0  → 兩組數據無線性相關 相關係數為1  → 兩組數據有完全正的線性相關(同向) 相關係數為-1  → 兩組數據有完全負的線性相關(反向)

匯率和台股收盤指數關係

外資帶來資金進入台灣股市,讓資金充沛,並且維持台股的高檔,因此很多人都說可以看台幣兌美元的匯率來了解資金進出對台股影響。如果外資選擇離開就會將台幣換成美元,造成台幣貶值,因此台股就會產生跌勢。反之,如果外資一直進來台灣,就會將美元換成台幣,讓台幣升值,而這些資金就會進入股市,造成股市的熱絡。 那麼就讓我使用Google Finance來找出其中關聯吧。