【計量大數據分析】【人工智慧基礎】概念

人工智慧(Artificial Intelligence, AI)從1970年代就開始的概念與持續追求的目標。這數十年來,為了達到人工智慧,從資料探勘、大數據、人工智能到人工智慧,其目的都在尋找 資料的規律性 若能尋找出資料的規則,將之寫成代碼,形成程式,就能夠讓電腦產生運算,並自我判定。然而,所有的資料均需要被定序,然後再開始檢測,尋找出規則,產生數學模式,寫成代碼。這樣的步驟,最方便的方式不是產生數學模式,而是產生資料庫,讓電腦運用比對方式,找到最近似的模式,以此為『最適模式』進行分析。 換句話說,這是兩個階段性的問題。 第一個階段是電腦能夠運算數據的數字規則, 第二個階段是電腦能夠自我判定何者最佳。 第二個階段比較好回答。『何者最佳』等於均方差(Mean-square-errors, MSE)最小。因為誤差最小,所以精準度就高,模式就會是最好的。 第一個階段雖說是演算法計算數字規則,但卻需要能夠建構數字規則的模式,同樣也得可以解構數字規則模式,如此才能自我驗證。 計量大數據分析意義 這次計量大數據分析主要是學習 如何將已經取得的數據進行建構數字規則,以及解構數字規則模式 。過去,計量經濟學是根據統計學基礎,加上迴歸分析,特別針對迴歸係數估計方法,並且必須滿足 二維常態分配(同時討論X與Y),或條件常態分配(給定X,討論Y)的假設 下進行討論。然後延伸到當誤差具有異質性,以及誤差具有序列相關的解決方法。另外,也有討論到大樣本趨近的漸進分配(Asymptotic distribution),試圖讓數據滿足中央極限定理(Central limit theorem)。 然而,在計量經濟學當中有兩個最大的問題點,第一點是討論的漸進分配僅是理論,無法實務操作( 參考大數據分析基礎 - 大數法則 (中央極限定理) )。第二點就是沒有人敢保證數據符合常態分配! 沒錯,常態分配+常態分配還是常態分配,資料分析者需要保證成對樣本均來自常態分配。此外,多數的數據常發生『常態分配+非常態分配』或是兩個非常態分配的加減乘除。 沒有人知道這兩個問題的解答!更有趣的是 成對樣本的結果會等於條件樣本的結果嗎? 光從聯合機率與條件機率來看就知道不可能的事情,而計量經濟學教科書卻都轉為用條件來討論迴歸分析。 迴歸分析一定要常態分配假設嗎? 即使我沒設定誤差服從常態分配,僅使用高中數學所學的最小平...