統計學本質和架構筆記 - 101認識統計學的兩大板塊
AI新知力系列 統計學本質和架構筆記 - 101認識統計學的兩版塊 數學和統計學是大數據分析和人工智慧領域中的基礎,也是核心。多數已經將大數據分析和人工智慧視為高等分析和高等技術領域,其人才具備的知識量是高深且需要花費大量時間才能有所成。確實也是如此,因為要真正成為大數據分析和人工智慧核心技術研發人員就得具備數學、統計、機率、電腦科學的高等專業知識。 在美國1970年代,正在研發人工智慧的時候,曾有一項學術計畫 - 他們想要培養可以同時具備上述四類專業知識的理科人才。很可惜這項計畫最終失敗,並且人工智慧後來也不再被提起,直到網路時代開展到一定程度後,再一次被提及並實現著。網路時代下的人工智慧不同於1970年代前後所做的人工智慧。所以主導的學科也不相同。 圖片來源:自製 我開啟AI新知力的新篇章,將和學校教學的內容全然不同,從統計學的本質出發,以簡單易懂的方式,讓對此有興趣的你能夠快速理解統計學整體架構,脫離統計學和機率論的數理推導。 什麼是統計學兩大板塊 圖片來源:自製 統計學的世界觀就是這兩大板塊組成 - 母體(population)和樣本(samples)。一般教科書也就提個一句話,然後定義一下什麼是母體,什麼是樣本,就開始進入統計學主題。可我要說,別小看這樣的兩大板塊,這就是統計學的立基。我用此二板塊歸納對應出哲學觀、背後的方法(見上圖)。 1. 母體和樣本就像柏拉圖和亞里士多德的哲學世界觀。 兩的板塊從哲學觀來說,就如同柏拉圖和亞里士多德的哲學關係。柏拉圖認為這世間萬物都有原型,你可以將原型當作是完美的型態。而世間萬物就是原型的投射,帶著原型特徵。柏拉圖的世界觀是站在全知全能的神的角度在看世界,而亞里士多德則是主張從世間萬物去觀察、拼湊出老師所說的原型。 於是,母體和樣本的關係中,母體就像柏拉圖所說的原型。你是全知全能的神,母體的所有資訊你都知道。樣本就像亞里士多德所說的世間萬物,我們需要觀察樣本才能知道母體長怎樣。 2. 母體和樣本都需要數學,差異是在於母體是機率論,樣本是統計學。機率是統計之母,如果知道機率,那麼統計就可以退休了。 了解統計學兩大板塊的重要性 萬事皆有起頭,任何學科都是如此。知識傳承需要這樣的做法,而非照本宣科。你會以為我在譁眾取寵,特立獨行地用些和課本上不同的架構和名詞,讓你感覺不同。 我和團隊超過10年以上的研發後,已經發展...