發表文章

AI技術是輔助工具,它不是萬能解方

在現今這個科技快速發展的時代,AI 的熱度持續攀升,已然成為人們生活中常被提及的話題。然而,我們必須清醒地認識到,目前 AI 的發展水平,與我們最初對它的期待之間,仍存在著不小的差距。這差距背後,藏著 AI 發展的曲折歷程,也蘊含著我們對正確認知的關鍵。 AI 發展期待的落差 當下,不少人對 AI 寄予了過高的期望,彷彿它是無所不能的 「神奇法寶」。但實際情況並非如此。就拿我在先前演講中提到的 AI 發展階段目標來說,若不了解研發人員對 AI 的規劃,就很難準確判斷目前 AI 技術究竟處於什麼階段。 AI 的發展並非一蹴而就,每個階段都有特定的目標與挑戰。 AI 發展的曲折道路 初始高目標的碰壁 AI 誕生之初,就被賦予了極高的定位 ——「 機器像人一樣思考 」。這聽起來確實令人興奮,似乎機器即將擁有和人類一樣的思考能力。當時的拓荒者們滿懷信心,想著既然是用人的思考模式去設計機器,應該不難實現。但現實卻給了他們沉重一擊。在實際操作中,他們面臨著許多棘手的問題:機器的運算速度能否夠快?人類的思考能否被歸納為固定流程?這個流程又該如何精準切割細化?即便到了科技如此發達的今天,這些問題依然沒有得到完美的解決。 希望落實在數學領域 由於最初目標難以實現,AI 的發展方向發生了轉變,變成了 「 電腦解決數學無法解決的問題 」。數學有著嚴謹的邏輯和固定的運算流程,讓電腦來輔助解決數學難題,似乎是個不錯的想法。在某種程度上,計算機的運算確實幫助解決了幾何和代數中的不少問題。但好景不長,新的問題接踵而至:機器的運算速度是否能滿足需求?幾套數學運算流程真的能套用所有狀況嗎?數據測定技術是否成熟?數據建立數學模型是否完善?數位類比是否精準? 以蒙特卡羅模擬法為例,曾經某英國學術期刊(SCI 等級)只刊登使用他們模擬方法的論文,拒絕其他方法或突破性論文。眾多研發人員只能引用他們的論文,採用他們的方法。但科技的進步本應是多元的,是為了探索真理、解決問題,而不是被某個單位或某種方法所束縛。後來我們將這種模擬方式公開,免費分享在臉書社團,因為事實證明,它並非不可取代。從設定這個目標到現在,AI 在解決數學問題方面並沒有取得實質的突破,那些曾經繞開的難點,依然橫亙在前進的道路上。 目前目標的達成與局限 到了 1970 年代,AI 的目標再次調整為 「 機器能辨識、互動、感知 」。如今,我們所接觸...

人人成為AI跨領域人才,AI無法取代你

 AI數據分析線上課程怎麼學? 基本上是透過在電腦上看影片學習。從第一步軟體下載、安裝到操作,怎麼下載,怎麼安裝到怎麼操作,有老師直接在Windows作業系統的電腦上操作,非常詳細的操作步驟。你只要跟著一起做一次下載和安裝,之後電腦上就有軟體了。至於操作軟體就是要通過反覆練習與習慣,提高你的熟練度。 因為數據分析本身離不開數據,我通常會用公開數據來進行教學。所以在數據尋找的影片中,你也能從網站上下載到數據,然後將Excel的數據進行格式轉換(這在數據分析流程中的數據處理階段)。 有學員問我說 為什麼整個操作流程不全部自動化呢 ? 你得知道 你正在學習中 。我如果讓軟體自動化了,那我不用教你,你也不用上課,你不用學其中原理。就像某大學一學年都是上chatGPT,生成文章讓學生去判讀。說不好聽點chatGPT可以生成文章後再讓它判讀啊。 別說學生不會這樣做或者老師不鼓勵這麼做。只要是學生,能這樣做,他為什麼不做。如果有同學因為這樣得到鼓勵,那就會全班跟著一起這樣做。所以想成為AI跨領域人才,倒底怎樣才是AI跨領域人才? AI跨領域人才? 這裡指的肯定不是資訊學院、理學院或工學院的人,因為他們本身就是AI領域的一部分。所以這邊的AI跨領域人才指的是文學、商學、社會科學等應用AI的人。如果你說chatGPT,那使用過Deepseek和豆包的我就得說,AI跨領域人才培訓中還在教「 提示詞 」?其實沒有那麼需要的。怎麼說呢? 近期使用Deepseek和豆包的我發現,我可以跟人工智慧聊天機器人像一般人對話一樣,將我的需要說明就可以。它會自動思考並提供給我約60%不需要修改的內容。我較難以記得的語氣風格或缺了什麼需要補充,再之後的對話加入,就可以生成出約65%不需要修改的內容。 當然我詢問的問題與需要都是人工智慧聊天機器人內部資料庫都有的,只是它要寫出來的語氣和內容來說,確實比chatGPT好很多,不會有那種需要大幅修改內容和語氣的結果。所以,AI跨領域人才該學什麼? 你如果學的是這類幫助你提升效率的做法,那其實不用一年的時間。但如果你是為了就業,要能不被人工智慧所取代,那你就要學人工智慧做不到的或者現在做不到的。 實際操作,繼續操作,練習練習再練習 即使是線上課程,我也是要讓你實際操作,而不是看影片就完事,或者實際操作幾次就當作自己會了。很多技能訓練看起來好像學一次就學會...

台灣消費者物價指數和年增率關係

圖片
每當我們看到從消費者物價指數計算出來的年增率數字時,很多人總會覺得明明台灣的通貨膨脹率看起來不高,怎麼生活這麼苦?!我們不得不說到數字給人的錯覺。 1. 為什麼要用比率 原本我們將數字轉換成比率的目的是為了比較用。例如兩個不同單位的指標要做比較,那就數字轉換成比率,方便比較。特別是不同地區或國家之間的相同計算方式的指標要進行相比較時,比率的比較是最為方便且直接的。 但是如果要指標的前後期比較呢?這又是不同的故事了。 如果按照我們對消費者物價指數年增率的計算方式,其實並不適合做前後期比較,因為比較基準,也就是分母的地方,是不相同的。 例如,2023年3月的物價指數是104.32,年增率是與去年同期的101.92為基準下計算出2.355%。4月的物價指數是105.11,年增率是與去年同期的102.70為基準下計算出2.347%。如果你拿這兩個年增率進行比較,其實是不合理的,同時也不能反映物價指數是增加的情況。下方直條圖是消費者物價指數,看左邊縱軸。橘線是消費者物價指數年增率,其實只有兩點,線沒任何意義,看右邊縱軸。以直條高度和折線方向來看,兩個指標其實是不同方向的。 但如果我們只將消費者物價指數從3月到4月計算比率(稱為月增率),也同樣不能前後相比,因為計算的基準不同。所以,如何計算出真正可以讓指標進行前後比較的方式是很重要的。但目前來看並沒有真正可以提供我們進行前後比較的計算方式。 2. 兩者關係難判 如果我們將消費者物價指數和年增率形成數對後,對其建立精準的關聯模型,又會告訴我們什麼事情呢? 在此之前,我們得先思考,誰要當自變數。如果我們想要知道當年增率增減對物價指數影響,那麼年增率就是自變數。反之,如果我們想知道物價指數增減對年增率影響,那麼就要將物價指數當自變數。 而我們想知道的是:年增率變化從某個數字增減,那麼物價指數會怎麼變化。所以設定年增率為自變數。 這種設置 - 數學所學的X與Y可以互換,並且獲得很棒的截距和斜率關係 - 不能適用真實的數字世界。真正去試過後就會發現,數字得到的結果並不能畫上等號。  由於設定2%為閥值,所以在2%位置加上紅色垂直線。從上圖中,可以發現最左邊的關聯線市正斜率,以及通過2%的關聯線也是正斜率。後者是平均每增加1%年增率,就會增加約27.65點的消費者物價指數。 2024年11月的年增率是2.082%,12月是2.10...

別搞科學,因為現在的科學不是你認識的科學:數學建模生,數學建模死,數學建模不再撞大牆

圖片
簡單點的數據驅動數學建模,通常以迴歸直線模型為主。有些人認為一切的變量經過轉換都能用直線解釋。但遇到大數據和人工智慧(Artificial intelligence)時,兩者都以數據驅動為主,對數據的精準是要還原回數據本身。這就是為什麼他們只考慮直線模型或者如可以降為到以線性代數的直線模型這類的數學。我們以為他們的模型很多樣(variety),但實際上在大模型的形態下就已經限制並拒絕了「模型選擇」這條路線。

CER能解救學生逃離人工智慧的相似功能?

  CER是一種讓學習者提出主張(Claim)、找證據(Evidence)支持主張,再用推理(Reasoning賦予證據意義學習方法。另外還有CAER的方式在其中加了論點(Arguement)。 雖說看似這種方式與人工智慧的功能略有不同,其實就是我在將數據套入模型測試可不可行的意思。即使不可行,那也要找理由將數據進行轉換變成可行。 這在人工智慧上是非常悲哀的方式,卻是現在主流模型的做法。 人工智慧的底層思維就是這樣。 人工智慧在做數據的執行、運算、判斷,因為基於機器學習系列方法,「訓練」樣本就是將數據套入模型。那麼我們就要了解為什麼會需要「訓練」?因為前提是你心中有個模板。你希望數據如模板一樣,所以要一直訓練、一直訓練。 看看那些訓犬師,是不是對狗有個模板,希望狗乖巧,聽得懂一些口令等。這就是CER當中的主張。 主張 = 心中有既定模板 = 既定程序流程 與條件 = 模型 偏偏人工智慧真是人工智慧的話,那它就應該會自己查找。這是它原本設計精神所在。因為程式在被編寫的過程中可以加入自查模式。但什麼是自查?原本的自查是種在已經寫好的程序中,讓程式自己查找看有沒有在運行過程中發生bug。當bug發生時,可以自檢自修,或者繞過。自查的過程中,其實人工智慧的程序流程也是有模式在。你也可以視為這是種主張,還是被寫死的主張。 CER當中的主張就是我們預設的模型,也就是你早有模板在那。 接下來證據就是數據,如果數據套入預設模型,結果不理想,那就「訓練」。訓練就是推理。經由推理讓數據開始扭曲,也就是轉換數據。轉換要合理有據,對!所以是由推理當中去給予合理的意義,或者數學意義。讓一切都合情合理。 你說這樣做對嗎?當我們察知人工智慧該有的底層邏輯一開始就被掌控住,並且算法可能充滿各種的虛假和政治時,這樣的人工智慧又與日常社交有關。你認為會發生什麼事情? 在還沒有人工智慧宣告成功出世前,社會已經走向M化或者過度消費未來的情況,人工智慧到底是在服務誰?這才是核心問題。 如果真如科學程序,那麼「讓數據自己說話」就不會是將數據套入模型,求參數。而會是讓數據自己選擇模型或模式,能夠被完全驗證,過程能夠清楚被人類知道,一切都是透明的。高階的學術人員是能夠驗證它的一步步程序。 就像工程師測試人工智慧時,用UI介面與它對話,並認為它有情感。但那是它真有情感,還是導入的數據經過拼接後,讓它成為智者...

試寫AI職能培訓 - AI職能詳解

1. AI技術開發職能 專注於AI核心技術的設計與實現,適合有技術背景並熱衷於編程與技術開發的從業者。 技能需求: 編程基礎(Python、C++、R等) 機器學習/深度學習算法(如隨機森林、卷積神經網絡) AI框架(TensorFlow、PyTorch等) 數據預處理與特徵提取(不含完整分析與建模結果) 應用場景: 訓練模型進行語音識別或文本分類 開發特定場景AI算法(如自動駕駛決策模組) 2. AI應用工具職能 聚焦於利用AI識別或數學AI的應用工具完成特定任務,適合非技術背景或希望快速應用AI技術的人員。 技能需求: 操作常見AI工具(如OCR、圖像識別工具、MathAI建模軟體) 理解工具輸出的結構化數據 配合業務需求進行結果整合 能夠驗證AI結果 應用場景: 使用AI工具進行用戶行為識別 自動化流程(如智能客服中的問題分配) 為時間序列資料建構精準趨勢獲得更多關鍵資訊 3. AI硬體整合職能 專注於AI硬體設備的設計與運行,涉及硬體與AI算法的結合。 技能需求: 熟悉硬體開發流程(如芯片設計、邏輯設計) 瞭解嵌入式系統與AI的協同 操作邊緣計算相關技術 應用場景: 設計AI處理器(如TPU) 開發智能裝置(如工業機器人中的感測器模組) 4. AI理論與算法研究 聚焦於AI基礎理論和算法創新,適合學術研究者或高端技術人員。 技能需求: 深入理解AI數學基礎(如線性代數、概率論、迴歸分析、建模) 研究算法優化(如神經網絡結構調整、直接數據精準建模) 模型性能改進與理論驗證 (人類不能複製並驗證的AI理論與算法不算其中) 數據驅動結果能呈現數學式以供人類驗證 應用場景: 開發新型算法以提升AI效率 進行AI系統的理論驗證與學術推廣 內容來自chatGPT改寫與個人補充人工智慧並無納入的核心底層理論技術

官方會調整數據嗎?你沒發現的數據分析事情

圖片
 一般情況下,我們都會相信官方發布的財經數據,並參考數據以供決策使用。不過,你相信官方在發布後就不更改數據的話,很可能為你的決策帶來一連串的影響,或是造成投資損失。 以美國勞工統計局公布的非農商業部門實質時薪指數來說,這是判斷美國就業市場上工資率的一種參考指標。如果工資率往上走,代表以下幾種市場狀態: 勞動需求增加,同時供給不變 勞動需求增加且供給減少 勞動需求增加速度超過供給增加速度 勞動需求不變,同時供給減少 勞動需求增加且供給減少 勞動需求減少速度低於供給減少速度 當美國2024年第二季(4月)公布數據後,AI數據分析運算得到淺藍色的趨勢線是從2023年第二季到2024年第二季,呈現極平緩的下降趨勢。這樣的下降趨勢代表實質薪資變化不大,但仍在下降中,也就是工資率在下降。 工資率下降的好處是企業的人力成本可以舒緩,但勞動者就業後能得到的工資率會低,代表工資收入相對減少。同時工資率下降,可以看到勞動市場的供給量和需求量的變化情況。而其他的指標,如職缺人數、失業率等,我們可以發現職缺人數在減少中,失業率在上升。那麼你認為勞動市場發生什麼事情呢? 職缺人數正在減少,但仍有職缺,代表勞動需求仍在,只是增加的速度很低。 失業率上升,以勞動力不變下,就業人數就會減少。不過美國公布的就業人數是增加的。所以勞動供給是增加的。 那麼,需求在增加,供給也在增加,實質時薪在微幅下降,只可能是供給增加的速度超過需求增加速度,所以實質時薪才會微幅下降。 但是,當我們取得2024年第三季(7月)數據時,同樣使用AI數據分析運算後得到淺藍色趨勢線是上升趨勢,並且極其精準的上升趨勢線。有意思的是趨勢的起始點沒有改變。那麼,倒底發生什麼事情呢?怎麼會因為增加一筆數據就造成這樣的結果呢? 這時候我們就得回去看原始數據倒底怎麼了!下方的兩張圖是原始數據圖,工作表命名代表取得數據的當季。你可以看到從第22筆數據的數據就發生改變了。      一路地到2024年第二季的數據全都調整了。但是他們調整數值仍可維持在相同的趨勢轉折點,請看圖例就能知道趨勢轉折的起始點沒有改變。如此側面證實美國在調整數據上很有能力,保證某些關鍵資訊是可以維持正確。但是,我們若在之前相信了趨勢變化(即斜率值),那就糟糕了! 讓我們看到從第41筆到第46筆數據位置。第41筆數據就開始產生很明顯的...