2025年9月3日 星期三

2025 09 03 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 AI應用規劃師初級: L11 人工智慧基礎概論 L11201 資料基本概念與來源下列 哪一項技術 屬於 非監督式學習? (A) 決策樹(Decision Tree) (B) 類神經網路(Neural Network) (C) 集群分析(Clustering Analysis) (D) 支援向量機(Support Vector Machine)

 

2025 09 03 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 AI應用規劃師初級: L11 人工智慧基礎概論 L11201 資料基本概念與來源下列 哪一項技術 屬於 非監督式學習? (A) 決策樹(Decision Tree) (B) 類神經網路(Neural Network) (C) 集群分析(Clustering Analysis) (D) 支援向量機(Support Vector Machine)

AI應用規劃師初級: L11 人工智慧基礎概論 

     L11201 資料基本概念與來源


 80. 下列敘述  何者正確? 

       (A) 樣本變異數的值一般介於1與-1之間

       (B) 母體變異數計算公式與樣本變異數相同 

       (C) 變異係數(Coefficient of Variance)=(標準差/平均數)*100% 

       (D) 相關係數介於0與1之間 


81. 關於  K平均法(K-means),下列敘述何者  不正確? 

        (A) 希望找出k個互不交集的群集

        (B) 不同的起始群集中心,可能會造成不同的分群結果 

        (C) 容易受雜訊與離群值影響其群集中心 

        (D) 可以處理類別型資料 


82.  探索式資料   分析的   主要目的為何? 

        (A) 熟悉資料 

        (B) 視覺化資料 

        (C) 測試模型 

        (D) 資料分群 


83. 下列  哪一項技術 屬於  非監督式學習? 

          (A) 決策樹(Decision Tree) 

          (B) 類神經網路(Neural Network) 

          (C) 集群分析(Clustering Analysis) 

          (D) 支援向量機(Support Vector Machine) 


84. 關於  探  索式資料繪圖,下列敘述何者  不正確? 

          (A) 直方圖之X軸資料是間斷不連續的 

          (B) 長條圖適合用於類別型資料分析 

          (C) QQ plot 可用於常態分佈視覺化檢驗 

           (D) ROC 曲線(Receiver Operating Characteristic Curve)

                用於分類模型 評估 


 85. 關於集群分析(Clustering Analysis),下列敘述何者  不正確

         (A) 依照相似度將資料分群 

         (B) 同一群內的相似度大 

         (C) 各群之間的相似度小 

         (D) K-means 每次分群結果一定會相同 


86. 關於階層式集群分析(Hierarchical Clustering),下列敘述何者不正 確? 

        (A) 一般採用樹狀圖(Dendrogram)表示 

        (B) 樹狀圖根節點(Root)為單一群集

        (C) 聚合法(Agglomerative)是由上方根節點往下進行計算 

         (D) 分裂法(Divisive)是一開始將所有資料視為一個大群集 


 87. 關於階層式集群分析(Hierarchical Clustering)的方法,

          下列敘述何 者不正確? 

        (A) 單一連結法(Single Linkage Method)採用兩群間最小距離 

        (B) 完全連結法(Complete Linkage Method)採用兩群間最大距離 

        (C) 平均連結法(Average Linkage Method)採用兩群間中心點距離 

        (D) 華德法(Ward's Method)是計算組內變異作為評估群集相似性 


88. 推薦系統(Recommender System)通常採用下列哪一個方法作為核心 技術,

         來分析   產品與使用者  間的關係? 

        (A) 支援向量機(Support Vector Machine) 

        (B) 矩陣分解(Matrix Factorization) 

        (C) 線性判別分析(Linear Discriminative Analysis) 

         (D) 詞性標記(Part-of-Speech(POS)Tagging) 


89. 下列何種  統計學習  的  演算法  是用來   進行資料的分群(Clustering)

          但 不能用  來進行   資料分類(Classification)? 

         (A) 基於密度的集群分析算法

           (Density-Based Spatial Clustering of Applications with Noise,DBSCAN

         (B) 貝氏網路(Bayisian Network) 

         (C) 隨機森林(Random Forest) 

         (D) 支援向量機(Support Vector Machine)




2025年9月2日 星期二

2025 09 02 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 AI應用規劃師初級: L11 人工智慧基礎概論 L11201 資料基本概念與來源. 巨量資料中,以資料類別出現頻率排列下出現的長尾現象, 一般可 利用哪種 統計工具 來描述資料分佈? (A) Zipf(齊夫分佈) (B) Gaussian(高斯分佈) (C) Dirichlet(狄利克雷分佈) (D) Uniform(均勻分佈)

 

2025 09 02 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 AI應用規劃師初級: L11 人工智慧基礎概論 L11201 資料基本概念與來源. 巨量資料中,以資料類別出現頻率排列下出現的長尾現象, 一般可 利用哪種 統計工具 來描述資料分佈? (A) Zipf(齊夫分佈) (B) Gaussian(高斯分佈) (C) Dirichlet(狄利克雷分佈) (D) Uniform(均勻分佈)

 AI應用規劃師初級: L11 人工智慧基礎概論 

     L11201 資料基本概念與來源


 50.  當使用  線性模型 時,哪種方法   對於    學習預測線性    不可分的  資料集

           也許 有幫助? 

        (A) 交叉驗證(Cross validation) 

        (B) 核方法(Kernel method) 

        (C) 過採樣(Over sampling) 

        (D) 降採樣(Down sampling)


51. 將網頁資料擷取下來之後,應先進行下列何步驟? 

        (A) 資料清理(Cleaning) 

        (B) 資料建模(Modeling) 

        (C) 資料變形(Reshaping) 

        (D) 趨勢預測(Prediction) 


 52. 假設Facebook公司給您1000位用戶的基本資料及文章資料,

           如: 姓名、性別、年齡以及最近十篇發文的時間、點讚數、回應數與

          分享 該文章所有人的基本資料,最適合 R語言中 的何種資料結構? 

       (A) 資料框架(Data frame) 

       (B) 串列(List) 

       (C) 向量(Vector) 

        (D) 矩陣(Matrix) 


 53. 若資料表中  只出現了一個   遺缺值(NA)值,下列何項處理方式最不 適當

        (A) 刪除整欄(變數) 

        (B) 刪除整列(觀測值) 

        (C) 以該欄其餘的資料平均值取代NA值 

        (D) 往回追溯資料源頭,尋找NA的來源 


 54. 下列何者  不是  資料倉儲  的資料類型? 

         (A) 運算資料 

         (B) 預先加總資料 

         (C) 中繼資料(Metadata)

          (D) 即時更新資料 


55. 一般來說,下列何者不是   資料清理的目的? 

           (A) 將資料轉為可以分析的格式 

           (B) 發現資料之間的相關性 

          (C) 處理遺缺值 

           (D) 讓計算及分析上,更為方便及降低偏誤 


56. 在一次考試中,由於班上同學考試成績最高分僅有70 分,為了能 夠

           讓學期成績比較好看,老師決定幫每個人的考試成績都加10分,

          請 問這個數值樣本中的  哪個統計量  不會因為調分  而有差別? 

           (A) 平均值 

           (B) 標準差 

           (C) 中位數 

            (D) 第一四分位數 


 57. 在統計學中,下列哪一個選項的  分佈類型  與其他不相同? 

           (A) 二項分佈(Binomial Distribution) 

           (B) 指數分佈(Exponential Distribution) 

           (C) t 分佈(t Distribution) 

           (D) 常態分佈(Normal Distribution) 


 58. 關於資料探索,下列敘述何者不正確? 

           (A) 透過工具函數(例如:R 語言當中的 summary 函數)可了解關於 

                  資料集內容的整體結構、變數情況、分佈指標、遺缺值 

           (B) 視覺化工具可幫忙了解變數間的關係,以利後續資料探勘作業 

           (C) 定性變數可計算出最小值、分位數、中位數、平均值與最大值進行 

                  觀察 

           (D) 透過平均值和中位數的差異程度來判斷資料的偏倚程度,可用來

                  判 斷資料之左偏或右偏情況 


59. 巨量資料中,以資料類別出現頻率排列下出現的長尾現象

          一般可 利用哪種  統計工具   來描述資料分佈? 

          (A) Zipf(齊夫分佈) 

          (B) Gaussian(高斯分佈) 

          (C) Dirichlet(狄利克雷分佈) 

          (D) Uniform(均勻分佈)



2025年8月9日 星期六

2025 08 09 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 永續管理師 AI企畫師 AI 管理顧問師 AI 應用規劃師 鑑別式AI(Discriminative Al) 與 生成式AI(Generative Al) 製造業AI/GAI應用發展重點 製造業實務面臨的問題種類多元,包含 1.分類(瑕疵檢測、垃圾郵件過濾) 2.分群(市場區隔、客戶群體細分) 3.序列預測 (市場需求預測、物料庫存管理、設備預測性維護),以及 4.生成 (數據生成、產品設計)等

 

2025 08 09 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 永續管理師 AI企畫師 AI 管理顧問師 AI 應用規劃師 鑑別式AI(Discriminative Al) 與 生成式AI(Generative Al) 製造業AI/GAI應用發展重點 製造業實務面臨的問題種類多元,包含 1.分類(瑕疵檢測、垃圾郵件過濾) 2.分群(市場區隔、客戶群體細分) 3.序列預測 (市場需求預測、物料庫存管理、設備預測性維護),以及 4.生成 (數據生成、產品設計)等,

製造業AI/GAI應用發展重點

製造業實務面臨的問題種類多元,包含


       1.分類   (瑕疵檢測、垃圾郵件過濾)


       2.分群   (市場區隔、客戶群體細分)


       3.序列預測

          (市場需求預測、物料庫存管理、設備預測性維護),以及


       4.生成  (數據生成、產品設計)等,


這些問題  適用的AI演算法


按  主要功能 與  應用目的,


可以將其分為


鑑別式AI(Discriminative Al)   與  生成式AI(Generative Al)





鑑別式AI(Discriminative Al)


擅長  分類  和歸納數據,根據   數據特徴差異 分析數據類別,


常用於   語音辨識、圖片  與  影像辨識等應用;


生成式AI(Generative Al)


則  擅長創造數據,能生成  類似訓練數據  文字、圖片、影像、程式碼等。


由上述可知,鑑別式AI和生成式AI各有專長,並不互相替代,


而是根據不同應用場景,選用合適的Al技術滿足需求。




由於技術特性差異,兩類型AI用於製造業時方案開發的著重點也不同。


以下將透過建構AI方案流程,說明兩類AI技術


在 數據收集模型選擇模型訓練模型部署 與  優化作業流程


的  重點差異


(1)數據收集方面,鑑別式AI  更重視   數據品質,


    依賴  數據標記  與高度準確性、一致性的數據   掌握數據特徴,


    然而   數據  處理過程  費時


    而生成式Al通常需要先進行   領域知識數據  微調(Fine-tuning),


    再向客戶  收集內部數據


    進行檢索增強生成(Retrieval-AugmentedGeneration,RAG),


    以便生成更精確内容。


(2)模型選擇上,


鑑別式AI方案業者


可能採用  社群  或  研究機構   公開的  開源  且 高效  的模型,


或是自行開發模型。


且由於鑑別式AI   應用   對應   特定問題,因此業者傾向選用  


結構  較簡單  且  易於解釋的   模型,如


    1.決策樹、


    2.支援向量機器(Support Vector Machine, SVM)和


    3.類神經網絡、


    4.群集分析(K-means Clustering)


等用於準確  分類 或 預測    的模型;




生成式AI方


則多是選擇現有的大型語言模型,如


GPT、Llama、BLOOM、Falcon、BERT等,


在此基礎上  進行    應用開發。






2025年8月8日 星期五

2025 08 08 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 永續管理師 AI企畫師 AI 管理顧問師 AI 應用規劃師 開源地端模型 與 智慧製造 開源地端模型 透過在 本地端部署具有 1.可自訂性 2.低延遲 3.高安全性 的AI 演算法 數位孿生技術 與 虛擬優化虛實融合模擬– 數位孿生 是指在 虛擬環境中建立 1.產品、 2.生產線或 3.整座工廠 的精確數位 模型

 

2025 08 08 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 永續管理師 AI企畫師 AI 管理顧問師 AI 應用規劃師 開源地端模型 與 智慧製造 開源地端模型 透過在 本地端部署具有 1.可自訂性 2.低延遲 3.高安全性 的AI 演算法 數位孿生技術 與 虛擬優化虛實融合模擬– 數位孿生 是指在 虛擬環境中建立 1.產品、 2.生產線或 3.整座工廠 的精確數位 模型

 開源地端模型  與  智慧製造


開源地端模型  透過在  本地端部署具有

    1.可自訂性 

    2.低延遲    

    3.高安全性

的AI 演算法,


能夠實現智慧製造中的

    1.即時品質  監控

    2.預測性      維護

    3.生產流程  優化


開源地端模型指的是

那些  公開

   1.釋出其源代碼、

   2.模型架構  與

   3.部分或全部權 重,並且

   4.能夠在本地硬體(例如個人電腦或內部伺服器)上

   部署  與  運行的 語言模型。


 •此類模型允許使用者在無需依賴雲端服務的情況下,

  自行管理  與  調整模 型,從而更好地保護

  資料隱私  並  滿足個別化需求


  主要特性與優勢– 

    靈活度高:使用者可按需求  查閱、修改與優化  模型。

    隱私保護:資料在本地運算降低  外洩風險。 

     即時響應:減少  網路    傳輸延遲提高  系統   反應速度。 


常見的開源地端模型– 

GPT-2:

由 OpenAI發布,擁有多個不 同參數規模的版本,

其中較小版本對硬 體資源要求較低。

 LLaMA:

Meta發布的系列模型,雖然 使用上可能需遵循特定限制

(  LLaMA 的 原始權重僅對符合條件的  學術研究者  及 機構  開放),

但也被廣泛    應用於   本地化 研究與實驗– 

T5 系列:

由 Google 提出,該模型基 於「文本轉文本」架構,可根據任務需 求進行微調。

針對資源有限的情況,可 選擇 T5-Small 或 T5-Base 版本


數位孿生技術  與  虛擬優化


虛實   融合模擬– 數位孿生 

是指在   虛擬環境中建立

    1.產品、

    2.生產線或

    3.整座工廠

     的  精確 數位 模型,並以 實際資料  加以驅動。

 未來更多製造商  將運用   數位孿生  來  優化生產

透過在虛擬工廠中模擬 各種  生產  參數變化AI可以預測 不同設定對

產出、品質的影響,協助 找出    最佳方案。 


產品   研發 與 產線   導入–數位孿生

除  優化現有流程,對 新產品導入 也  極為有利

研發團隊   可先 行建立   產品的  數位孿生

在虛擬環境中  模擬    製造與組裝過程,預估  良 率 和  周期。

若結果不理想,可在虛擬模型中  反覆修改   設計 和 製程,

直到達標   再轉 到   實體試產大幅縮短  研發週期



2025年8月4日 星期一

2025 08 04 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 永續管理師 AI企畫師 AI 管理顧問師 AI 應用規劃師 模型訓練 是 機器學習過程 的 核心階段,其目標是透過學習 輸入特徵 與 輸出結 果 之間的 映射關係,找出最優的模型參數。 模型訓練 通 常涉及 1.損失函數的設置、 a. 均方誤差(Mean Squared Error, MSE): b. 交叉熵損失(Cross-Entropy Loss): 2.優化演算法的選擇 以及 3.避免過擬合的策略。1. 損失函數2. 優化演算法 a. 批次梯度下降(Batch Gradient Descent, BGD):b. 隨機梯度下降(Stochastic Gradient Descent, SGD): c. Adam(Adaptive Moment Estimation)演算法:3.. 過擬合的防範  Regularization: Early Stopping: Data Augmentation:

 

2025 08 04 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 永續管理師 AI企畫師 AI 管理顧問師 AI 應用規劃師 模型訓練 是 機器學習過程 的 核心階段,其目標是透過學習 輸入特徵 與 輸出結 果 之間的 映射關係,找出最優的模型參數。 模型訓練 通 常涉及 1.損失函數的設置、 a. 均方誤差(Mean Squared Error, MSE): b. 交叉熵損失(Cross-Entropy Loss): 2.優化演算法的選擇 以及 3.避免過擬合的策略。1. 損失函數2. 優化演算法 a. 批次梯度下降(Batch Gradient Descent, BGD):b. 隨機梯度下降(Stochastic Gradient Descent, SGD): c. Adam(Adaptive Moment Estimation)演算法:3.. 過擬合的防範  Regularization: Early Stopping: Data Augmentation:

模型訓練 

模型訓練  是  機器學習過程  的   核心階段,其目標是透過學習

輸入特徵  與  輸出結 果    之間的  映射關係,找出最優的模型參數。

模型訓練    通  常涉及

1.損失函數的設置、 

2.優化演算法的選擇以及

3.避免過擬合的策略。 


1.. 損失函數 

 損失函數(Loss Function)是一種用來衡量   模型預測值  與   實際目標    

之間差異的 函數。

透過損失函數的計算,模型可以得知   自身的損失(Loss,代表不準確度), 

損失值越高,表示模型預測結果與實際值的誤差越大,反之則表示模型越準確。 

因此,損失函數  可以視為   評估模型好壞的指標。 

 在模型訓練過程中,系統會不斷計算損失,並

透過  優化器(Optimizer)

   a. 均方誤差(Mean Squared Error, MSE):


用於迴歸任務,計算  預測值  與  真實值  之 間  平方誤差    平均值

   b. 交叉熵損失(Cross-Entropy Loss):

用於分類任務,衡量預測概率分佈與真實分 佈之間的差異。 


2. 優化演算法 

 模型的訓練過程  透過    優化演算法  調整參數,以最小化  損失函數的值。

最常見 的優化演算法是    梯度下降法   及其變種:


使用  梯度下降(Gradient Descent)

等方法來最小化損失,藉此降低模型的誤差,以達 到最佳化的目的。

常見的損失函數包括:

 a. 批次梯度下降(Batch Gradient Descent, BGD):

     基於整個  數據集   計算    損失函數 的梯度    並   更新參數。 

 b. 隨機梯度下降(Stochastic Gradient Descent, SGD):

    每次迭代僅使用一個樣本來 更新參數,速度較快但收斂不穩定。 

 c. Adam(Adaptive Moment Estimation)演算法:

     結合了  動量法   和 RMSProp,能夠 自適應學習率,是目前最廣泛使用的

      優化方法之一。


3.. 過擬合的防範 

     過擬合是模型在訓練數據上表現優異,但在測試數據上   表現不佳的現象。

     為 了避免過擬合,通常採用以下策略: 

  Regularization:

        在損失函數中添加懲罰項,如L1和 L2正則化。 

  Early Stopping:

        當模型在驗證集上的表現開始下降時,停止訓練。 

  Data Augmentation:

      透過   隨機旋轉、翻轉等方式   擴展  訓練數據集,提升模型的   泛 化能力