114年第二梯次中級AI應用規劃師第三科機器學習技術與應用(當次試題公告114.11.20)

114年第二梯次中級AI應用規劃師第三科機器學習技術與應用(當次試題公告114.11.20),採智能選題,無限次反覆練習。

1. 
在執行 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)群集分析時,若某資料點鄰域內的樣本數不足以形成核心點(Core Point),且該點未被任何核心點的鄰域所包含,也未與其他群集形成密度可達關係(Density Reachability),此資料點最終將被歸類為哪一種類型?

2. 
標籤偏差(Label Bias)通常是因為什麼原因造成?

3. 
研究人員在對digits資料集進行分類時,決定使用KNN並搭配交叉驗證來 評估模型準確率。他們撰寫了四組不同的程式碼來進行KNN訓練與交叉驗 證,但不確定哪幾組程式碼能正確執行並輸出準確率。每組程式碼在資料 切割、模型訓練、交叉驗證函數的使用上略有差異,研究人員希望找出可 以正確完成任務的程式碼組合,以確保模型評估的可靠性。

在郵遞區號自動辨識的研究中,研究人員收集了一份手寫數字影像資料 集,每一張影像為8×8的灰階圖片,共包含多個手寫數字樣本。這份資料 集來自UCI Machine Learning Repository,常被用於數字辨識與機器學 習方法的教學與實驗。 在過程中,研究人員發現資料中可能存在雜訊,例如筆跡模糊或影像中附 加的干擾點,這會影響後續分類模型的效能。因此,他們希望透過資料降 噪的方法,提升後續分類的準確度。同時,他們也想透過 KNN (K-Nearest Neighbors) 搭配交叉驗證來評估模型表現,確保模型在不同資料切割下都 能有穩定的預測能力。

部分樣本經繪製後的外觀如下圖所示:

根據這份資料來回答問題。








請問哪幾組程式碼能正確使用KNN搭配交叉驗證,對digits資料集進行訓 練並輸出準確率?

 

 

 

 

4. 
某電子商務公司為開發商品評論情感分析模型,希望模型能捕捉評論中不同特徵之間的關聯影響,例如「商品價格」與「顧客滿意度」的互動效果。下列哪一種特徵工程設計方式最適合用於建立互動特徵(Interaction Features)?

5. 
在實務應用中,我們常使用遷移學習(transfer learning)技巧,即載入預訓練模型(如 VGG16),凍結部分層的參數,只針對特定任務重新訓練最後幾層,這種做法可節省訓練時間並提升模型效能。假設你要對 VGG16 進行遷移學習(transfer learning),希望凍結卷積層的參數,只訓練最後全連接層(classifier)。下列哪段程式碼寫法正確?


VGG16是由牛津大學 Visual Geometry Group(VGG)在2014年提出的經典 卷積神經網路(Convolutional Neural Network, CNN)架構。該模型以簡 潔且規則的層堆疊設計聞名,廣泛應用於影像分類、特徵提取及遷移學習 等任務。附圖程式碼載入了預訓練的VGG16模型,並輸出其完整層級結構 及參數統計摘要(如附表)。請根據此資訊回答問題。










6. 
相較於 Grid Search,Random Search 在超參數調整上具備哪一項主要優勢?

7. 
一家零售電商公司希望建立顧客流失預測模型,用以判斷哪些會員可能在三個月內不再消費。團隊以去年會員資料進行訓練,並僅採用「曾經購買三次以上」的活躍顧客紀錄作為樣本。模型上線後,對整體會員進行預測時,發現模型對於新註冊會員與低消費會員的預測準確率明顯偏低。下列何者為造成此現象最可能的原因?

8. 

附圖程式碼所計算的是哪一類型的評估指標?

9. 
VGG16層數深且結構規則,由多層卷積、池化及全連接層組成。了解各層的輸入/輸出維度、參數量及記憶體需求,有助於掌握CNN模型的組成邏輯與實作技巧。根據VGG16的模型架構,下列敘述何者正確?


VGG16是由牛津大學 Visual Geometry Group(VGG)在2014年提出的經典 卷積神經網路(Convolutional Neural Network, CNN)架構。該模型以簡 潔且規則的層堆疊設計聞名,廣泛應用於影像分類、特徵提取及遷移學習 等任務。附圖程式碼載入了預訓練的VGG16模型,並輸出其完整層級結構 及參數統計摘要(如附表)。請根據此資訊回答問題。










10. 
在深度神經網路中,不同層的參數量(parameter count)差異極大。有些層雖然數量少但計算量大,有些則相反。了解參數分佈情形,有助於模型壓縮與遷移學習設計。請問在VGG16中,下列何者的參數量最多?


VGG16是由牛津大學 Visual Geometry Group(VGG)在2014年提出的經典 卷積神經網路(Convolutional Neural Network, CNN)架構。該模型以簡 潔且規則的層堆疊設計聞名,廣泛應用於影像分類、特徵提取及遷移學習 等任務。附圖程式碼載入了預訓練的VGG16模型,並輸出其完整層級結構 及參數統計摘要(如附表)。請根據此資訊回答問題。






11. 
在工業設備故障預測專案中,模型訓練與超參數調整均依賴於一段歷史數據作為驗證集。然而,隨著設備運行環境與工況條件的變化,原有驗證集已無法充分反映現況,導致模型在實際部署後的預測準確率逐漸下降。下列哪一種策略最能有效提升模型在長期運行環境中的穩健性與泛化能力?

12. 
依據附圖程式碼進行資料處理,下列何者正確?

13. 
某能源公司利用歷史氣象與用電資料,開發長期電力需求預測模型,採用深度神經網路架構進行訓練。在訓練過程中,模型在訓練集上的損失值持續下降,但在驗證集上,損失在第 80 輪後開始波動,呈現週期性上升與下降。團隊懷疑模型受到季節性資料波動與隨機噪音影響,導致驗證損失難以穩定收斂。若要在此情境下合理運用早期停止法(Early Stopping)以確保模型具最佳泛化能力,下列哪一項策略最為適當?

14. 
參考下圖執行結果,下列何者正確?


使用鐵達尼號(Titanic)資料集進行多層感知機(Multilayer Perceptron, MLP)分類預測分析,其中survived為反應變數(1表示存活,0表示死 亡)。附圖程式碼展示資料載入與處理,請根據此資料回答問題。


下圖顯示資料集的前5筆資料。

15. 

附圖程式碼實現的是哪一種正則化技術?

16. 
資訊增益(Information Gain)常用於衡量特徵對分類結果的不確定性貢獻程度,並據以進行特徵選擇。此方法主要應用於下列哪一類模型架構中?

17. 
下列何者最能同時反映 XGBoost(eXtreme Gradient Boosting)相較於傳統梯度提升決策樹(Gradient Boosting Decision Tree, GBDT)的主要技術改進?

18. 
某智慧城市團隊開發一套交通監控系統,用於即時辨識路口監視器影像中的車輛與行人。團隊比較後發現,卷積神經網路(Convolutional Neural Network, CNN)在訓練與推論效率上,明顯優於傳統的全連接神經網路(Fully Connected Neural Network, FCNN)。請問下列何者為主要原因?

19. 
在二元分類問題中,若精確率(Precision)為 0.8,召回率(Recall)為 0.6,則 F1 分數(F1 Score)為何?

20. 
在訓練非線性模型時,若目標函數為非凸函數(Non-convex Function),演算法在參數更新過程中可能出現多個極值點,導致最佳化結果不穩定。請問此時最可能發生下列哪一種情況?


error: Content is protected !!
返回頂端