iPAS AI 應用規劃師(中級) 科目2 大數據處理分析與應用 (2) 發佈留言 / 作者: S學院 / 2025-05-24 iPAS AI應用規劃師(中級) 科目2 大數據處理分析與應用 模擬試題,採智能選題,無限次反覆練習。 1. 下列何者不是極端值或雜訊產生的主要原因? 人為故意謊報資料導致錯誤 資料交給分析人員時,是透過電子郵件寄送而非隨身碟傳送 測量儀器出錯 數據輸入錯誤 None 2. 關於配適不足(under-fitting),下列何者正確? 訓練誤差較小,測試誤差較大 訓練誤差較小,測試誤差較小 訓練誤差較大,測試誤差較大 訓練誤差較大,測試誤差較小 None 3. 請問下列敘述何者不正確? 機器學習(machine learning)某種程度來說亦可稱為統計學習(statistical learning) Y 稱為結果變數(outcome) X 稱為屬性(attributes) 從所搜集的資料中建構出 X 與 Y 之間模型的過程,電腦科學的人群偏好敘述為從資料中「估計」模型參數這樣的說法,勝於從資料中「學習」的說法 None 4. 在資料分析之前,需要花費很多力氣去整理資料,其中處理遺失值(Missing Value)便是一種,下列何者不是處理遺失值的手段? 移除有遺失值的資料 使用 K-近鄰法(K-Nearest Neighbours)搭配中位數進行填補 將前一筆資料的值填入 使用平均數或第一四分位數來填補 None 5. 若兩事件 X、Y 為某試驗可能發生之二獨立事件,P(X)>0,P(Y)>0,下列何者不正確? P(X|Y)=P(X) P(X∩Y)=P(X)P(Y) P(X∪Y)=P(X)+P(Y) P(X|Y)P(Y)=P(Y|X)P(X) None 6. 關於盒鬚圖,下列敘述何者不正確? 為平均值(Mean) 為 75 百分位數(Upper Quartile) 為上圍籬(Upper Extreme) 為離群值(Outlier) None 7. 建立簡單線性迴歸模型之前常會根據資料的散佈圖進行模型假設,則下列四張資料的散佈圖,何者最適合使用簡單線性迴歸模型? None 8. 統計圖常用來將統計資料繪製成幾何圖形,從其顯示出資料的規模、水平、結構、趨勢、比例關係,下列何者不是常用的統計圖? 流程圖 長條圖 圓餅圖 折線圖 None 9. 關於資料特徵,下列敘述何者不正確? 資料特徵個數越多,容易引起維度災難,而模型也會越複雜 資料特徵個數越多,該模型所需的運算時間也就越短 可透過模型計算資料特徵重要程度,例如:Random Forest 剔除不相關或多餘的資料特徵,以減少資料特徵個數,提高模型效果 None 10. 圓餅圖 散布圖 雷達圖 折線圖 None 11. 下列何種方法常應用在分類問題? Logistic regression Polynomial Regression Support vector regression Linear regression None 12. 關於資料之遺缺值處理,下列何者不正確? 透過差值法(interpolation method)補上該值 無須考慮遺缺值比例,全部刪除 利用模型補上估計產生之值 類別資料補上眾數之值 None 13. 下列何種統計量無法由盒鬚圖(box-and-whisker plot, boxplot)得知? 中位數 全距 最小值 變異數 None 14. 下列學習方法,何者難以獲得人類容易理解的知識或特徵? Decision tree Multilayer perceptron Association rule mining Logistic regression None 15. 行銷部選擇部分客戶進行簡訊產品推薦,同時獲取了客戶是否願意購買產品的資訊;而通過這些已知資訊,用來判斷其他用戶的購買意願,請問屬於下列何種方法? 關聯法則 預測模型 推薦系統 探索性分析 None 16. 下列何者不屬於非監督式學習的演算法? XGBoost PCA Hierarchical-Clustering Auto-Encoder None 17. 下列何種圖形,較適合用來顯示資料隨著時間的變化趨勢? 直方圖 盒鬚圖 圓餅圖 折線圖 None 18. 對於某些資料屬性內出現異常大的值,有可能會導致誤導模型訓練的結果,此時會將該屬性值進行何種處理,使所有屬性值被轉換到 0 至 1 之間? 資料分析 資料組織 資料清理 資料特徵縮放 None 19. 關於邏輯斯迴歸中的迴歸係數,可以使用下列何種方法求解? 牛頓迭代法 最小平方法 馬可夫鏈演算法 最大概似估計法 None 20. 關於 K-Means 與 DBSCAN,下列敘述何者不正確? K-Means 集群結果易受離群值的影響 K-Means 基於距離的概念,而 DBSCAN 基於密度的概念 兩者都需要事先告知分群的數量 兩者都是集群分析 None 如有問題可留言,謝謝您的寶貴意見! 暱稱 電郵(提交獲得正確答案,可換題測驗完整題庫,新增題庫電郵通知) Time's up