iPAS AI 應用規劃師(中級) 科目2 大數據處理分析與應用 (2) 發佈留言 / 作者: S學院 / 2025-05-24 iPAS AI應用規劃師(中級) 科目2 大數據處理分析與應用 模擬試題,採智能選題,無限次反覆練習。 1. 下列何者不適合用來預測「句子的下一個詞」? Linear Regression Conditional random field Hidden Markov model N-gram None 2. 折線圖 雷達圖 圓餅圖 散布圖 None 3. 以下何者不是探索性資料分析經常關心的議題? 與應變數相關的自變數 資料的四分位數 資料模型的準確度 資料是否有離群值 None 4. 下列哪種方法不屬於特徵選擇(Feature-Selection)的標準方法? 嵌入方法(Embedded) 抽樣方法(Sampling) 過濾方法(Filter) 包裝方法(Wrapper) None 5. 關於監督式學習,下列敘述何者不正確? 模型的訓練資料必須有應變項 訓練資料過少時,可利用 Bootstrap(拔靴法)進行修正 訓練資料不一定為連續型資料 主成分分析是一種監督式學習的方法 None 6. 根據下面提供的資料,老闆希望你一句話報告今年業績和去年業績的狀況,請問下列哪句話比較合適?2017 年業績:100 萬 2018 年業績:120 萬 今年業績成長了 20% 今年業績增加了 20 萬 今年的業績是 120 萬 去年業績比今年少 20 萬 None 7. 在資料分析之前,需要花費很多力氣去整理資料,其中處理遺失值(Missing Value)便是一種,下列何者不是處理遺失值的手段? 移除有遺失值的資料 使用平均數或第一四分位數來填補 將前一筆資料的值填入 使用 K-近鄰法(K-Nearest Neighbours)搭配中位數進行填補 None 8. 請問下列敘述何者不正確? X 稱為屬性(attributes) Y 稱為結果變數(outcome) 從所搜集的資料中建構出 X 與 Y 之間模型的過程,電腦科學的人群偏好敘述為從資料中「估計」模型參數這樣的說法,勝於從資料中「學習」的說法 機器學習(machine learning)某種程度來說亦可稱為統計學習(statistical learning) None 9. 關於 K-Means 與 DBSCAN,下列敘述何者不正確? K-Means 集群結果易受離群值的影響 K-Means 基於距離的概念,而 DBSCAN 基於密度的概念 兩者都需要事先告知分群的數量 兩者都是集群分析 None 10. 下列何者不是屬性轉換的主要目的? 讓資料能夠符合模型所需要的假設,以利進行分析,例如經過轉換後的資料呈現正態分布 資料可能呈現嚴重的偏態分布,經過轉換後差異可以拉開 轉換後可能更容易發現資料之間的關係,使沒有關係變成有關係 能夠讓資料的可讀性更高 None 11. 關於獨立(independence)與相依(dependency),下列敘述何者不正確? 相關(correlation)係數為 0,代表兩變數統計獨立 數值變數以相關係數代表兩變數之間的相依性 獨立與相依是描述兩變數之間關係的概念 關聯(association)衡量是基於頻次進行計算,用以表達兩類別變數之間的相依性 None 12. 關於巨量資料,下列敘述何者不正確? 能妥善處理和保存大量的數據資料,即為巨量資料所談的量級(Volume)之特性 隨著巨量資料分析技術俱進,分析人員可以忽略數據的真實性,依然仍夠得到理想的結果 巨量資料分析始於找出大量資料之間的關聯性 好的巨量資料運算服務,是可以根據運算需求與時效性,平行擴增所需要的運算資源 None 13. 關於模型績效評估,下列敘述何者不正確? 殘差(或稱預測誤差)是預測的反應變數值減去真實的反應變數值 赤池弘次訊息準則(Akaike's Information Criterion, AIC)與舒瓦茲貝氏訊息準則(Schwarz's Bayesian Information Criterion, BIC)的不同在於懲罰過多變數入模的方式不同 Mallow's Cp 準則有考慮建模所用的變數數量,因此適合用來比較不同變數數量下的模型績效 迴歸模型績效衡量大多基於殘差 None 14. 下列何者不是資料降維的方法? Principal Component Analysis Linear Discriminant Analysis K Nearest Neighbors Isomap None 15. 關於邏輯斯迴歸中的迴歸係數,可以使用下列何種方法求解? 最小平方法 牛頓迭代法 最大概似估計法 馬可夫鏈演算法 None 16. 利用多個分類器的預測來提高分類的準確率之技術為下列何者? Pruning Ensemble Dimensionality reduction Feature selection None 17. 建立簡單線性迴歸模型之前常會根據資料的散佈圖進行模型假設,則下列四張資料的散佈圖,何者最適合使用簡單線性迴歸模型? None 18. 下列何種統計量無法由盒鬚圖(box-and-whisker plot, boxplot)得知? 中位數 變異數 最小值 全距 None 19. 史皮爾曼相關係數(Spearman correlation coefficient)是一種兩兩變數相關係數計算的方式,下列敘述何者不正確? 史皮爾曼相關係數又稱為等級相關係 名目值類別變數(nominal qualitative variables)適合此計算方式 實數值量化變數(real-valued quantitative variables)適合此計算方式 順序值類別變數(ordinal qualitative variables)適合此計算方式 None 20. 下列何種方法常應用在分類問題? Polynomial Regression Support vector regression Linear regression Logistic regression None 如有問題可留言,謝謝您的寶貴意見! 暱稱 電郵(提交獲得正確答案,可換題測驗完整題庫,新增題庫電郵通知) Time's up