iPAS AI 應用規劃師(中級) 科目2 大數據處理分析與應用 (2) / iPAS AI 應用規劃師, AI 測驗題庫, iPAS AI 中級, 測驗題庫 / 作者: S學院 iPAS AI應用規劃師(中級) 科目2 大數據處理分析與應用 模擬試題,採智能選題,無限次反覆練習。 1. 某公司員工 8 人,月薪如下: 薪資中位數為 29 千元 繪製成箱形圖(Box plot,盒鬚圖),呈現右偏 有 50%的員工,薪資第二四分位數 有 50%的員工,薪資平均值 None 2. 下列敘述何者在描述巨量資料中多樣性(Variety)的特性? 能夠大幅縮短分析的時間,能更快速反應商業需求 能夠處理相當大的資料,例如 100TB 的歷史資料 善於處理非結構化資料,例如各式網站資料等 能夠處理每天龐大的交易數據 None 3. 關於配適不足(under-fitting),下列何者正確? 訓練誤差較小,測試誤差較大 訓練誤差較大,測試誤差較大 訓練誤差較小,測試誤差較小 訓練誤差較大,測試誤差較小 None 4. 下列何者不是屬性轉換的主要目的? 讓資料能夠符合模型所需要的假設,以利進行分析,例如經過轉換後的資料呈現正態分布 能夠讓資料的可讀性更高 資料可能呈現嚴重的偏態分布,經過轉換後差異可以拉開 轉換後可能更容易發現資料之間的關係,使沒有關係變成有關係 None 5. 利用多個分類器的預測來提高分類的準確率之技術為下列何者? Ensemble Dimensionality reduction Pruning Feature selection None 6. 對自變數 X 與依變數 Y 作簡單線性迴歸得到的相關係數 r,下列敘述何者正確? r = -1 代表 X 與 Y 完全無關 r = 1 代表 Y=aX+b(a、b 是常數,a>0) r > 0 代表 X、Y 間有因果關係 r = 0 代表數據點恰好落在同一條水平直線上 None 7. 關於盒鬚圖,下列敘述何者不正確? 為 75 百分位數(Upper Quartile) 為離群值(Outlier) 為上圍籬(Upper Extreme) 為平均值(Mean) None 8. 在資料分析之前,需要花費很多力氣去整理資料,其中處理遺失值(Missing Value)便是一種,下列何者不是處理遺失值的手段? 移除有遺失值的資料 使用平均數或第一四分位數來填補 將前一筆資料的值填入 使用 K-近鄰法(K-Nearest Neighbours)搭配中位數進行填補 None 9. 關於資料解析思維,下列敘述何者不正確? 機器學習模型不需要考慮資料是否與背景假設吻合 集成(或稱系集)模型(ensemble models)可以發揮團結力量大的效果,解決困難的問題 利用重抽樣樣本中的不確定性,可以強化參數估計過程與避免過度配適 巨量資料中雜訊多,穩健統計方法可降低雜訊對模型的影響 None 10. 經過網路爬蟲收集的網頁資料(如新聞網頁 HTML 格式資料)為半結構化的內容,經過解析器取得各式重要資訊,並透過詮釋資料(Metadata)結構化這些內容,這樣的過程與下列何者較為相符? 模型預測 資訊分類 資料擴增 資料組織 None 11. 胖虎目前在分析一間公司的健康檢查資料,其中有一個欄位是 BMI 值,胖虎想要將其根據不同區段分類為過輕、正常、過胖、肥胖,請問胖虎正在做的是何種屬性轉換? 捨入(Rounding) 分級(Bining) Log 轉換(Log Transformation) 二值化(Binarization) None 12. 關於 MapReduce 框架,下列敘述何者不正確? 實現 Reducer,通常是定義如何處理個別鍵值下的值集合 資料在進入 Map 階段之前會經過整理階段(shuffle) Reducer 的輸出值通常也是鍵值組(key-value pair)的結構 Mapper 的輸出需要是鍵值組(key-value pair)的結構 None 13. 下列何種圖形,較適合用來顯示資料隨著時間的變化趨勢? 直方圖 盒鬚圖 折線圖 圓餅圖 None 14. 建立簡單線性迴歸模型之前常會根據資料的散佈圖進行模型假設,則下列四張資料的散佈圖,何者最適合使用簡單線性迴歸模型? None 15. 下列哪種的資料可以無需經過前處理,直接使用線性模型(Linear Model)進行學習? 最高時速(公里/小時)、車款(車種型號) 身高(公分)、體重(公斤) 氣候(晴、陰、雨)、溫度(攝氏溫度) 性別(男、女)、腰圍(公分) None 16. 圓餅圖 雷達圖 折線圖 散布圖 None 17. 下列何者不屬於非監督式學習的演算法? PCA XGBoost Hierarchical-Clustering Auto-Encoder None 18. 關於資料之遺缺值處理,下列何者不正確? 類別資料補上眾數之值 利用模型補上估計產生之值 無須考慮遺缺值比例,全部刪除 透過差值法(interpolation method)補上該值 None 19. 關於階層式分群法(Hierarchical Clustering),下列敘述何者不正確? 群與群的距離定義為不同群聚中最近的兩個點的距離,該法稱為單一聯結法(Single Linkage,又稱「最近法」) 若採用聚合的方式,則由樹狀結構的底部開始,將資料或群集逐次合併 事先必須告知分群數量,以利分群法之進行 若採用分裂的方式,則由樹狀結構的頂端開始,將群集逐次分裂 None 20. 以下何者不是探索性資料分析經常關心的議題? 資料模型的準確度 資料的四分位數 資料是否有離群值 與應變數相關的自變數 None 如有問題可留言,謝謝您的寶貴意見! 暱稱 電郵(提交獲得正確答案,可換題測驗完整題庫,新增題庫電郵通知) Time's up