iPAS AI 應用規劃師(中級) 科目2 大數據處理分析與應用 (3)

iPAS AI應用規劃師(中級) 科目2 大數據處理分析與應用 模擬試題,採智能選題,無限次反覆練習。

1. 
俗話說:「三個臭皮匠,勝過一個諸葛亮」,恰好呼應了拔靴集成法(Bootsrap AGGregatING, BAGGING)中,會產生多個弱分類器,並將這些弱分類器組合在一起,以獲得一個強分類器,有機會做出更準確的判斷。請問以下敘述何者正確?

2. 
用主成分分析(principle component analysis)來處理多維度資料時,會利用相關矩陣(correlation matrix)來計算特徵值(eigenvalue)與特徵向量(eigenvector),如果特徵向量 λ= [4.32, 1.07, 0.49, 0.10, 0.01, 0.01],下列敘述何者正確?

3. 
效能提升法(boosting)是將弱分類器(weak classifiers)集合起來,轉換為強分類器(strong classifier)。請問下列敘述何者「不」正確?

4. 
關於決策樹(decision tree)與隨機森林(random forest)的比較,下列敘述何者正確?

5. 
關於機器學習,下列敘述何者「不」正確?

6. 
下列何者是用來衡量「類別變數次數分佈」異質性的方法?

7. 
R 語言的 rpart 套件,實現了_________算法的諸多概念?

8. 
鳶尾花 iris 資料集共有 150 個樣本,花瓣長寬、花萼長寬與花種(setosa、versicolor、virginica)等五個變數,關於下圖中樹狀模型的說明何者「不」正確?

9. 
關於離群值檢測(outlier detection)可能面臨的挑戰,下列敘述何者「不」正確?

10. 
集群(clustering)是以非監督(unsupervised)方式定義其欲解決的問題,所以只能透過一些常用的內部核驗準則來評估結果,下列何者「不是」內部核驗準則?

11. 
此例交易資料用 Apriori 演算法尋找頻繁項目集(frequent itemsets),最小支持度(minimum support)要設多少,才會有長度為 3 的頻繁項目集?

12. 
下列何者是 k 平均數集群(k-means clustering)的優點?

13. 
下列何者「不是」薈萃式學習(ensemble learning)常用的集成技術?

14. 
假設有一訓練資料集為 S = {1(-), 1(-), 2(+), 2(+), 2(+), 3(-), 3(-), 5(-), 7(-), 9(-)},其中數字代表特徵值,括號內的正負號代表類別。若使用拔靴集成法(Bootsrap AGGregatING, BAGGING)建立分類器時,使用的抽樣方法為下列何者?(假設抽樣的資料筆數亦為 10)

15. 
有一個混淆矩陣(confusion matrix),橫列表示預測類別,縱行表示真實類別,假設有一個預測類別矩陣為[0, 0, 1, 0, 1, 1, 0, 1, 1, 0, 0, 1 ,1],真實類別矩陣為[1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 0 ,1],則假陽數(false positive)的值為何?

16. 
以密度為基礎的離群值偵測方法,下圖中有哪些點最可能是離群值(Outlier)?

17. 
關於效能提升法(boosting),下列敘述何者「不」正確?

18. 
真實的反應變數值與預測的反應變數值之間的差,稱為殘差或(預測)誤差,下列何者是應用殘差平方值的算術平均來評估迴歸模型的績效?

19. 
關於軟性邊界支援向量機(soft-margin support vector machine),下列敘述何者正確?

20. 
模型選擇與評定時,經常運用重抽樣方法進行模型訓練與測試,下列敘述何者正確?


error: Content is protected !!
返回頂端