iPAS AI 應用規劃師(中級) 科目2 大數據處理分析與應用 (5)

iPAS AI應用規劃師(中級) 科目2 大數據處理分析與應用 模擬試題,採智能選題,無限次反覆練習。

1. 
以年收入(X1)和房子坪數(X2)做區別變數,辨別家庭有無投資股票。分別蒐集 30 個有投資股票與 30 個無投資股票的家庭資料。相關數據資料如附圖,請問下列何者「不」正確?

2. 
Generative model 與 Discriminative model 是兩種不同類型的模型,Generative model 可以透過統計的方法,根據所觀測的資料來建立近似原始資料分布的統計模型,因此可以用在模擬上,下列何者「不」是 Generative model?

3. 
參考附圖,關於 Python 語言使用 re 模組進行資料分析時,下列敘述何者正確?

4. 
關於主成分分析(Principal Components Analysis, PCA)於特徵提取(feature extraction)之主要用途,下列敘述何者正確?

5. 
k 折交叉驗證(k-fold cross-validation)是機器學習中常用來驗證訓練出來的模型好壞的一種方法,請問以下敘述何者正確?

6. 
關於使用支援向量機(Support Vector Machines, SVM)的核函數(kernel function)於處理分類問題時,下列敘述何者正確?

7. 
關於因素分析(factor analysis)的概念,下列敘述何者「不」正確?

8. 
關於 R 語言模型參數調校使用 caret 套件,下列敘述何者「不」正確?

9. 
請問下列選項中的圖表,何者較「符合」附圖程式碼進行核密度估計繪圖(Kernel Density Estimation, KDE)的結果?

10. 
訓練神經網路模型時,有時會遇到 Loss function 出現 NaN,下列何種做法最「不」恰當?

11. 
就非監督式學習(unsupervised learning)而言,評估集群(cluster)優劣的一種方式是計算群內樣本的相似性(similarity)。當我們持續形成更多群時,群內相似性向上攀升,將樣本切分為更細的集群,請問此操作可能會發生什麼問題?

12. 
下列何者是較穩健(Robust)的相關性衡量方法?

13. 
關於 ETL(Extract-Transform-Load)載入(Load),下列敘述何者「不」正確?

14. 
資料清理是指發現並糾正資料中的錯誤,關於資料清理的方法,下列敘述何者「不」正確?

15. 
關於 ETL(Extract-Transform-Load),下列敘述何者「不」正確?

16. 
關於分群(clustering)演算法,下列敘述何者正確?

17. 
政府資料開放平臺(data.gov.tw)的檔案格式中,CSV(Comma-Separated Values)為常見格式之一。請問下列何者「並非」CSV 的特性?

18. 
蒐集氣象觀測站的溫度、水量、風速…等 10 項氣象指標以主成分法做因素分析。10 個特徵值與解釋變量如附圖,下列敘述何者「不」正確?

19. 
附圖為 pandas 資料表(DataFrame)cell_ca t 的部份內容,請問下列選項何者為產製全部變量之次數分佈表的正確指令?

20. 
考慮企業分析不同廣告費用(youtube,facebook,newspaper)對銷售額(sales)的影響,參考附圖 R 語言使用 lm 函數分析結果,下列敘述何者「不」正確?


error: Content is protected !!
返回頂端