iPAS AI應用規劃師(中級) 科目2 大數據處理分析與應用 模擬試題

iPAS AI應用規劃師(中級) 科目2 大數據處理分析與應用 模擬試題 ,採智能選題,無限次反覆練習。

1. 
關於資料尺度的敘述,下列哪一項正確?

2. 
如附圖所示為一資料分佈型態,哪一項是其分位圖(Quantile-Quantile Plot)?

3. 
在一項調查中,研究者收集了某班級學生的學期總成績,並計算了樣本的平均數、標準差和變異係數。下列敘述哪一項錯誤?

4. 
下列哪一項最適合描述「信賴區間(Confidence Interval)」?

5. 
某金融科技公司正在開發一個信用評分系統,用於評估貸款申請人的信用風險。他們決定使用隨機森林模型來預測申請人是否可能違約。在模型開發過程中,資料科學團隊注意到模型的準確率很高,但在實際應用中發現一些問題。關於這種情況,下列哪一項陳述最可能是正確的?

6. 
如附圖所示為 Python 程式碼,有一變數 df 為 pandas.DataFrame 型態,依序執行附圖 1 程式碼,請問在執行後,選項中之敘述何者錯誤?

7. 
在監督式學習過程中,模型性能的評估相當重要。關於性能評估指標的敘述,下列哪一項錯誤?

8. 
關於 Hadoop 分散式檔案系統的特性,下列哪一項錯誤?

9. 
判斷資料是否接近常態可以透過常態分位數圖(Quantile-Quantile Plot , QQ Plot)來檢視,下列哪一項接近常態分佈?

10. 
下列敘述哪一項正確?

11. 
關於分群法(Clustering)的敘述,下列哪一項錯誤?

12. 
關於類別資料編碼方式的敘述,下列哪一項正確?

13. 
在處理巨量資料時,假設數據集的某些變數存在嚴重的偏態分布,且部分變數的值範圍差異極大。為了優化模型穩定性和性能,下列何種特徵轉換組合策略最適合應對這兩個問題?

14. 
分析方法通常需要資料轉換成對應的格式才有辦法進行,關於資料格式的說明下列哪一項正確?

15. 
下列哪一項「不」是分散式運算(Distributed Computing)系統提供的優勢?

16. 
巨量資料分析班共有一、二、三、四,四個年級,每個年級有 50 個學生,學生身高呈常態分佈,下列敘述哪一項錯誤?

17. 
在進行機器學習時,當資料的數值範圍差異過大會影響模型的表現。關於數值資料調整方式的敘述,下列哪一項正確?

18. 
假設教師用傳統教學法教授學生之統計平均成績為 75 分。此教師想要驗證一種新的教學方法對學生統計成績的影響,設立的虛無假設為「新的教學方法對學生統計成績沒有影響」(H₀: μ = 75),對立假設為「新的教學方法提高學生統計成績」(Ha: μ > 75)。經過實驗,從 36 名學生中獲得的成績樣本平均數為 78,樣本標準差為 10。計算得出的 t 值為 1.8,對應的 p 值約為 0.04。假設顯著水準(Significance Level)設定為 0.05,請問研究者應該如何解釋數據分析後之檢定結果?

19. 
在非監督式學習的聚類分析中,針對不同方法的適用性及其在特定情境中的優缺點,下列哪一項說法正確?

20. 
關於決策樹(Decision Tree)的敘述,下列哪一項正確?


error: Content is protected !!
返回頂端