1-4 解析機器學習核心概念 發佈留言 / 作者: S學院 / 2025-02-13 1-4 解析機器學習核心概念模擬測驗,採智能選題,無限次反覆練習。 1. 測試數據集在總資料中的比例通常為: 30% 15% 25% 50% None 2. 驗證資料集在總資料中的比例通常為: 10-15% 20-25% 30-35% 5-8% None 3. 資料清理的主要目的是: 簡化資料結構 加快處理速度 確保資料質量 減少資料量 None 4. 在進行特徵縮放時,最不適合使用Z-score標準化的情況是: 特徵呈現常態分布 特徵間尺度不一致 特徵包含大量離群值 特徵需要正規化 None 5. 針對非結構化資料進行特徵工程時,最不適合的做法是: 建立領域專屬的特徵提取器 結合多模態特徵 使用深度學習提取特徵 直接使用原始資料進行分類 None 6. 資料分布一致性主要確保: 儲存的便利性 程式的穩定性 評估的可靠性 運算的效率 None 7. 在進行模型驗證時,最不適合的交叉驗證方式是: 隨機抽樣驗證 分層交叉驗證 K折交叉驗證 留一交叉驗證 None 8. 機器學習中的資料品質問題可能來自: 模型架構設計 網路連接問題 程式碼錯誤 設備限制或人為疏忽 None 9. 在進行時間序列預測時,下列哪種特徵工程方式最不恰當? 建立時間窗口特徵 擷取週期性模式 計算移動平均 隨機打亂時間順序 None 10. 在建立推薦系統時,特徵工程最不需要考慮的因素是: 時間衰減因子 項目相似度 系統開發語言 使用者行為序列 None 11. 若某預測模型在訓練集表現極佳但在驗證集表現不佳,最可能的原因是: 資料集過小 特徵尺度不一致 特徵數量不足 模型過度擬合 None 12. 在進行增量學習時,最不適合的特徵工程策略是: 特徵快取 全量特徵重算 特徵流水線 特徵增量更新 None 13. 在監督式學習中,標籤的主要功能是: 降低運算複雜度 作為模型訓練的目標輸出 作為模型輸入 用於資料分類 None 14. 資料集代表性不足可能導致: 程式執行錯誤 運算速度變慢 儲存空間不足 模型產生偏見 None 15. 在處理高維稀疏資料時,最不適合的降維方法是: t-SNE 簡單加權平均 自編碼器 SVD分解 None 16. 下列何者不是資料代表性的考量要素: 處理速度 類別平衡 樣本多樣性 數據分布 None 17. 在處理類別型特徵時,下列編碼方式何者最不適合用於序數型類別資料: 標籤編碼 One-hot編碼 順序編碼 二進制編碼 None 18. 以下何者不是資料集分割時的注意事項: 分布一致性 重複交叉驗證 原始數據分割 固定順序分配 None 19. 資料分割時進行隨機化的主要目的是: 簡化處理流程 提高運算效率 減少資料量 確保各子集的代表性 None 20. 在處理時序預測問題時,最不適合的資料分割方式是: 擴展窗口分割 隨機分割 前後時序分割 滾動預測分割 None 如有問題可留言,謝謝您的寶貴意見! 暱稱 電郵(提交獲得正確答案,可換題測驗完整題庫,新增題庫電郵通知) Time's up