iPAS AI應用規劃師(中級) 科目1 人工智慧技術應用規劃 L213 AI技術應用與系統部署L21301 數據準備與模型選擇 (進階題型)作者: S學院 / 2025-11-22 iPAS AI應用規劃師(中級) 科目1人工智慧技術應用規劃 L213 AI技術應用與系統部署 L21301 數據準備與模型選擇 (進階題型) 模擬試題,採智能選題,無限次反覆練習。 1. Dropout技術在神經網路中防止過擬合的原理是? 減少訓練時間 增加層數 隨機失活神經元,迫使網路學習魯棒特徵 降低學習率 None 2. 知識蒸餾(Knowledge Distillation)的核心思想是? 減少訓練資料 增加模型大小 合併多個模型 用大模型的軟標籤訓練小模型,轉移知識 None 3. 在處理缺失值時,使用預測模型填補(Predictive Imputation)相比簡單統計方法的優勢和要求是? 能利用特徵間關係提高準確性,但需要足夠的完整資料 不會引入偏差 速度更快,不需要其他特徵 更簡單,適合所有情境 None 4. t-SNE相比PCA在視覺化上的優勢是? 可以用於新資料投影 能保留非線性的局部結構,更適合視覺化分群 結果更穩定 計算速度更快 None 5. TF-IDF中的IDF(Inverse Document Frequency)的作用是? 增加所有詞的權重 計算詞的出現次數 降低常見詞的權重,提高罕見詞的重要性 標準化文本長度 None 6. 在多模態學習中,CLIP模型如何對齊圖像和文字? 透過對比學習在共同嵌入空間對齊 分別訓練 只處理文字 只處理圖像 None 7. 商業資料庫(如Refinitiv)與自行爬取的公開資料相比,主要優勢在於? 資料量更大 取得成本更低 資料準確性、完整性、法規合規性更高 更新速度更快 None 8. Reward Shaping在強化學習中的作用和風險是? 只有好處沒有壞處 能加速學習但可能引入意外的次優策略 完全不影響學習 沒有風險 None 9. 對於決策樹模型,是否需要對數值特徵進行標準化或正規化? 必須進行正規化 不需要,決策樹對特徵尺度不敏感 必須進行標準化 取決於資料量大小 None 10. 當使用Forward Fill方法填補時間序列缺失值時,最不適合的情境是? 感測器短暫斷線 長時間缺失且變數變化劇烈 狀態變數保持不變 週期性資料中的小段缺失 None 11. ResNet(殘差網路)引入跳躍連接(Skip Connection)解決了什麼問題? 參數過多 訓練時間長 記憶體不足 深層網路的梯度消失和退化問題 None 12. 在時間序列預測中,為什麼不能使用隨機K-Fold交叉驗證? 資料量不夠 會造成資料洩漏,用未來資料訓練預測過去 計算太複雜 速度太慢 None 13. L1正則化(Lasso)能實現特徵選擇的原理是? 平均分配權重 將不重要特徵的權重壓縮至零 增加模型複雜度 增加所有權重 None 14. 在金融交易資料中,使用IQR方法偵測異常值可能產生的問題是? 計算速度太慢 無法處理缺失值 無法處理類別資料 將極端但合理的高頻交易標記為異常 None 15. Precision和Recall存在權衡時,F1-score的作用是? 總是選擇Recall 總是選擇Precision 忽略兩者差異 提供兩者的調和平均數作為綜合指標 None 16. 在處理非平衡資料集時,SMOTE(合成少數類過採樣)技術的原理是? 複製少數類樣本 隨機生成新樣本 在少數類樣本之間的特徵空間插值生成新樣本 刪除多數類樣本 None 17. 在時間序列預測中,創建滯後特徵(Lag Features)時,滯後期數的選擇應該基於? 隨機選擇 業務週期性和自相關函數分析 資料量大小 模型類型 None 18. 對於循環性時間特徵(如小時、星期),最佳的編碼方式是? 使用sin和cos轉換保留循環性 不進行編碼 直接使用數值0-23或0-6 使用One-hot編碼 None 19. Model-based RL相比Model-free RL的優勢和挑戰是? 總是更好 更簡單 不需要探索 樣本效率高但需要準確的環境模型 None 20. GPT和BERT的主要架構差異是? 完全相同 GPT是單向Transformer解碼器,BERT是雙向Transformer編碼器 GPT是RNN,BERT是CNN GPT更簡單 None 如有問題可留言,謝謝您的寶貴意見! 暱稱 電郵(提交獲得正確答案,可換題測驗完整題庫,新增題庫電郵通知) Time's up