iPAS AI 應用規劃師(中級) 科目2 大數據處理分析與應用 (5) 發佈留言 / 作者: S學院 / 2025-05-26 iPAS AI應用規劃師(中級) 科目2 大數據處理分析與應用 模擬試題,採智能選題,無限次反覆練習。 1. 關於生成對抗網路(Generative Adversarial Network, GAN)進行超解析度成像,下列敘述何者「不」正確? 模型嘗試訓練出比原圖更高解析度的圖像 透過自己相互對抗的生成與鑑別網路,大幅減少資料量的需求 屬監督式學習訓練方法 讓兩個神經網路相互博弈的方式進行學習 None 2. 請問下列選項中的圖表,何者較「符合」附圖程式碼進行核密度估計繪圖(Kernel Density Estimation, KDE)的結果? None 3. 在影像分類中,假設圖片有 0,1,2 三個類別,請問我們該如何對附圖進行單熱編碼(one-hot encoding)? A=0, B=0, C=0 A=1, B=1, C=1 A=0, B=1, C=1 A=0, B=1, C=0 None 4. 附圖為某電商平台於 2020 年 10 月至 2021 年 5 月份之新註冊用戶統計數據。請問關於選項中對此二圖表的敘述與解讀(請參考欄位定義與兩圖表),下列敘述何者「不」正確? 此平台之逐月新註冊用戶有正成長趨勢,並於 2021 年 3 月份出現月增 57%的成長 由圖表來看,此平台的逐月獲利與新註冊人數,皆呈現正成長趨勢 儘管 2021 年 5 月的首購用戶數量、相較 2020 年 10 月成長了約 400 人;但此平台用戶的首購率卻下降了接近 20%。顯示平台對於設定目標對象、促使用戶購買的規劃上可能出現了問題 由圖表來看,此平台每 100 個新註冊用戶、只有不到 12 個用戶會於註冊後 7 天仍有購買行為 None 5. 關於集群分析(cluster analysis),下列敘述何者「不」正確? 集群分析與其他分類分析,如判別分析(discriminant analysis)不同之處在於分組結果完全由資料所導出,各群的特性事前未知 集群分析主要有兩種形式,分別為 k-means 分群(k-means clustering)和分層分群(hierarchical clustering),這兩種方式皆需在一開始就決定好分群數 集群分析是依據個體間的相似性,將資料分群,使群內差異小,群間差異大 集群分析的變數只能使用連續(continuous)變數,不能使用類別(categorical)變數 None 6. 以年收入(X1)和房子坪數(X2)做區別變數,辨別家庭有無投資股票。分別蒐集 30 個有投資股票與 30 個無投資股票的家庭資料。相關數據資料如附圖,請問下列何者「不」正確? None 7. 參考附圖,請問程式碼___之處,應填入選項中哪一個 pandas 函數,才能得到如附圖下表之結果? translate apply groupby map None 8. 關於主成分分析(Principal Components Analysis, PCA)於特徵提取(feature extraction)之主要用途,下列敘述何者正確? 將低度相關的預測變數矩陣 X,轉換成相關且量多的潛在變項集合 提取重要特徵後不能以圖像視覺化呈現多變量資料 將最相關的訊息與無關的雜訊結合 將問題領域中的數個變數,組合成單一或數個具訊息力的特徵變數 None 9. 關於使用支援向量機(Support Vector Machines, SVM)的核函數(kernel function)於處理分類問題時,下列敘述何者正確? None 10. 關於分類問題,不同類樣本數相差太大時,下列何種做法最「不」適合? 從數量較多的樣本抽樣,使樣本數與樣本數較少的一方相符 給予各樣本與數量呈反比的權重 依比例重複對數量少的樣本抽樣,生成數量相當的樣本 直接進行分類,可以最大限度利用資料 None 11. 參考附圖,R 語言中,已知 mystr 為串列(list),希望取出圖中串列結果,下列選項之 lapply 函數敘述何者正確? mystr, "]", 3 mystr, "[", 3 mystr, ")", 3 mystr, "(", 3 None 12. 參考附圖,關於 Python 語言使用 re 模組進行資料分析時,下列敘述何者正確? myresult.group(1)結果為'1234' myresult.group(-1)結果為'1234-5678' myresult.group(2)結果為'5678' myresult.group(0)結果為'02-1234-5678' None 13. 資料清理是指發現並糾正資料中的錯誤,關於資料清理的方法,下列敘述何者「不」正確? 迴歸係數的處理 異常值的處理 遺缺值(missing value)的處理 驗證資料的正確性 None 14. 關於線性相依(linearly dependent)、線性獨立(linearly independent)、正交(orthogonality)與相關(correlation),下列敘述何者正確? 如果 X 與 Y 線性相依,則兩者相關 如果 X 與 Y 無關/正交,則兩者線性獨立 如果 X 與 Y 線性相依,則兩者非正交 如果 X 與 Y 線性獨立,則兩者無關/正交 None 15. 考慮購物網站的銷售資料集時,若使用集群法(clustering)進行銷售分析,下列敘述何者正確? 在 k-medoid 集群法(k-medoid clustering)中,側影係數(Silhouette Coefficient)為正數且數值較大時,表示該資料分派到較合適的集群 k-medoid 集群法(k-medoid clustering)與 k-means 集群法(k-means clustering)比較時,前者較容易受到異常值或極端值的影響 k-means 集群法(k-means clustering)的結果是同一集群內的樣本點具有高度的差異性 凝聚階層法(agglomerative hierarchical)是一種切割式集群法(partitional clustering) None 16. 實務上常見各類樣本分佈差距大的不平衡學習(Imbalanced Learning)情境,關於不平衡學習的處理方式,下列敘述何者「不」正確? 運用正負樣本的懲罰權重來解決,若分析建模的算法支援樣本權重設定,此方法是簡單有效的解決途徑 運用過度抽樣(Oversampling)解決之,此種方法可避免模型過度配適(Overfitting) 以薈萃式學習(Ensemble Learning)集成模型解決,形成模型預測能力良好的森林(Forest) 進行特徵選取(Feature Selection)來解決類別不平衡問題,透過變數的選取來提高模型績效 None 17. 請問執行附圖程式碼後,下列哪一個選項內的使用者 ID「不」在 df_final 的使用者 ID 欄位當中? A C G E None 18. Generative model 與 Discriminative model 是兩種不同類型的模型,Generative model 可以透過統計的方法,根據所觀測的資料來建立近似原始資料分布的統計模型,因此可以用在模擬上,下列何者「不」是 Generative model? GMM(Gaussian Mixture Model) Logistic regression Naïve Bayes HMM(Hidden Markov Model) None 19. 關於 ETL(Extract-Transform-Load),下列敘述何者「不」正確? Extract:從資料來源處擷取所需之數據資料 建置或更新資料倉儲(Data Warehouse)中的內容時所需的過程 Transform:針對結構資料轉換,非結構資料則無法處理 Load:最後將已作適當轉換過的數據資料載入到目的地 None 20. 使用 k-means 分群法(k-means clustering algorithm)與歐氏距離(Euclidean distance),將附圖資料分成三群,何者會自成一群? p7 p5 p9 p2 None 如有問題可留言,謝謝您的寶貴意見! 暱稱 電郵(提交獲得正確答案,可換題測驗完整題庫,新增題庫電郵通知) Time's up