iPAS AI 應用規劃師(中級) 科目2 大數據處理分析與應用 (5) / iPAS AI 應用規劃師, AI 測驗題庫, iPAS AI 中級, 測驗題庫 / 作者: S學院 iPAS AI應用規劃師(中級) 科目2 大數據處理分析與應用 模擬試題,採智能選題,無限次反覆練習。 1. 在影像分類中,假設圖片有 0,1,2 三個類別,請問我們該如何對附圖進行單熱編碼(one-hot encoding)? A=0, B=1, C=1 A=1, B=1, C=1 A=0, B=1, C=0 A=0, B=0, C=0 None 2. 關於梯度消失(Gradient Vanishing),下列敘述何者「不」正確? 可用 ReLU function 作為 activation function 防止 gradient vanishing 當神經網路作反向傳播(Back-Propagation, BP),梯度由後往前傳,梯度不斷減小,最後變為零 gradient vanishing 會造成靠近輸出層的隱藏層(Hidden Layer)權重得不到更新 可用 sigmoid function 作為 activation function 解決 gradient vanishing None 3. 關於集群分析(cluster analysis),下列敘述何者「不」正確? 集群分析主要有兩種形式,分別為 k-means 分群(k-means clustering)和分層分群(hierarchical clustering),這兩種方式皆需在一開始就決定好分群數 集群分析是依據個體間的相似性,將資料分群,使群內差異小,群間差異大 集群分析的變數只能使用連續(continuous)變數,不能使用類別(categorical)變數 集群分析與其他分類分析,如判別分析(discriminant analysis)不同之處在於分組結果完全由資料所導出,各群的特性事前未知 None 4. 參考附圖,請問程式碼___之處,應填入選項中哪一個 pandas 函數,才能得到如附圖下表之結果? translate groupby map apply None 5. 考慮使用 iris 資料集,輸入變數為 Sepal.Length(花萼長度)、Sepal.Width(花萼寬度)、Petal.Length(花瓣長度)與 Petal.Width(花瓣寬度),輸出變數為 Species(物種)。使用 keras 等模組進行多層感知器(Multilayer Perceptron)分析,參考附圖 Python 語言結果,下列敘述何者「不」正確? 第 1 個隱藏層的權重參數有 42 個 輸入層有 4 個特徵 輸出層的啟動函數(activation function)為 softmax 函數 第 2 個隱藏層的神經元個數為 6 個 None 6. 使用 k-means 分群法(k-means clustering algorithm)與歐氏距離(Euclidean distance),將附圖資料分成三群,何者會自成一群? p9 p2 p7 p5 None 7. 關於 k 近鄰(k-nearest neighbors)分類法,下列敘述何者「不」正確? 不須對資料有任何分布上的假設 須留意預測變數的尺度 能容忍遺缺值 需選擇適合的 k None 8. 關於深度學習的說明,下列敘述何者「不」正確? 不斷地調整某個網路中的每個參數,直到找到一個參數組合使之有效運作 具忍受有雜訊的數據,可分析影像、影片等多維度且複雜的數據 利用多層神經網路來分析數據,重點是事先給定特徵值 神經元個數相同的卷積神經網路表現會比一般深度神經網路來得出色,大幅降低了需要訓練的參數量 None 9. 關於長條圖(Bar Char)與直方圖(Histogram),下列敘述何者「不」正確? 直方圖的橫軸變數為數值型連續變數(Continuous Variable) 直方圖的組距是有順序的,所以不可相互置換,而長條圖則無順序,可以置換 長條圖的橫軸變數為類別型離散變數(Discrete Variable) 從長條圖可以看出中位數、眾數的大約位置 None 10. 實務上常見各類樣本分佈差距大的不平衡學習(Imbalanced Learning)情境,關於不平衡學習的處理方式,下列敘述何者「不」正確? 進行特徵選取(Feature Selection)來解決類別不平衡問題,透過變數的選取來提高模型績效 以薈萃式學習(Ensemble Learning)集成模型解決,形成模型預測能力良好的森林(Forest) 運用正負樣本的懲罰權重來解決,若分析建模的算法支援樣本權重設定,此方法是簡單有效的解決途徑 運用過度抽樣(Oversampling)解決之,此種方法可避免模型過度配適(Overfitting) None 11. 關於盒鬚圖(Box Plot),下列敘述何者「不」正確? 盒鬚圖盒子的位置居左表示資料為左偏 盒鬚圖可用來了解資料的偏態(Skewness) 顯示一組數據分布情況資料的統計圖 它能顯示出一組數據的最大值、最小值及四分位數 None 12. 參考附圖,關於 R 語言使用 jsonlite 套件匯入 JSON 資料,下列敘述何者正確? 匯入後 df 資料物件為資料框(data.frame) df 資料物件的元素長度為 9 df$cwbopendata$location 資料物件為矩陣(matrix) nrow(df$cwbopendata$location)結果為 438 None 13. 考慮企業分析不同廣告費用(youtube,facebook,newspaper)對銷售額(sales)的影響,參考附圖 R 語言使用 lm 函數分析結果,下列敘述何者「不」正確? 資料沒有遺漏值 newspaper 變數對整體線性模型最具有影響 全部資料其有 200 筆 調整後判定係數為 0.8961 None 14. 附圖為某電商平台於 2020 年 10 月至 2021 年 5 月份之新註冊用戶統計數據。請問關於選項中對此二圖表的敘述與解讀(請參考欄位定義與兩圖表),下列敘述何者「不」正確? 由圖表來看,此平台的逐月獲利與新註冊人數,皆呈現正成長趨勢 由圖表來看,此平台每 100 個新註冊用戶、只有不到 12 個用戶會於註冊後 7 天仍有購買行為 儘管 2021 年 5 月的首購用戶數量、相較 2020 年 10 月成長了約 400 人;但此平台用戶的首購率卻下降了接近 20%。顯示平台對於設定目標對象、促使用戶購買的規劃上可能出現了問題 此平台之逐月新註冊用戶有正成長趨勢,並於 2021 年 3 月份出現月增 57%的成長 None 15. 關於迴歸分析(regression analysis),下列敘述何者「不」正確? 在預測的研究中需將變數區分為反應變數和解釋變數 參數皆為一次的模型稱為線性模型,一般以 Y = β0+β1X1+β2X2+...+β(p-1)X(p-1)+ε的形式表達 迴歸分析是利用兩個或多個數量變數間的關係,使反應變數的值可以用一個或多個解釋變數的值加以預測的方法 殘差分析(residual analysis)無法用來評估迴歸模型的預測品質 None 16. 參考附圖,關於 R 語言使用 dplyr 套件進行資料分析,下列敘述何者正確? summarise 函數會依照 Speciess 群組資料,計算各群組的 Petal.Width 平均值 group_by 函數會依照 Species 進行遞增排序 summarise 函數與 summary 函數功能相同,皆會顯示資料摘要 group_by 函數會依照 Species 進行遞減排序 None 17. 就非監督式學習(unsupervised learning)而言,評估集群(cluster)優劣的一種方式是計算群內樣本的相似性(similarity)。當我們持續形成更多群時,群內相似性向上攀升,將樣本切分為更細的集群,請問此操作可能會發生什麼問題? 配適狀況不明(unknown) 配適不足(underfitting) 配適良好(well-fitted) 過度配適(overfitting) None 18. 關於使用支援向量機(Support Vector Machines, SVM)的核函數(kernel function)於處理分類問題時,下列敘述何者正確? None 19. 附圖為鳶尾花資料集(iris dataset)所繪製而成的分布圖。關於該數據與圖表,下列敘述何者「不」正確?(x 軸為三種鳶尾花品種;y 軸為花瓣長度、單位:公分) virginica 物種最大的花瓣長度,可以達到接近 7 公分 versicolor 物種的花瓣長度,平均較 setosa 物種來的更長 versicolor 物種最大的花瓣長度,不可能長到 virginica 物種最小的花瓣長度 setosa 物種的花瓣長度,大部分在 1-2 公分之間 None 20. Generative model 與 Discriminative model 是兩種不同類型的模型,Generative model 可以透過統計的方法,根據所觀測的資料來建立近似原始資料分布的統計模型,因此可以用在模擬上,下列何者「不」是 Generative model? Naïve Bayes Logistic regression GMM(Gaussian Mixture Model) HMM(Hidden Markov Model) None 如有問題可留言,謝謝您的寶貴意見! 暱稱 電郵(提交獲得正確答案,可換題測驗完整題庫,新增題庫電郵通知) Time's up