微信掃一掃關(guān)注公眾號后聯(lián)系客服
微信掃碼免費(fèi)搜題
首頁
題庫
網(wǎng)課
在線???/h3>
桌面端
登錄
搜標(biāo)題
搜題干
搜選項(xiàng)
數(shù)據(jù)挖掘工程師章節(jié)練習(xí)(2019.11.22)
問答題
已知數(shù)據(jù)元組中age的值如下(按遞增序):13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。(a)使用min-max規(guī)范化,將age值35轉(zhuǎn)換到[0.0,1.0]區(qū)間。(b)使用z-score規(guī)范化轉(zhuǎn)換age值35,其中,age的標(biāo)準(zhǔn)偏差為12.94年。(c)使用小數(shù)定標(biāo)規(guī)范化轉(zhuǎn)換age值35。
答案:
(a)已知最大值為70,最小值為13,則可將35規(guī)范化為:
(b)已知均值為30,標(biāo)準(zhǔn)差為12.94,則可將3...
點(diǎn)擊查看完整答案
手機(jī)看題
問答題
企業(yè)面對海量數(shù)據(jù),應(yīng)如何具體實(shí)施數(shù)據(jù)挖掘,使之轉(zhuǎn)換成可行的結(jié)果/模型?
答案:
首先進(jìn)行數(shù)據(jù)的預(yù)處理,主要進(jìn)行數(shù)據(jù)的清洗,數(shù)據(jù)清洗,處理空缺值,數(shù)據(jù)的集成,數(shù)據(jù)的變換和數(shù)據(jù)規(guī)約。
點(diǎn)擊查看答案
手機(jī)看題
判斷題
給定由兩次運(yùn)行K均值產(chǎn)生的兩個不同的簇集,誤差的平方和最大的那個應(yīng)該被視為較優(yōu)。
答案:
錯誤
點(diǎn)擊查看答案解析
手機(jī)看題
問答題
考慮下表所示二元分類問題的數(shù)據(jù)集。(1)計(jì)算按照屬性A和B劃分時(shí)的信息增益。決策樹歸納算法將會選擇哪個屬性?(2)計(jì)算按照屬性A和B劃分時(shí)Gini系數(shù)。決策樹歸納算法將會選擇哪個屬性?
答案:
按照屬性A和B劃分時(shí),數(shù)據(jù)集可分為如下兩種情況:
按照屬性A劃分樣本集分別得到的兩個子集(A取值T...
點(diǎn)擊查看完整答案
手機(jī)看題
單項(xiàng)選擇題
將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務(wù)?()
A.頻繁模式挖掘
B.分類和預(yù)測
C.數(shù)據(jù)預(yù)處理
D.數(shù)據(jù)流挖掘
點(diǎn)擊查看答案&解析
手機(jī)看題
單項(xiàng)選擇題
OLAP技術(shù)的核心是()
A.在線性
B.對用戶的快速響應(yīng)
C.互操作性
D.多維分析
點(diǎn)擊查看答案&解析
手機(jī)看題
問答題
一個數(shù)據(jù)庫有5個事務(wù),如表所示。設(shè)min_sup=60%,min_conf=80%。(a)分別用Apriori算法和FP-growth算法找出所有頻繁項(xiàng)集。比較兩種挖掘方法的效率。(b)比較窮舉法和Apriori算法生成的候選項(xiàng)集的數(shù)量。(c)利用(1)所找出的頻繁項(xiàng)集,生成所有的強(qiáng)關(guān)聯(lián)規(guī)則和對應(yīng)的支持度和置信度。
答案:
(a)頻繁1-項(xiàng)集:M,O,K,E,Y
頻繁2-項(xiàng)集:{M,K},{O,K},{O,E},{K,Y},{K,E...
點(diǎn)擊查看完整答案
手機(jī)看題
問答題
簡述數(shù)據(jù)倉庫的組成。
答案:
數(shù)據(jù)倉庫數(shù)據(jù)庫,數(shù)據(jù)抽取工具,元數(shù)據(jù),訪問工具,數(shù)據(jù)集市,數(shù)據(jù)倉庫管理,信息發(fā)布系統(tǒng)。
點(diǎn)擊查看答案
手機(jī)看題
判斷題
關(guān)聯(lián)規(guī)則挖掘過程是發(fā)現(xiàn)滿足最小支持度的所有項(xiàng)集代表的規(guī)則。
答案:
錯誤
點(diǎn)擊查看答案解析
手機(jī)看題