資料倉儲與資料探勘考試題

2023-01-13 17:45:02 字數 1530 閱讀 9081

選擇題1. 某超市研究銷售紀錄資料後發現,買啤酒的人很大概率也會購買尿布,這種屬於資料探勘的哪類問題

a. 關聯規則發現 b. 聚類

c. 分類d. 自然語言處理

2. 將原始資料進行整合、變換、維度規約、數值規約是在以下哪個步驟的任務

a. 頻繁模式挖掘 b. 分類和** c. 資料預處理 d. 資料流挖掘

3. 當不知道資料所帶標籤時,可以使用哪種技術促使帶同類標籤的資料與帶其他標籤的資料相分離

a. 分類 b. 聚類 c. 關聯分析 d. 隱馬爾可夫鏈

4. 使用互動式的和視覺化的技術,對資料進行探索屬於資料探勘的哪一類任務?( )

a. 探索性資料分析 b. 建模描述

c. **建模 d. 尋找模式和規則

5.下面哪種不屬於資料預處理的方法

a變數代換 b離散化 c 聚集 d 估計遺漏值

6. 假設12個銷售**記錄組已經排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每種方法將它們劃分成四個箱。

等頻(等深)劃分時,15在第幾個箱子內

a 第乙個 b 第二個 c 第三個 d 第四個

7.上題中,等寬劃分時(寬度為50),15又在哪個箱子裡

a 第乙個 b 第二個 c 第三個 d 第四個

8. 只有非零值才重要的二元屬性被稱作

a 計數屬性 b 離散屬性 c非對稱的二元屬性 d 對稱屬性

9. 以下哪種方法不屬於特徵選擇的標準方法

a嵌入 b 過濾 c 包裝 d 抽樣

10.下面不屬於建立新屬性的相關方法的是

a特徵提取 b特徵修改 c對映資料到新的空間 d特徵構造

填空1、調和資料是儲存在和操作型資料儲存中的資料。

2、資料倉儲就是乙個的、整合的反映歷史變化的資料集合。

3、資料倉儲系統的體系結構根據應用需求的不同,可以分為以下4種型別

4、當維表中的主鍵在事實表中沒有與外來鍵關聯時,這樣的維稱為它於事實表並無關係,但有時在查詢限制條件(如訂單號碼、出貨單編號等)中需要用到。

5、連續型屬性的資料樣本之間的距離有和

6、分類器設計階段包含三個過程和

7、分類問題中常用的評價準則有和

8、抽取、轉換、載入過程的目的是為決策支援應用提供乙個權威資料來源。因此,我們要求etl過程產生的資料(即調和資料層)是歷史的、規範的、可理解的、即時的和質量可控制的。

9、雪花型模式是對維表的進一步層次化和規範化來消除冗餘的資料。

10、支援向量機中常用的核函式有和

簡答、簡述題

1、什麼是資料倉儲?資料倉儲的特點主要有哪些?

2、什麼是聚類?它與分類有什麼異同?

3、簡述處理空缺值的方法。

4、簡述id3演算法的基本思想及其主演算法的基本步驟。

5、 何謂oltp和olap?它們的主要異同有哪些?

6、簡述你對資料倉儲未來發展趨勢的看法。

資料倉儲與資料探勘

頻繁專案集.給定全域性專案集i和資料庫d,d中所有滿足使用者指定的最小支援度 minsupport 的專案集,即大於或等於minsupport的i的非空子集,稱為頻繁專案集 frequent itemsets 或者大專案集 large itemsets 在頻繁專案集中挑選出所有不被其他元素包含的頻繁...

資料倉儲和資料探勘

編號 data warehouse data mining 一 課內學時 32 學分 2 二 適用專業 計算機軟體與理論 計算機應用等。三 預修課程 資料庫 四 教學目的 通過資料倉儲和資料探勘的有關基礎知識介紹,使學生對其含義 作用及發展有所了解,為進一步做有關的研究打下基礎。五 大綱內容 第一章...

資料倉儲與資料探勘 實驗指導書

適用於資訊系統與資訊管理專業 江蘇科技大學經濟管理學院 2012 2 目錄前言 1 實驗一 spss clementine 軟體功能演練 5 實驗二 spss clementine 資料視覺化 9 實驗三 決策樹c5.0 建模 10 實驗四 關聯規則挖掘 21 實驗五 欺詐遮蔽 異常檢測 神經網路 ...