計算機在地質學中的應用複習

一、名詞解釋：

1、定性地學資料：定性說明地學現象的某種屬性或者形態而沒有數量概念的資料。

2、名義型資料：又稱類別資料，特點是沒有量的概念，也不具有相對重要性，只有標識作用。其運算方式只能進行統計，不能進行常規的加減比較大小等運算。

3、有序型資料特點是只具有順序或者等級的概念，不同序級之間沒有比例關係，在絕對數量方面也不相等。其運算方式只能對其排序。

4、邏輯型資料特點是只能說明某種地學現象存在與否，不涉及大小和數量。

5、定量地學資料又稱數值型資料，這類資料不僅說明地學現象的屬性和狀態，而且有數量的概念。不僅能比較大小，還能表示差異。

6、空間自相關空間上相鄰樣品在數值上具有相關關係。

7、區域化變數是介於隨機變數和確定性變數之間的變數，它描述的是地理分布現象，這類現象具有空間連續性，又具有空間不確定性。

8、變差函式又叫變程方差函式，或變異函式，是地質統計學所特有的基本工具。它既能描述區域化變數的空間結構性變化，又能描述其隨機性變化。

9、變程指區域化變數在空間上具有相關性的範圍。在變程範圍之內，資料具有相關性；而在變程之外，資料之間互不相關，即在變程以外的觀測值不對估計結果產生影響。

10、塊金值變差函式與y軸的交點，在地質統計學中稱為「塊金方差」，表現為在很短的距離內的空間變異性，即無論h多小，兩個隨機變數的差異程度。它可以由測量誤差引起，也可以來自礦化現象的微觀變異性。在數學上，塊金值c0相當於變數純隨機性的部分。

11、基台值代表變數在空間上的總變異性大小。即為變差函式在h大於變程時的值，為塊金值c0和拱高cc之和。

12、隨機取樣即按隨機性原則，從總體單位中抽取部分單位作為樣本進行調查，以其結果推斷總體有關指標的一種抽樣方法。

13、分層取樣將總體中各個個體按某種特徵分成若干個互相重疊的幾部分，每一部分叫做層，在各層中按層在總體中所佔比例進行簡單隨機抽樣，這種抽樣方法叫做分層抽樣。

14、系統取樣從總體中選取每第k個樣品的方法。

15、叢狀取樣隨機抽取總體內的個體集合組成小樣本，所有這些小樣本合併成乙個樣本。

16、方便取樣在方便的時間和地點取樣，又稱偶遇取樣。代價低，簡單易行。

17、判別取樣研究者根據自己的知識和經驗，主觀決定取樣總體的某個部位（時間和空間）。

18、配額取樣：與分層取樣類似，也是對總體首先進行分層，並決定各層所佔比例，然後與分層取樣不同的是在每層中配額取樣採用的是非概率取樣方法。？

19、滾雪球取樣先選取合適的調查物件初步取樣分析，根據調查分析結果進一步選取更多的樣本，像滾雪球一樣不斷擴大研究區域。

20、相關分析：相關分析通過圖形和數值兩種方式，有效地揭示事物之間相關關係的強弱程度和形式。

21、因子分析是一種降維、簡化資料的技術。它通過研究眾多變數之間的內部依賴關係，探求觀測資料中的基本結構，並用少數幾個「抽象」的變數來表示其基本的資料結構。

2、問答題

1、地學資料獲取的不確定性有哪些？

資料固有的不確定性

資料獲取過程中引起的不確定性

資料處理過程中引起的不確定性

資料轉換過程中引起的不確定性

資料傳輸過程中引起的不確定性

資料提取和分類過程中引起的不確定性

資料應用不當引起的不確定性

2、對一元地學變數的描述方法有哪些？

（1）一元地學資料的圖形展示

連續型資料的圖形描述

頻率分布表、頻率分布直方圖、理論頻率分布

名義型資料的圖形描述

柱狀圖和餅圖等

（2）一元地學資料的中心位置度量

平均值、中位數、眾數

（3）一元地學資料的離散度度量

極差、方差和標準差、四分位數間距

3、連續型資料中心位置的度量常用的統計量是什麼？

（1）平均值（算數平均值、幾何平均值、加權平均值）

（2）中位數：一組資料按從小到大（或從大到小）的順序依次排列，處在中間位置的乙個數（或最中間兩個資料的平均數）。中位數也可表述為第50百分位數，二者等價。

（3）眾數：是一組資料中出現次數最多的數值，叫眾數，有時眾數在一組數中有好幾個。

4、對一元地學資料的離散度度量常用的統計量是什麼？

（1）極差：一組資料中的最大資料與最小資料的差。

（2）方差和標準差：方差是實際值與期望值之差平方的期望值。

標準差是方差平方根。

（3）四分位數間距：第三四分位數與第一四分位數的差距又稱四分位數間距（interquartile range, iqr）。 iqr=q3—q1

5、什麼是標準變換，標準變換後的資料集有什麼優點？

變換後的資料集，平均值為0，標準差為1。

6、箱線圖的功能是什麼？

a. 利用箱線圖便於對多個樣本資料的形狀進行比較

b. 直觀明了地識別資料批中的異常值

c. 利用箱線圖判斷資料集的偏態和尾重

7、高維點資料的視覺化方法有哪些？

可變散點圖(scatterplot with varying dots)

散點圖矩陣(scatterplot matrix)

多變數輪廓（ multivariate profiles ）

星形圖（ star picture ）

安德斯繪圖（ andrews』 fourier transformations ）

安德森繪圖（ metroglyphs ）

臉譜法（ chernoff』s faces ）

8、高維點資料的視覺化方法中的散點圖矩陣的特徵是什麼？

histograms on diagonal（散點圖矩陣的對角線為柱狀圖）

scatterplot on lower portion（散點圖矩陣的下部分為散點圖）

correlations on upper portion（散點圖矩陣的上部分為相關係數）

9、三維域上的標量場視覺化方法有哪些？

三維域上的標量場的視覺化一般稱為體視覺化，方法：

（1）等值面

（2）編織圖

（3）體繪製

10、變數之間的關係可歸納為哪兩種大類，分別是什麼？

函式關係：指變數之間的一種一一對應的關係。

相關關係（統計關係）：指變數之間客觀存在的不嚴格確定的依存關係（因果關係）。相關關係又分為線性相關和非線性相關。

11、相關關係和函式關係的區別和聯絡是什麼？

a) 區別

1 函式關係變數之間存在嚴格的依存關係，其關係是不對等的（因果關係）。相關關係則不確定，可以在一定範圍內變動，變數之間的關係完全對等。

2 函式關係可以用方程表示出來，而相關關係則不能。

b) 聯絡

1 函式關係是相關關係的特例，函式關係是完全的相關關係。

2 由於測量誤差的存在，函式關係往往通過相關關係表現出來。

3 相關關係常常借助於函式關係的形式進行描述。

12、相關關係的分類有哪些方法？

a) 根據相關因素的多少分為：單相關（兩個變數之間的關係）、復相關（多個變數之間的關係）和偏相關（在乙個變數與多個變數相關時，假定其他變數不變，其中兩個變數之間的相關關係）。

b) 根據相關的表現形式分為線性相關和非線性相關。

c) 根據變數變化的方向分為：正相關和負相關。

d) 根據相關的程度分為：完全相關、不完全相關和不相關。

13、變數間的非線性相關關係分為哪兩類，曲線估計是用來解釋哪一類問題的？

14、q型聚類分析常用距離來測量樣品之間的相似程度，常用的距離有哪些？

a) 明考夫斯基距離（絕對距離、歐氏距離、切比雪夫距離）

b) 蘭氏距離

c) 馬氏距離

15、應用歐氏距離進行聚類分析的缺陷是什麼？

1）它沒有考慮到子體的變異對「距離」遠近的影響，乙個變異程度大的子體可能與更多樣品近些，既使它們的歐氏距離不一定最近；

2）另外，歐氏距離受變數的量綱影響，這對多元資料的處理是不利的。

3）如果變數之間存在相關性，則會對處理結果帶來影響。

16、r型聚類分析中變數相似性的度量有哪幾種方法？

從變數的方向趨同性或「相關性」考察變數間的相似性，從而得到「夾角余弦法」和「相關係數」兩種度量方法。

1、夾角余弦

兩變數xi與xj看作p維空間的兩個向量，這兩個向量間的夾角余弦可用下式進行計算

顯然，∣cos ij∣<= 1。

2．相關係數

相關係數：度量變數間的相似性。變數xi與xj的相關係數定義為

顯然也有，∣rij∣<=1。

17、根據類間距離的不同，系統聚類法可分為哪幾種？

常用的類間距離定義有8種之多，與之相應的系統聚類法也有8種：最短距離法、最長距離法、中間距離法、重心法、類平均法、可變類平均法、可變法和離差平方和法。

18、因子分析的步驟是什麼？

1 ）對原始資料進行標準化處理，建立變數的相關矩陣。

2 ）利用雅克比行列式方法求解相關矩陣的特徵值和特徵向量

3 ）因子提取，即選取一定的特徵值，計算因子載荷以及公共因子方差

4 ）因子旋轉，為便於對主因子進行解釋，一般需要對因子載荷矩陣進行旋轉，達到結構簡化的目的

5 ）計算因子得分

19、因子分析中為什麼要對分析結果進行因子旋轉？

因子分析的目標之一就是要對所提取的抽象因子的實際含義進行合理解釋。有時直接根據特徵根、特徵向量求得的因子載荷陣難以看出公共因子的含義。例如，可能有些變數在多個公共因子上都有較大的載荷，有些公共因子對許多變數的載荷也不小，說明它對多個變數都有較明顯的影響作用。

這種因子模型反而是不利於突出主要矛盾和矛盾的主要方面的，也很難對因子的實際背景進行合理的解釋。

這時需要通過因子旋轉的方法，使每個變數僅在乙個公共因子上有較大的載荷，而在其餘的公共因子上的載荷比較小，至多達到中等大小。這時對於每個公共因子而言（即載荷矩陣的每一列），它在部分變數上的載荷較大，在其它變數上的載荷較小，使同一列上的載荷盡可能地向靠近1和靠近0兩極分離。這時就突出了每個公共因子和其載荷較大的那些變數的聯絡，矛盾的主要方面顯現出來了，該公共因子的含義也就能通過這些載荷較大變數做出合理的說明，這樣也顯示了該公共因子的主要性質。

20、使用經典統計學研究地學變數的侷限性是什麼？

a) 經典統計方法在研究地學變數時，不考慮樣品的空間分布，由於樣品的空間分布不同，儘管其均值、方差都一樣，但地學意義則不同。

b) 經典統計學的研究物件是純隨機變數，並遵循一定的概率分布，而地學變數既有隨機性也有結構性。

計算機在地質學中的應用複習

分形理論在地質學中的應用

計算機在金融中的應用期末複習

計算機地質學上機實習報告

計算機在地質學中的應用複習

分形理論在地質學中的應用

計算機在金融中的應用期末複習

計算機地質學上機實習報告

相關推薦