地統計分析實習報告

2021-09-28 02:20:53 字數 4540 閱讀 6881

一、 實習內容簡介

本次實習的主要內容是利用地統計分析模組,根據乙個點要素層中已測定取樣點、柵格層或者利用多邊形質心,輕而易舉地生成乙個連續表面。這些取樣點的值可以是海拔高度、地下水位的深度或者汙染值的濃度等。當與arcmap一起使用時,地統計分析模組提供了一整套建立表面的工具,這些表面能夠用來視覺化、分析及理解各種空間現象。

在本實習中,利用現有的測量站獲得的臭氧濃度值,根據檢測所有取樣點之間的關係, 生成乙個關於臭氧濃度值、**標準差(不確定性)以及超出臨界值的概率的連續表面,從而對其它點的濃度值進行最佳**。 在實習中主要練習通過對演算法引數的調整,生成最佳的**圖,並將**結果製成專題地圖,並初步理解空間統計分析的相關概念和演算法。

本次實習主要有6個練習:

練習1:使用預設引數建立乙個表面;

練習2:資料檢查;

練習3:製作臭氧濃度圖;

練習4:模型比較;

練習5:製作超出某一臨界值的臭氧概率圖;

練習6:生成最終成果圖。

二、實習成果及分析

練習1:使用預設引數建立乙個表面

本次練習中,主要是利用arcmap中的地統計模組,通過建立臭氧濃度表面的過程,我發現使用預設引數建立表面是一件很容易的事情。

我在arcmap中新增了ca_ozone_pts和ca_outline資料集,並將ca_outline圖層中的顏色改為無色,並將地圖儲存。

在本練習中,使用克里金演算法,使用arcgis 預設的克里金演算法引數建立臭氧濃度**圖。使用克里金演算法根據預設引數建立臭氧濃度**圖,從圖中可以看出生成的**圖能夠表達臭氧濃度分布,顏色越深的地方臭氧濃度越高,可以看出臭氧濃度高的地方非常集中,這應該是和城市的工業發展布局由緊密關係。同時可以看大**圖並沒有很好的覆蓋整個區域,因為**圖的範圍是根據取樣點的範圍而定的,如果要契合地圖邊界,需要進行外延估計的計算。

結果截圖如下:

練習2:資料檢查

資料檢查的目的是為了找出資料中那些離群值並且發現資料中存在的趨勢。

當資料服從正態分佈時,用插值方法生成表面的效果最佳。如果資料是偏態分布的,即向一邊傾斜,則可以選擇資料變換使之服從正態分佈。因此在建立表面之前了解資料的分布非常重要。

histogram工具描繪了資料屬性的頻率直方圖,能夠針對資料集的每一種屬性檢測其單變數分布。接下來,就是要檢查圖層ca_ozone_pts的臭氧分布情況。

臭氧屬性的分布情況是用乙個直方圖來描述的,該直方圖將濃度值分為10級,每一級別中的數量的相對比例(密度)通過每乙個直方條柱子的高度來表示。通常,描述資料分布的重要特徵包括中值、展布以及對稱性。對於正態分佈,有乙個快速檢驗的方法:

如果平均值與中值大致相等,就可以把它當作資料服從正態分佈的證據之一。該直方圖截圖如下:

上面顯示的直方圖表面資料是單峰分布的,而且具有較好的對稱性,接近於正態分佈。直方圖的右側尾部表明,存在相對少量的具有較高臭氧濃度值的取樣點。單擊直方圖臭氧值在0.

162至0.175ppm之間的直方條,此範圍的取樣點在地圖中被高亮顯示。

正態qq圖提供了另外一種度量資料正態分佈的方法,利用qq圖你可以將現有資料的分布與標準正態分佈對比,如果資料點接近一條直線,則它們接近於服從正態分佈。截圖效果如下:

在乙個普通的qq圖上,兩種分布的對應點一一對應。對於兩種相同型別的分布,qq圖應該是一條直線。因此通過繪製相對應的臭氧資料的分布點與標準正態分佈的分布點,能夠檢查臭氧資料的正態分佈情況。

從上述正態qq圖可以看出,該圖形非常接近於一條直線。而偏離直線的情況主要發生在臭氧濃度值較高時(因為這些偏離值在直方圖中是高亮顯示的,所以在這裡它們也是被高亮顯示的,如上圖所示。)

如果在直方圖中或在正態qq圖中,資料都沒有顯示出正態分佈,那麼就有必要在應用某種克里格插值之前對資料進行轉換,使之服從正態分佈。

對於趨勢分析,只有資料中存在某種趨勢時,才可能利用某些數學公式對表面的非隨機(確定性的)成分進行表達。

例如,—個緩傾斜的山坡可以用乙個平面來表達,而山谷則可以利用乙個能夠生成「u」字形的更加複雜的公式(乙個二次多項式)來表示。數學公式有時或許能夠生成想要的表面,但大多數時候,數學公式因為太過於平滑而不能精確地描述表面,因為沒有哪個山坡是完完全全的平面,同樣,也沒有哪個山谷會是乙個完美的「u」 形。如果趨勢面不能精確地描繪實際需要的表面,可能想到將其移去,通過建立趨勢剔除後的殘差的模型來繼續分析。

在建立殘差模型時,需要分析表面中的短程變異。這是理想平面或理想「u」型麵所無法實現的內容。

trend analysis(趨勢分析)工具能夠找出在輸入資料集中是否存在趨勢。利用trend analysis工具得到的趨勢分析圖截圖如下:

趨勢分析圖中的每一根豎棒代表了乙個資料點的值(高度)和位置。這些點被投影到乙個東西向的和乙個南北向的正交平面上。通過投影點可以作出一條最佳擬合線(乙個多項式),並用它來模擬特定方向上存在的趨勢。

如果該線是平直的,則表明沒有趨勢存在。不過,如果注意看上圖中的亮綠線,會發現這條線從較低的值開始,向東移動時逐漸增加直到變平穩。這表明該資料在東西向上顯示出乙個很強的趨勢,而在南北向的趨勢則較弱。

通過旋轉,東西向趨勢的形狀可以看得更清楚。能看到投影後確實顯示了乙個倒置的「u」型。既然該趨勢呈「u」形,所以可以選擇乙個二階多項式對其全域性趨勢進行較好的模擬。

儘管我把這個趨勢顯示在了東西向的投影平面上,但因為我把資料點旋轉了30度,所以實際的趨勢是北東-南西向。造成該趨勢的乙個可能的事實是,在沿海地區汙染較輕,而在向內陸推進時,人口增多,汙染增大。到了山區則人口又減少,汙染也隨之降低。

半變異函式/協方差函式雲圖能夠檢測已測樣點間的空間自相關。空間自相關理論認為彼此之間距離越近的事物越相象。半變異函式/協方差函式雲圖能夠對這種關係進行檢測。

為此,可以用y軸表示半變異函式值,即每一樣點對間測量值之差的平方,而相應地用x軸表示每對樣點之間的距離。半變異函式/協方差函式雲圖截圖如下:

在半變異函式/協方差函式雲圖中,每個紅點表示一對取樣點。既然越近的點越相似,那麼在半變異函式雲圖中鄰近的點(在x軸的左邊)應該有較小的半變異函式值(在y軸的下部)。隨著樣點對間距離的增加(在x軸上向右移動),半變異函式值也要相應增加(在y軸上向上移動)。

然而,當到達一定的距離後,雲圖變平,這表明超出這個距離時,樣點對之間不再具有相關關係了。

觀察半變異函式圖,如果某些靠得很近的資料點(在x軸上接近於零)具有乙個異常的較高的半變異函式值(在y軸的上部)時,就應該仔細檢杳這些樣點對,看看是不是這些資料不準確。

在半變異函式圖中選中的取樣點將高亮顯示在地圖中,樣點間通過直線相連,用以表示是一對取樣點。有多種原因可以解釋為什麼洛杉磯地區的取樣點資料值和其他地區相比差別很大。一種可能是洛杉磯地區的汽車比其它地區要多,這些汽車無疑將會造成更多的汙染,從而在洛杉磯地區形成—個較高的臭氧累積。

除了前面討論的全域性趨勢外,影響資料的還有方向效應。

這些方向效應的原因可能並不明了,但它們可以在統計上給予量化。這些方向效應將影響下乙個練習中建立表面的精度。不過,—旦知道某種方向效應確實存在,則地統計分析模組提供的工具可以在建立表面的過程中對其給予解釋。

可以利用方向查詢工具,在半變異函式雲圖中檢測某個方向效應。

指標指向的方向決定了哪些樣點對將會出現在半變異函式圖中。如果指標是東西方向,那麼只有那些處於彼此東西方向的點對才會在半變異函式圖中顯示,這就能夠去除不感興趣的那些點對從而來檢查資料中的方向效應。

可以注意到,無論距離大小,大多數相連的樣點對(代表了地圖上的樣點對)都會對應到洛杉磯地區的某一取樣點上。對更多不同距離的點對的考慮結果表明,並非只有那些從洛杉磯地區延伸至海邊的點對才具有很高的半變異函式值,許多從洛杉磯地區延伸到其它內陸地區的資料點對同樣也有很高的半變異函式值。這是因為洛杉磯地區的臭氧值比加州其他任何地區都要高的多。

通過分析,現在已經知道資料集中沒有離群值或錯誤的取樣點,並且資料接近於正態分佈,所以可以放心地進行表面插值。而且還知道了資料中存在某個趨勢,所以在插值過程中通過某些調整,可以建立乙個更加精確的表面。

練習3:製作臭氧濃度圖

在練習2中,對資料進行檢查時,你已經發現資料中存在乙個全域性趨勢。利用trend analysis工具進行修正後,可知該趨勢是南東-北西方向,並且可以用乙個二階多項式進行擬合。該趨勢可以從資料中剔除,並可以用乙個數學公式表達。

一旦剔除全域性趨勢後,就可以對表面殘差或表面的短程變異成分進行統計分析。在建立最終表面之前,該趨勢還將自動新增回來以產生更有意義的結果。全域性趨勢剔除後所進行的分析將不再受其影響。

而一旦將全域性趨勢再新增進來,就能夠生成乙個更加精確的表面。

因為在練習2的trend analysis對話方塊中已經檢測到一條南西-北東方向的「u」型曲線,所以選擇二階多項式擬合是合適的。預設情況下,地統計分析模組將繪製資料集中的全域性趨勢。從圖中可以看出,南西-北東方向的變化最快,而北西-南東方向的變化則相對較緩慢,從而形成橢圓形。

趨勢剔除必須合情合理。空氣質素中的這種南西-北東向趨勢可以歸因於山區與沿海間的臭氧積累。山區的海拔高度以及在沿海地區佔主導地位的風向導致山區與沿海地區的臭氧濃度值相對較低。

人口密度過大導致在山區和沿海地區之間的汙染程度較重。而北西-南東向的趨勢變化較緩是由於洛杉磯附近的人口密度較高,而聖弗朗西斯科方向延伸時人口密度卻降低。因此將這些趨勢剔除是合理的。

在練習2的semivariogram/covsnance cloud中,已經檢測了已測點的所有的空間自相關。為此需要檢查半變異函式,半變異函式顯示了具有不同距離的樣點對的方差。用半變異函式/協方差函式進行模擬的目的在於為其確定乙個最佳擬合模型,該模型將穿過半變異函式圖中的那些點。

統計分析報告

一 黨員基本情況 截止到2005年12月31日,我院共有黨員總數1229名。其中,正式黨員882名,預備黨員347名 女性黨員517名,佔黨員總數的42 少數民族黨員49名,佔黨員總數的4 從黨員的身份來看,教職工黨員391名 其中,教師黨員192名,35歲以下青年教師黨員123名 學生黨員663名...

黨內統計分析報告

鎮20 年黨內統計分析報告 根據縣委組織部的要求,我鎮於20 年12月對全鎮黨組織和黨員的基本情況進行了統計彙總。20 年我鎮黨建工作在發展黨員工作力度 結構布局和積極分子培養等方面都得到了進一步的改善,但也反映出了一些需要改進和加強的方面。現對20 年度黨內統計的有關情況及反映出的問題報告如下 一...

質量統計分析報告

專案年月修訂記錄 版本號 文件的版本號 狀態內容有如下幾種 建立 a 修改 m 刪除 d 目錄1 專案資訊 4 2 質量評測 4 2.1測試用例覆蓋率統計 4 2.2缺陷報告分析 4 2.2.1缺陷數與優先順序 4 2.2.2缺陷數與嚴重性 5 2.2.3缺陷趨勢分析 按實際測試的週期來統計 5 2...