模式識別作業

2023-01-03 07:45:06 字數 1100 閱讀 2632

題目一:計算特徵向量之間的距離:任意構造10個人在程式設計、離散數學、資料結構、計算機組成原理4門課的成績表。計算兩兩之間的歐式距離、絕對值距離,設計合適的閾值,能否進行分類?

答:題目中每個人共有四門課,也就是每個人有4個特徵,每門課的成績也就是這4個特徵的量化。例如某人的成績就可以表示為(95,68,78,85)這樣的乙個四維向量。

在這樣乙個四維空間裡,每個個體的相似程度也就可以用歐式距離或者絕對值距離表示。根據這個相似度,我們就可以將相似度近的分為幾類,使其類間距離和最大,類內距離和最小。或者規定產生幾類,具體進行分類。

可用的分類方法有很多,例如最大最小距離法、譜系聚類法、c-均值。

題目二:關於類的定義:如何定義類內各個樣本的平均距離?如何定義類之間的距離?

答:(1)根據不同的要求類內各個樣本的平均距離可以有不同的定義方式。一般而言,採用先求取類的類心,通過求各個樣本與類心距離的平均值.

但有時對於樣本的聚簇要求格外看中,可以求樣本兩兩距離的和的平均值。(2)類間距離的方法有很多,例如歐式距離、馬氏距離、明氏距離、漢明距離、角度相似性函式。其中歐式距離較為常用。

設x=(x1, x2, …, xn)t, y=(y1, y2, …, yn)t

歐式距離(euclidean)

d(x, y) = ||x-y|| = [i=1 n(xi-yi)2]1/2

絕對值距離(manhattan距離)

d(x, y) = i=1 n|xi-yi|

切氏距離(chebyahev)

d(x, y) = maxi |xi-yi|

閔科夫斯基距離(minkowski)

d(x, y) = [i=1 n(xi-yi)m]1/m

m=2,1,時分別是歐式距離、絕對值距離和切氏距離。

馬氏距離(mahalanohis)

設n維向量xi和xj是向量集中的兩個向量,其馬氏距離d是:

d2(xi, xj) = (xi-xj)tv-1 (xi-xj)

題目三:你如何理解準則函式?

答:準則函式-用具體函式評價系統所採取策略優劣的準則時,稱為準則函式。根據實際問題的型別和所要達到的目標確定準則函式。

準則函式的取值取決於決策者所採取的策略。換句話說就是給出分類的判別標準。

模式識別考試

基於最小錯誤率的貝葉斯決策為 相等 1.假定二類協方差矩陣不相等,則第一步分別 計算二類樣本的均值 第二步分別計算二類樣本的協方差 代入x 2 0 至決策規則有 2.假設兩類協方差矩陣相等,則第一步得到此時的協方差矩陣為 代入x 2 0 至決策規則有 1.簡要說明最大似然估計的步驟 第一步 寫出隨機...

模式識別練習題

一 試問 模式 與 模式類 的含義。如果一位姓王的先生是位老年人,試問 王先生 和 老頭 誰是模式,誰是模式類?答 在模式識別學科中,就 模式 與 模式類 而言,模式類是一類事物的代表,概念或典型,而 模式 則是某一事物的具體體現,如 老頭 是模式類,而王先生則是 模式 是 老頭 的具體化。二 試說...

模式識別實驗指導書

實驗一感知器準則演算法實驗 一 實驗目的 貝葉斯分類方法是基於後驗概率的大小進行分類的方法,有時需要進行概率密度函式的估計,而概率密度函式的估計通常需要大量樣本才能進行,隨著特徵空間維數的增加,這種估計所需要的樣本數急劇增加,使計算量大增。在實際問題中,人們可以不去估計概率密度,而直接通過與樣本和類...