雲模型簡介

2021-08-23 12:31:23 字數 4325 閱讀 4311

在人類認知以及進行決策過程中,語言文字是一種強有力的思維工具,它是人類智慧型和其他生物智慧型的根本區別。人腦進行思維不是純粹地應用數學知識,而是靠自然語言特別是客觀事物在人腦中的反映而形成的概念。以概念為基礎的語言、理論、模型是人類描述和理解世界的方法。

自然語言中,常常通過語言值,也就是詞來表示概念。而語言值、詞或概念與數學和物理的符號的最大區別就是其中包含太多的不確定性。在人工智慧領域,不確定性的研究方法有很多,主要有概率理論,模糊理論,證據理論和粗糙集理論;對於確定性系統的不確定性的研究還有混沌和分形的方法。

這些方法從不同的視角研究了不確定性,優點是:有切入點明確、邊界條件約束清楚、能夠對問題進行深入研究等,但是在研究中常常將不確定性分成模糊性和隨機性分開進行研究,然而兩者之間有很強的關聯性,往往不能完全的分開。隨機性是指有明確定義但是不一定出現的事件中所包含的不確定性。

例如在投擲硬幣試驗中,硬幣落地時要麼有國徽的一面向上,要麼標有分值的一面向上,結果是明確的可以預知的,但是每次試驗結果是隨機的。概率論和數理統計是研究和揭示這種隨機現象的一門學科,至今已有幾百年的研究歷史.模糊性是另一種不確定性,是已經出現的但是很難精確定義的事件中所包含的不確定性。在日常工作和生活中存在著許多模糊概念,如「胖子」「年輕人」「收入較高」等。

為處理這些模糊概念,引入了模糊集的概念[41],使用隸屬度來刻畫模糊事物彼此間的程度。隸屬度函式常用的確定方法有模糊統計法、例證法專家經驗法等,這些方法確定隸屬度函式的過程是確定的,本質上說是客觀的,但每個人對於同乙個模糊概念的認識理解存在差異,因此有很強的主觀性,而且一旦隸屬度函式確定之後,得到的概念、定理等包含著嚴密的數學思維,其不具有任何模糊性。

針對上述問題李德毅院士在傳統的概率統計理論和模糊理論的基礎上提出了定性定量不確定性轉換模型——雲模型,實現定性概念和定量值之間的不確定性轉換。在此工作上,一些學者對雲模型做了深入系統的研究,使其日趨成熟,並將它成功地應用於不確定性推理、關聯規則挖掘,空間資料的挖掘,智慧型控制及時間序列**等領域。

雲模型能模擬人類思維靈活劃分屬性空間,在較高的概念層上泛化屬性值,完成定量數值到定性概念間的轉換,同時允許相鄰屬性值或語言之間有重疊,這種劃分使發現的知識具有穩健性。 而由於計算機系統的行為存在隨機性和不確定性,雲模型能夠很好地處理具有隨機性和不確定性的資料,所以可將雲模型引入到入侵檢測中來,通過雲模型建立的入侵檢測系統具有較準確的檢測能力和適應能力。

雲模型能夠實現定性概念與定量值之間的不確定性轉換。同時資料探勘是基於不同認知層次的「資料-概念-知識」檢視,「資料」中包含大量的不確定性知識,而雲模型能夠更準確地將資料表達為概念,進而發現準確、完整的知識。因此將雲模型應用於資料探勘中可以提高資料探勘的準確度。

下面簡單介紹雲模型的一些概念和數字特徵,重點介紹雲的概念、正態雲發生器及正態雲的數學性質。

定義3.1[42] 設是乙個精確數值表示的定量論域,是上的定性概念,若定量值,且是定性概念的一次隨機實現,對的確定度是有穩定傾向的隨機數

3.1)

則在論域上的分布稱為雲(cloud),每乙個稱為乙個雲滴[42]。

雲具有以下性質[42] :

(1)論域可以是一維或多維的;

(2)定義中所提及的隨機實現,是概率意義下的實現;定義中所提到的確定度,是模糊集意義下的隸屬度,同時又具有概率意義下的分布;

(3)對於任意乙個,到區間[0,1]上的對映是一對多的變換,對的確定度不是乙個固定的數值,而是乙個概率分布;

(4)雲由雲滴組成,雲滴之間無次序性,乙個雲滴是定性概念在數量上的一次實現,雲滴越多,越能反映這個定性概念的整體特徵;

(5)雲滴出現的概率大,雲滴的確定度大,則雲滴對概念的貢獻大。

雲的數字特徵能夠反映概念的整體性和定性知識的定量特性,它對定性概念的理解有很重要的意義。

雲一般用期望、熵和超熵這三個數字特徵來整體表徵乙個概念[43],如圖3-1所示。

圖3-1 雲的數字特徵

fig.3-1 digital characteristics of the cloud

期望:雲滴在論域空間分布的期望,是概念在論域中的中心點,它是最可以代表定性概念的點[43]。

熵:定性概念的不確定性度量,由概念的隨機性和模糊性共同決定。一方面熵是定性概念隨機性的度量,反映了能代表這個定性概念的雲滴的離散程度;另一方面又是定性概念模糊度的度量,反映了論域空間中可被概念接受的雲滴的取值範圍,此外熵還能反映隨機性和模糊性之間的關聯性[43]。

超熵:是熵的不確定性的度量,即熵的熵,由熵的隨機性和模糊性共同決定,反映了雲滴的離散程度,超熵的大小間接地反映雲的厚度,超熵越大,雲的厚度越大[43]。

雲模型是雲的具體實現方法,是雲運算、雲推理、雲控制、雲聚類等方法的基礎。由定性概念到定量表示的過程,即由雲的數字特徵產生雲滴的過程,稱為正向雲發生器。由定量表示到定性概念的過程,即由雲滴群得到雲的數字特徵的過程,稱為逆向雲發生器。

雲有多種實現方法,可構成不同型別的雲,如半雲模型、對稱雲模型、組合雲模型等,還可以擴充套件到多維雲模型。

正態分佈是概率理論中重要分布之一,通常用均值和方差兩個數字特徵表示;鐘形隸屬度函式是模糊理論中使用最多的隸屬函式,通常用來表示。正態雲正是在二者基礎上發展起來的全新模型。

定義3.2 設是乙個精確數值表示的定量論域,是上的定性概念,若定量值,且是定性概念的一次隨機實現,若滿足:,其中,且對的確定度滿足:

3.2)

則在論域上的分布稱為正態雲[43]。

正態雲發生器[44]是指用計算機實現的一種特定演算法,其可以用整合的微電子器件來實現,包括正向雲發生器和逆向雲發生器。

(1) 正向雲發生器

正向雲發生器是實現定性概念到定量值的轉換模型,其由雲的數字特徵()產生雲滴,如圖3-2所示。

圖3-2 正向雲發生器

fig.3-2 forward cloud generator

(2) 逆向雲發生器

逆向雲發生器[44]是實現定量值到定性概念的轉換模型,它可以將一定數量的精確資料轉換為以數字特徵()表示的定性概念,如圖3-3所示。

圖3-3 逆向雲發生器

fig.3-3 backward cloud generator

逆向正態雲發生器的演算法基於統計原理思想,基本演算法有兩種:一是無需確定度資訊的逆向雲發生器演算法;二是需要確定度資訊的逆向雲發生器演算法[44]。

在正向正態雲模型中,雲滴群對概念的貢獻是不同的。本文以一維正向正態雲為例來說明雲滴群對概念的貢獻程度。

定義3.3 在一維論域中,中任一小區間上的雲滴群對定性概念的貢獻[43]為

3.3)

易得,論域()上所有元素對概念的總貢獻為

3.4)

同理,可得論域上所有元素對概念的總貢獻為:

3.5)

因此論域中對定性概念有所貢獻的雲滴,主要落在區間中,通常可以忽略區間之外的雲滴對定性概念所做的貢獻,這即為正向正態雲的「規則」[44]。同理位於區間內的雲滴,佔所有定量值的22.33%,它的貢獻佔總貢獻的50%,這部分雲滴被稱為「骨幹元素」;位於區間內的雲滴,佔所有定量值的33.

33%,這部分的貢獻佔總貢獻的68.26%,這部分元素被稱為「基本元素」;位於區間和區間內的雲滴,佔所有定量的33.33%,它們對定性概念的貢獻佔總貢獻的27.

18%,該部分元素被稱為「外圍元素」;位於區間和區間內的雲滴,佔全部定量值的33.33%,它們對定性概念的貢獻佔總貢獻的4.3%,這部分雲滴被稱為「弱外圍元素」[44]。

不同區域內的雲滴群對定性概念所做的貢獻不同,如圖3-4所示。

圖3-4 雲滴群對定性概念的貢獻這圖能不能小點兒

fig.3-4 cloud droplets contribute to qualitative concept

根據正態雲發生器演算法,所有雲滴的集合構成隨機變數,服從以為期望、為方差的正態分佈,所以的概率密度函式[44]為

3.6)

如果為定值時,服從以為期望、為方差的正態分佈,此時的概率密度函式[44]為

3.7)

由於是隨機變數,由條件概率密度公式可知的概率密度函式為

3.8)

式(3.8)是乙個概率密度函式,它不具備解析形式,對於任意的變數,通過數值積分可以得到與之相應的函式值。當雲滴個數為時,採用parzen窗的方法可以估算出的概率密度函式[44]。

特別地,當時,的概率密度函式為

3.9)

因為所有的雲滴都來自於期望為的正態隨機變數,所以期望,方差。由此可得,由正態雲發生器所產生的雲滴,是期望為、方差為的乙個隨機變數[44]。

根據正態雲發生器演算法,隨機變數由所有雲滴的確定度構成,隨機變數

3.10)

產生的樣本可以作為乙個雲滴的確定度。

經過計算可知,無論取什麼值,隨機變數的概率密度函式均保持不變,也就是全部的確定度都來自乙個密度為

3.11)

的隨機變數。所以,隨機變數的概率密度函式即為,由此可以看到,確定度的概率密度函式與正態雲的三個數字特徵沒有關係[43]。

對於論域空間中的,還可研究聯合分布的概率密度函式。當論域空間是一維時,是乙個二維的隨機變數,可以計算它的聯合概率密度函式[43]。

雲模型理論

雲是使用語言值來表示某個定性概念與其定量之間不確定性的轉換模型,以達到反應自然世界中事物或者人類知識概念的不確定性 模糊性與隨機性,不僅從隨機理論和模糊集合理論中給出解釋,而且也反映了模糊性與隨機性之間的關聯性,構成了定量與定性之間的對映.設是乙個包含精確數值的定量論域,表示的定性概念,如果定量值,...

張云波簡介

張云波,男,1971年出生,山東省陶瓷藝術大師,山東省工藝美術名人。1990年師從於中國工藝美術大師,中國陶瓷藝術大師張明文先生學習刻瓷藝術。張大師結合張云波天資聰慧 自幼臂力超人的特點,在精心學習彩繪 刻瓷的同時讓其鑽研 學習刻瓷微書藝術。是張大師徒弟中唯一以陶瓷微書揚名華夏的工藝美術大師。張云波...

能力素質模型簡介

1973年,麥克里蘭博士在 美國心理學家 雜誌上發表一篇文章 testing for petency rather than intelligence 文中,他引用大量的研究發現,說明濫用智力測驗來判斷個人能力的不合理性。並進一步說明人們主觀上認為能夠決定工作成績的一些人格 智力 價值觀等方面因素,...