關聯規則挖掘技術在運動視覺分析中的應用 錢增磊

2023-01-05 18:36:05 字數 3706 閱讀 2107

——計算機技術 6121914014 錢增磊

——研究方向:基於**編譯碼的影象檢索技術

由於本人的研究方向是**編譯碼,以後研究的是利用h.264編碼技術對**目標的動態檢索,所以本文以足球運動員和非運動員在**比賽**過程中的注視停留區域為挖掘物件,利用關聯規則挖掘演算法尋找不同物件的注視規律,以挖掘運動員和非運動員的視覺搜尋策略,為視覺搜尋的研究提供一種新方法和新思路。研究結果發現運動員存在視覺搜尋模式,對不同的場景有不同的搜尋模式,表明關聯規則挖掘適合於對運動員視覺停留資料的進一步開發與利用,能夠在更深乙個層次上揭示運動員的視覺停留區域的規律,從而對於發現

運動員的視覺搜尋策略具有較高的應用價值。

對抗性的運動專案需要運動員具備既快速又準確的預判和反應能力。由於運動員的視覺-運動能力高,所以他們比非運動員反應更快、更準確。比賽過程瞬息萬變,運動員是怎樣搜尋視覺資訊的呢?

視覺-運動能力的相關研究越來越受到人們的關注資料探勘(dm,data mining),也稱為資料庫中的知識發現,是資料庫技術和機器學習等人工智慧相結。-運動能力的影響,但這些方法忽略了視覺資訊在時間上連續性。

資料探勘(dm,data mining),也稱為資料庫中的知識發現,是資料庫技術和機器學習等人工智慧相結合的產物,是一門新興的資料智慧型分析技術。所謂資料探勘就是從大量資料中提取和挖掘知識,可以通過自動或半自動的工具對大量的資料進行探索和分析,從中發現有意義的模式和規律。關聯規則(association rules)是美國ibm almaden research center的rakensh agrawal等人於 1993 年首次提出來的kdd研究的乙個重要課題,是資料探勘中的一種重要的挖掘技術。

關聯規則挖掘本質是從大量的資料中或物件間抽取關聯性,它可以揭示資料間的依賴性,特別適合於時間序列資料。

因此根據注意線索自然時間序列特點, 本研究應用關聯規則的挖掘方法, 運用時間序列模式進行研究,分別對足球運動員組和非運動員組視覺停留區域資料進行了分析,以挖掘運動員和非運動員的視覺搜尋策略,從而達到對視覺注視資料的深層次開發與利用,並從中發現運動員搜尋視覺資訊的模式和規律,這對提高運動員訓練與比賽水平有著重要的意義。同時該研究為視覺搜尋的研究提供一種新方法和新思路。

一、實驗內容

本研究製作了足球罰球點球和小場地3對 2 的**片段,作為實驗刺激材料,並利用眼動儀來收集實驗物件****時的注視區域資料。

1、關聯技術挖掘規則

關聯規則是如下形式的邏輯蘊涵:,其中a,b是項集,對於事務集d,,,。一般用兩個引數描述關聯規則的屬性。

支援度(support):支援度()=包含a和b的元組數/元組總數。支援度描述了a 和b這兩個項集在所有事務中同時出現的概率。

可信度(confidence):可信度即是「值得信賴性」,的可信度定義為:可信度() =包含a和b的元組數/包含a 的元組數;可信度表達的就是在出現項集a的事務集d中 ,項集b也同時出現的概率。

關聯規則的挖掘問題就是在大型資料庫中找出具有給定的最小支援度min sup和最小可信度min conf的關聯規則。

關聯規則挖掘的演算法主要分成兩個步驟:

(1)找出存在於大型資料庫中的所有頻繁項集。項集x 的支援度最小支援度min sup,則稱x為頻繁項集。

(2) 利用頻繁項集生成關聯規則。對於每個頻繁項集 x ,若,,且confidence{}min conf,則構成關聯規則。

第2 步比較容易,目前大多數研究集中在第1步上, apriori演算法最為經典:

apriori演算法:

input: db, min sup.

output: result = 所有的頻繁項集,和它們的支援度。

方法:result:= {};

k:= 1;

所有的1-項集

while()do

begin

為每乙個中的項集生成乙個計數器;

for(i=1; ; i++)

begin /*所有db中的記錄t*/

對第i個記錄t支援的每乙個中的項集,其計數器加1;

end中滿足大於min sup的全體項集;

的支援度保留;

result := result;

所有的(k+1)-項中滿足k-子集都在裡的全體;

k= k+1;

enddo

2、資料的採集與預處理

在進行資料探勘以前,首先要按足球比賽分析的要求進行資料採集。借鑑s**elsbergh等人的研究,我們將被試**點球射門時的視覺停留區域分為:頭部、肩部、手臂、軀幹、髖部、支撐腿、踢球腿、人與球之間的區域、球和無意義區;借鑑vaeyens等人的研究,將被試**3對2 時的視覺停留區域分為:

中間隊員、左進攻隊員、右進攻隊員、左防守隊員、右防守隊員、左標誌區、右標誌區、球、無意義區。為了便於統計,本研究對不同的區域進行了數字編碼。

點球分為:有意義區和無意義區(10),有意義區包括頭部(1)、肩部(2)、手臂(3)、軀幹(4)、髖部(5)、支撐腿(6)、踢球腿(7)、人與球之間的區域(8)、球(9)。

3對2分為:有意義區和無意義區(9),有意義區包括中間隊員(1)、左進攻隊員(2)、右進攻隊員(3)、左防守隊員(4)、右防守隊員(5)、左標誌區(6)、右標誌區(7)、球(8)。

本研究採用了指令碼描述技術,依據視覺停留區域劃分的規則,建立了一套視覺停留區域劃分的符號體系,如表1所示。

表中包括欄位名:id(實驗物件編號)、group(組別)、type (****型別)、procure(注視步驟)、watch_pos(注視停留區),如表 1所示。

3、資料分析

本研究運用關聯規則挖掘對運動員組和非運動員組的視覺停留區域進行挖掘。將最小支援度閾值和最小信任度閾值設定為20%,其挖掘結果表明非運動員組沒有發現視覺搜尋的規律,而運動員組發現視覺搜尋規律。運動員的視覺停留區域的具體挖掘結果見表2和表 3。

從**點球射門**時視覺停留區域關聯規則挖掘結果來看,步驟 1 出現概率最高的是 10 區,即無意義區,概率達 85%(編號 16)。其後出現概率最高的是 9 區,即球(編號 4,16,17,19)。其他出現概率最高的是 8 區,即人與球之間的區域(編號 4,17,18)。

也就是說球與人之間的資訊區域最關鍵。運動員對點球方向**關鍵是球,運動員通過對球及球周圍的有效資訊來分析出球方向。

從** 3對 2 **時視覺停留區域關聯規則挖掘結果可以發現,步驟1出現概率最高的是9區,即無意義區,概率達78%(編號15),其後都是有意義區。步驟2**現概率最高的是1 區,即中間隊員,概率達 78%(編號 15)。同樣最後一步概率最高的也是1區,也達到78%(編號 15)。

中間步驟**現概率較高的是 3 區和 7 區,這兩個區域有效資訊提取可能性較大(編號 3,15,18,19 等)。也就是說,運動員通過中間隊員的動作對出球方向進行預判,而後通過有效資訊區的搜尋,再觀察中間隊員動作進行驗證。

4、總結

關聯規則挖掘適合於對運動員視覺停留資料的進一步開發與利用,能夠在更深乙個層次上揭示運動員的視覺停留區域的規律,從而對於發現運動員的視覺搜尋策略具有較高的應用價值。

從關聯規則挖掘統計結果中我們發現,運動員存在視覺搜尋模式。從點球射門場景來分析,我們可以發現運動員組採用了一些固定的模式進行分析,首先停留在無意義區域,在對畫面進行判斷以後,圍繞球進行**,尋找周圍有效資訊,最後去驗證自身的**。從3對2場景來分析,我們發現運動員組首先停留在無意義區域,而後注視中間帶球隊員,並通過對有球區域的觀察,最後再注視中間帶球隊員,驗證自身的**。

從2 個場景來分析,運動員存在模式搜尋,對不同的場景有不同的搜尋模式,對同一場景有相似的視覺搜尋模式。

對於這一次深入學習知識工程與資料探勘,讓我對此有了很深刻的認識,也能夠在以後對自己的研究方向中結合本課程的內容進行研究,做到更好的效果。

VC1015資料探勘中關聯規則演算法的應用研究

資料探勘中關聯規則演算法的應用研究 隨著計算機 網路通訊等資訊科技的高速發展,產生了海量資料,傳統的資料分析手段已無法有效地使用這些資料。資料探勘技術就是從大量的資料中提取隱含的有用資訊,並找到尚未發現的知識用來指導決策。近年來,資料探勘的研究工作取得了很大的進展,各種資料探勘軟體的應用極大地推動了...

基於群體智慧型的關聯規則挖掘及應用

碩士學位 學科專業名稱 計算機軟體與理論 申請人姓名 王偉偉 指導教師 劉希玉教授 提交時間 2007年 04月19日 本章首先介紹了群體智慧型的研究背景及前沿,其次闡述微粒群演算法的發展現狀,最後介紹了本文的主要工作和組織結構。人們在很早的時候就對自然界中存在的群集行為感興趣,如大雁在飛行時自動排...

資料探勘中關聯規則在零售業中的應用

第 卷第 期重慶科技學院學報 自然科學版 年 月 董引娣 重慶城市管理職業學院,重慶 摘要 目前,在需要處理大量資料的科研領域中,資料探勘受到越來越多的關注。我們可以利用資料探勘技術從海 量資料中發現有用資訊,幫助商家了解客戶以往的需求趨勢,並 未來,從而給商家帶來巨大的利潤。在國內很多 領域,尤其...