資料探勘中關聯規則在零售業中的應用

2022-11-10 08:15:02 字數 5574 閱讀 9832

第l2卷第1期重慶科技學院學報(自然科學版)2010年2月

董引娣(重慶城市管理職業學院,重慶401331)

摘要:目前,在需要處理大量資料的科研領域中,資料探勘受到越來越多的關注。我們可以利用資料探勘技術從海

量資料中發現有用資訊,幫助商家了解客戶以往的需求趨勢,並**未來,從而給商家帶來巨大的利潤。在國內很多

領域,尤其在銀行、零售(如超市)等商業領域,資料探勘所能解決的典型問題包括:客戶群體劃分、應用背景分析、銷售額分析等市場分析行為,以及客戶流失性分析、客戶信用積分等。在資料探勘領域,採用關聯規則在大型事務資料庫中進行資料探勘是乙個重要的研究內容。

關鍵詞:資料探勘;關聯規則;事務資料庫中圖分類號:tp391

文獻標識碼:a

文章編號

1關聯規則及應用

資料探勘就是從大量資料中提取或「挖掘」知識,它涉及多學科技術的整合,資料探勘既可以認為是資料庫中知識的發現.又可以視為資料庫中知識

的同時也會購買牛奶,這是乙個現代商場智慧型化資訊分析系統發現的秘密。這被公認是商業領域資料探勘的誕生。其所表達的意義是,顧客在購買某些東西的時候有多大傾向也會購買與之有直接或間接聯絡的其他一些東西.找出所有類似這樣的規則,對於

發現過程的乙個基本步驟。資料關聯是資料庫中存在的一類重要的可被發現的知識。若兩個或多個變數的取值之間存在某種規律性,就稱為關聯。關聯分析的目的是找出資料庫中隱藏的關聯網。有時並

市場經理確定市場決策有很重要的價值。其次會影響商場負責人對貨架的擺放、倉儲的規劃以及基於購買模式對顧客進行的分析等。

關聯分析法廣泛應用於事務分析中,可以找出哪些商品可能隨某些商品一同被購買,通過從銷售記錄挖掘

不知道資料庫中資料的關聯函式,即使知道也是不確定的,因此關聯分析生成的規則帶有可信度。關聯規則挖掘的一般物件是事務資料庫,這種資料庫主要應用在零售業,比如超級市場的銷售管理。關

關聯資訊。可以發現買某一品牌香水的顧客很可能購買其他商品,這類資訊可用於形成一定的購買推薦,幫助顧客選擇商品,增加銷售額,如某些商場貨架上的「本週熱點商品」、「dm推薦」等這類的資訊,以達到**的目的。零售業與其他行業一樣,關鍵是資訊的獲取及其有效利用.資料探勘可以幫助提高市場份額和增加利潤,了解顧客群的特點,進行**的調整決策。

零售業經常

聯規則就是發現事務資料庫中不同商品之間是否存在某種關係。通過這些規則找出顧客購買行為模式,

如購買了某一商品對購買其他商品的影響發現這樣的規則可以應用於商品貨架設計、庫存安排以及根據購買模式對使用者進行分類。

啤酒和尿布對於顧客群來說是完全不同的商品。這就是典型的關聯規則的應用例項,但是沃爾

通過各種折扣、廣告及優惠券等形式搞**活動,來達到**產品、吸引顧客的目的.提高企業利潤。

關聯規則挖掘發現大量資料中項集之間有趣的關聯或相關聯絡,關聯規則挖掘的乙個典型例子是購物籃分析該過程通過發

瑪1a內資料探勘的結果顯示,在居民區中尿布賣得好的店面啤酒也賣得很好。原因很簡單,一般太太

讓先生下樓買尿布的時候,先生們一般都會犒勞自己兩聽啤酒,因此啤酒和尿布一起購買的機會是最多的。此外.還有約90%的顧客在購買了麵包和黃油

收稿日期

現顧客放人其購物籃中不同商品之間的聯絡.分析顧客的購物習慣。通過了解哪些商品頻繁地被顧客同時購買.這種關聯地發現可以幫助零售商制定營

作者簡介:董引娣(1984一),女,陝西興平人,助教,研究方向為計算機教育。

121董引娣:資料探勘中關聯規則在零售業中的應用

銷策略。例如,在同乙個超級市場,如果顧客購買了牛奶,他同時購買麵包的可能性有多大?通過分析,

零售商有選擇地經銷和安排貨架,這種資訊可以引導銷售。例如,將牛奶和麵包盡可能放近一些,可以進一步刺激顧客同時購買這些商品。

2關聯規則挖掘過程及其相關演算法

2.1關聯規則挖掘的過程

目前,由於條碼技術的發展,顧客在超市中購買

商品的資訊可以很方便地被存放在資料庫中,針對資料庫中大量的資料.我們如何發現它們之間存在的關聯是本文主要討論的問題。關聯規則的挖掘問題就是在超市事務資料庫db中找出具有使用者給定

的最小支援度和最小置信度的關聯規則。關聯規則

的挖掘對市場調節和爭取顧客方面的應用是極有價

值的。因此,有必要採用快速演算法從超市事務資料o●

o o,

,o o

0 ol o

庫中挖掘關聯規則。由資料庫中已有資料探勘關聯

規則可分兩步完成。第一步,找出所有頻繁項集,從

原始資料集合中,找出所有頻繁項集。頻繁的意思是指某一事務項出現的頻率相對於所有記錄而言,l o o o

o o●

0 oo 0

必須達到某一水平找出事務資料庫db中所有大於等於使用者指定最小支援度的專案集.具有最小支援

度的專案集稱為頻繁項集。第二步,利用頻繁項集生成所期望的關聯規則,即這些規則必須滿足最小

o 0 o0 1

支援度和最小置信度。

事實上,第一步的任務是迅速高效地找出事務資料庫db中全部頻繁項集,資料探勘所面臨的最大

的挑戰是計算效率問題.解決這一問題的途徑是產

l一生高效的資料探勘演算法,但從超市事務資料庫中產生頻繁項集既費時又占用空間,所以說第一步是關聯規則挖掘的核心問題,是衡量關聯規則挖掘演算法的標準。當找到所有的頻繁項集後,相應的關聯規則將很容易

生成,目前大多數的關聯規則挖掘演算法研究是針對第

一步而提出的,本文重點討論第乙個問題。

下面以挖掘最簡單形式的關聯規則(這種關聯規則是單維、單層、布林關聯規則)為例,用某一鮮菜超市某天內l4位顧客購買的情況進行例項介紹.如表1所示(「0」表示某時刻未購買。「l」表示某時刻購買)。

關聯規則形如第一步,找出生成關聯規則的子集列舉出所有子集,僅找出能滿足一定支援度

的子集(頻繁項集);第二步,由集合生成滿足一定置信度的關聯規則。

122表1鮮菜超市某天某時段銷售記錄

事務項蘆筍

大豆捲心菜

雞蛋青椒

黃瓜假定支援度閾值為4/14,則支援度記數為4,則滿足支援度的一元頻繁項集如圖1所示。若無法形成

關聯規則,如何找出二元頻繁項集?我們可以先由一元頻繁項集得出二元候選集,如圖2所示。蘆筍6

大豆10

捲心菜5雞蛋8青椒5黃瓜7番茄

6圖1滿足支援度的一元頻繁項集

一元頻繁項集

二元候選項集

蘆筍6蘆筍、大豆捲心菜、雞蛋大豆

10蘆筍、捲心菜

捲心菜、青椒

捲心菜5雞蛋8蘆筍、雞蛋捲心菜、黃瓜青椒5蘆筍、青椒捲心菜、番茄黃瓜

7蘆筍、黃瓜雞蛋、青椒番茄6

蘆筍、番茄雞蛋、黃瓜大豆、捲心菜雞蛋、番茄大豆、雞蛋青椒、黃瓜大豆、青椒青椒、黃瓜大豆、黃瓜黃瓜、番茄

大豆、番茄

圖2由一元頻繁項集得出二元候選集

蘆筍、大豆5蘆筍、黃瓜5大豆、雞蛋5大豆、雞蛋6大豆、番茄

4捲心菜、青椒4雞蛋、番茄

4圖3滿足支援度的二元頻繁項集

董引娣:資料探勘中關聯規則在零售業中的應用

蘆筍、大豆、黃瓜

蘆筍、大豆、雞蛋蘆筍、大豆、番茄大豆、雞蛋、黃瓜大豆、雞蛋、番茄大豆、黃瓜、番茄圖4

三兀候選項集

結合表1銷售情況及由一元頻繁項集得出二元候選集,找出滿足支援度的二元頻繁項集如圖3所

示。以上資訊,可用於生成二元關聯規則,同時可用於生成三元頻繁項集。但不能通過連線

一、二元頻繁項集生成三元頻繁項集的候選項集,可以利用自連線二元頻繁項集生成三元頻繁項集的候選項集如圖4所示.繼而採用上述方法生成三元頻繁項集及三元關聯規則。三元候選項集要成為頻繁項集,必須滿足支援檢測各個三元候選項集的每乙個子集是否滿足支援度。三元頻繁項集為蘆筍、大豆、黃瓜及大豆、雞蛋、番茄。

此外,還有不產生候選挖掘頻繁項集——頻繁模式增長(fp一增長)。fp一樹挖掘進行如下,由長度為1的頻繁模式(初始字尾模式)開始,構造它的條件模式基;然後,構造它的fp一樹,並遞迴地在該樹上進行挖掘。模式增長通過字尾模式與由條件fp一樹

產生的頻繁模式連線實現。2.2關聯規則挖掘的相關演算法

演算法一使用候選項集找頻繁項集

apfiori演算法是一種最有影響的挖掘布林關聯規則頻繁項集的演算法。其核心是使用一種稱作逐層搜

索的迭代方法,該演算法的基本思想是:首先找出所有的頻集.這些項集出現的頻繁性至少和預定義的最小支援度一樣。然後由頻繁項集產生強關聯規則,

這些規則必須滿足最小支援度和最小可信度。一項集用於探索(ji}+1)一項集。首先,找出頻繁l一項集的集合,該集合記作 l,ll用於找頻繁2一項集的集合£2,而 2用於找 3,如此下去.直到不能找到頻繁|j}一項

集。找到每個 l需要1次資料庫掃瞄。可能產生大量

的候選集,可能需要重複掃瞄資料庫,通過模式匹配

需要檢查乙個很大的候選集合。

2.2.2 fp一樹頻集演算法

由 ̄=apriori演算法的固有缺陷,所以出現了不產生候選挖掘頻繁項集的方法——fp一樹頻集演算法。它採用分而治之的策略:在經過第一遍掃瞄之後,把資料庫中的頻集壓縮進一棵頻繁模式樹(或fp一

樹),同時依然保留其中的關聯資訊,隨後再將fp一樹分化成一些條件庫,每個庫和乙個長度為l的頻集相關.然後再對這些條件庫分別進行挖掘。當原始資料量很大時.也可以結合劃分的方法,使得乙個fp一樹可以放入主存中。實驗表明,fp一增長對不同長度的規則都有很好的適應性.同時在效率上較演算法有很大的提高。

3 結語

在商場的銷售資料庫中.新的記錄不斷地追加

到資料庫當中以反映最新的購買活動,之前的銷

售記錄會被備份出來以節省儲存空間。這樣經過

一段時間以後,原有的資料來源會發生變化,在原有

的資料來源中挖掘得到的規則就可能變為無效.新的有用的規則有可能被重新挖掘。利用資料探勘,

各超市對供貨商的信譽可以更為科學化的進行評估,有效控制超市經營風險等。同時能夠從超市各種應用系統中提取各種績效指標,有利於加強超市的經營管理。除單層單維關聯規則外,還有多

層、多維、基於約束的關聯規則的挖掘,對於許多

應用,由於這些資料空間資料的稀疏性.在底層或

原始層的資料項之間很難找出強關聯規則,在此不做詳細論述。

參考文獻

[1]香麗芸.**資料探勘及其應用明.昌吉師專學報

[2]俞雷,周國祥.基於dw的連鎖超市決策支援系統的研究與

設計【j].計算機技術與發展

資料探勘概念與技術[m】.

范明,孟小峰譯.北京:機械工業出版社,2006.

資料探勘教程[m】.郭崇慧譯.北京:清

華大學出版社,2005.f下轉第146頁)

123趙書朵,諶海雲,高風水武衛麗:**監控系統中雲台控制模組的設計與實現

靠,有一定的應用價值。隨著數字監控技術的不斷發展,雲台監控技術將更廣泛地應用於銀行監控、高速

公路監控、家庭監控等場合。

參考文獻

[1】胡琳萍.基於dsp的控制驅動一體化二自由度雲台的設

計與實現[d】.武漢:武漢科技大學,2008.

[2]intel公司

圖4 arm端程式介面

[3]王威.hcs12微控制器原理及應用[m】.北京:北京航空航

天大學出版社.2007.

為arm端液晶屏上的應用程式介面.當需要改變

監測範圍時,直接單擊左轉、右轉等命令,即可控制雲台的轉向。經過實驗證明,整個系統執行穩定、可

[4]何宗鍵嵌入式系統[m】.北京:北京航空航天

大學出版社.2006.

wei-li

(上接第123頁)

ddⅳc l廠一

』146

零售業門店人員培訓實務 中

劉威3.7優秀門店人員的顧客知識?3.7.1 顧客的型別 3.7.2 顧客的購買訊號及應對 3.7.2.1 顧客的購買訊號之一 注視 留意3.7.2.2 顧客的購買訊號之二 感到興趣3.7.2.3 顧客的購買訊號之三 聯想3.7.2.4 顧客的購買訊號之四 產生慾望3.7.2.5 顧客的購買訊號之五...

關聯規則在系統中的應用

摘要 推薦系統從 資料中提取使用者感興趣的資訊,為使用者提供個性化服務。推薦演算法應盡可能地利用各種有用的資料資訊,提供更加精確有效的推薦。文章對目前推薦系統所使用的技術進行了分析針對推薦系統面臨的問題,提出一種基於關聯規則挖掘的推薦演算法,該演算法結合使用者訪問資料和商品層次結構資料,快速選擇最優...

2023年中國零售業策劃方案全集

第一章聖誕元旦部分 第二章春節部分 第三章情人節部分 第四章元宵節部分 第五章三八節 三一五部分 第六章五一部分 第七章母親節 父親節部分 第八章六一部分 第九章中秋 國慶 教師部分 第十章端午 重陽部分 第十一章周年慶部分 第十二章事件 主題部分 第一章聖誕元旦部分 1 某超市元旦策劃活動方案 一...