大型超市「購物籃」分析

2023-01-09 21:51:08 字數 4464 閱讀 9316

摘要本文根據顧客購買記錄,通過「購物籃」分析,運用多種模型得出結果,並給出**方案。

問題一要求構建能表達多種商品關聯程度的數學模型。根據4717個顧客對999中商品的購買記錄,先用對資料進行預處理,將其轉化為0-1模型,然後求出購買商品的集合和購買商品的集合,考慮到同時購買兩種商品佔購買人數的頻率,即相關性,存在購買人數少但相關性大的缺陷。在改進的模型中,因為存在購買商品數少但也會使相關性大的情況,所以對兩種情況進行綜合考慮,得出最優模型:

用求解0-1矩陣,求出兩商品間關聯係數較大的前八位,有相關係數的值在0-1範圍之內,與所得模型函式的範圍一致,可知,該模型是準確可靠的。

問題二要求出有效方法來找出最頻繁被購買的商品記錄,且越多越好。根據問題一所得0-1矩陣,將其代入運用模型,先算出單項商品的頻繁項集,將支援度較小的資料剔除後,最後選取被購買次數最多的前18個商品,其中最暢銷的為368號商品。根據這18個暢銷品,運用同樣方法將其轉化為兩兩商品的組合,得到被同時購買次數200次以上的商品;根據此演算法依次迭代,得到同時購買3種商品和同時購買4種商品的資料,更多商品被同時購買次數較少因此不予考慮,最後得出:

兩件商品被同時購買次數最高的是368和529號;三件商品被同時購買次數最高的是368、489和682;四件商品被同時購買次數最高的是68、937、895和413。

問題三要求給出方案使效益最大。根據問題一中0-1模型和問題二中模型,將得到的購買次數最多的商品資訊和題中所給利潤表相比較,將利潤小數量多的商品作為贈品和利潤大數量多的商品一同銷售;將共同購買次數多且利潤大的兩商品組合作為**品進行銷售,以進一步提高超市的綜合效益。

關鍵詞 0-1模型模型資料預處理相關係數

一、問題背景和重述

1.1問題背景

隨著資訊科技的發展,通過分析大量歷史資料來發現模式和利用規律的資料探勘技術應運而生,然而大多數商家並不是資料探勘技術領域的專家,如何使資料探勘技術平民化,成為當代很多學者研究的熱點之一。

購物籃分析是資料探勘技術應用在零售業中的一種有效方式,其目的就是在顧客的購買交易中分析能夠同時購買一類產品或一組產品的可能性,利於商品的擺放,也利於提高**活動的效果。隨著人們生活水平的提高,特別是城市,基本物質生活已滿足,人們有更高的追求並呈現多樣性,從企業角度看,了解和掌握顧客消費的特徵和規律,有利於提高企業利潤,同時也能提高消費者的滿意度。本文以乙個面向大型超市的購物籃問題,構建數學模型。

1.2問題重述

作為超市的經理,經常關心的問題是顧客的購物習慣。他們想知道:「什麼商品組或集合顧客多半會在一次購物時同時購買?

」。現在假設我們是某超市的市場分析員,已經掌握了該超市近乙個星期的所有顧客購買物品的清單和相應商品的**,需要給超市經理乙個合理的「購物籃」分析報告,並提供乙個**計畫的初步方案。

問題1:題目中**資料顯示了該超市在乙個星期內的 4717 個顧客對 999 種商品的購買記錄,**中每一行代表乙個顧客的購買記錄,數字代表了其購買商品的超市內部編號。建立一種數學模型,該模型能定量表達超市中多種商品間的關聯關係的密切程度。

問題2:根據在問題1中建立的模型,尋找一種快速有效的方法能從**的購買記錄中分析出哪些商品是最頻繁被同時購買的。超市經理希望得到盡可能多的商品被頻繁同時購買的資訊,所以找到的最頻繁被同時購買的商品數量越多越好。

例如:如果商品1、商品2、商品3在 4717 個購物記錄中同時出現了200次,則可以認為這三個商品同時頻繁出現了200次,商品數量是3。

問題3:題目給出了這999中商品的對應的利潤,根據在問題1、問題2中建立的模型,給出一種初步的**方案,使超市的效益進一步增大。

二、問題分析

2.1問題一的分析

要求構建模型定量表達超市多種商品間的關聯關係的密切程度,根據4717個顧客對999種商品的購買記錄,令表示第個顧客的購買情況,當第個顧客購物籃裡有第個商品,;沒有購買,則。這就把複雜繁多的資料化為了簡單易求的0-1模型。根據購買記錄,求出購買商品的顧客集合和購買商品的顧客集合,兩集合的交集(同時購買)所代表的人數與購買人數的比值即為頻率,此頻率表示兩商品的相關程度,考慮到購買人數較少也會造成頻率較大的情況,對模型進行改進,將同時購買的人數與至少買一種商品的人數的比值作為相關係數,轉化後的模型仍存在缺陷,購買次數較少時也會造成係數較大但不能反映商品相關性的問題。

綜上兩種考慮,將兩個模型結合起來,得到最優模型,用此模型來定量表達商品間的關聯關係的密切程度。由題目可知,此模型所得結果必定大於0小於1,為驗證模型的可靠性,本文運用對資料進行預處理,將資料轉化為0-1矩陣後,再根據公式程式設計篩選出兩商品相關係數較大的前八位,由所得係數與函式大於0小於1的性質相比,若符合,則模型是可靠的;若不符合,則再求新的定量模型。

2.2問題二的分析

要求我們尋找一種快速有效的方法從購買記錄中找出被最頻繁購買的商品,並且被同時購買的數量越多越好。根據問題一對資料進行的0-1矩陣處理,並在中對資料進行求和以及排序處理,得到一次購買一次商品的次數最多的前18個商品。由於數量的繁多,我們將從這18種商品中求出兩件被同時購買以及三件、四件商品被同時購買的資訊。

因此我們調出這18種商品的0-1矩陣,並用程式設計得到兩件商品同時被購買的頻數,並用演算法的原理提出支援度,用其來篩選得到的眾多資料,修改程式以得到三件商品、四件商品被同時購買的資料。

2.3問題三的分析

對於問題三,要求根據問題一和問題的模型給出一種**的方案,促使效益進一步增大。首先我們定義為超市的收益,商品的數量為,商品的利潤為。則。。

而對於那些賣出數量以及能夠獲得的利潤都適中的商品,根據問題二求得的兩件商品被同時購買的數量將它們放在一起**,這樣也會獲得較高利潤。

三、模型假設

1、超市貨源充足最大限度滿足顧客需求;

2、短時期內,商品的銷售情況保持不變;

3、每位顧客的購物行為都是理性的,真實反映當地的消費情況;

4、假設兩商品同時被購買次數大於200的為高銷量商品;

5、假設商品收益只考慮銷售所得收入,不考慮商品成本;

四、符號說明和名詞解釋

4.1符號說明

4.2名詞解釋

1、布林量:本題中所指的是購買或未購買,購買時布林量=1,未購買布林量=0;

五、模型建立與求解

5.1模型的準備

5.1.1問題一模型的準備

由於本題是針對大型超市購物籃的問題,資料繁多,且只考慮顧客的購買記錄,即買或不買,並以此研究商品間的關聯程度,因此本題先對所給資料進行預處理,將4717位顧客對999種商品的購買轉化為0-1模型,方便問題的求解。首先以表示第個消費者的某次購物行為,如果在消費者的購物籃中發現了第種商品,則有,否則(同時表示第個消費者購買第種商品)。

5.2問題一模型的建立與求解

5.2.1模型的建立

本題消費者購買只有兩種情況,即購買或不購買,因此可以用到0-1模型。

為表達超市中多種商品間的密切關聯程度,本題建立了定量模型。首先,用來描述第個消費者的購物情況,表示第個消費者購買了第個商品,反之,表示未購買。

因為是根據顧客對商品的購買記錄來求解,因此本文對購買某種商品的顧客進行分類,設購買的人的集合為,購買的人的集合為,則表示同時購買商品和商品的顧客。由此可將兩種商品的相關聯程度表示為:

此公式表示同時購買兩種商品的頻率,頻率越高,相關性越大,但若購買人數少,也會導致頻率值較大,顯然這樣的表達不能準確反映兩商品間的關聯程度,因此對此模型還應進一步改進。

對購買人數進行改進,考慮到有顧客在兩種商品中至少購買一種的情況,將化為,則兩種商品的相關聯程度轉化為:

此公式表示兩種商品都買的情況佔至少購買一種情況的比值,即頻率,也能反映兩商品間的關聯程度,但其同第乙個公式類似,存在購買商品次數少但導致頻率較大,而不能反映兩商品相關性的缺陷,因此,綜合兩種情況,得到最優模型:

表示兩商品的相關性,若較大,剔除購買次數較小的情況,即可反映當消費者購買一種商品時,對另一種商品的購買可能性很大,兩種商品的關聯相關性密切。

5.2.2模型的求解

對上述模型進行具體求解,其中表示同時購買商品和商品的人數,公式為:

表示兩種商品中至少購買一種商品的人數,其具體公式為:

小於購買人數,同時小於至少購買一種商品的人數,所以小與1。

將題目中所給資料運用進行預處理,將其轉化為0-1矩陣,由於資料過多,則將所得矩陣放在附錄中,詳見附錄1。

根據所得關聯函式公式,用程式設計求出兩商品間關聯係數較大的前八位,如下圖所示:

錶兩商品間的相關係數

從圖中可知,228和398兩種商品的關聯相關性最密切。同時有相關係數的值在0-1範圍之內,與所得模型函式的範圍一致,可知,該模型是準確可靠的。

5.3問題二模型的建立與求解

分析最頻繁被同時購買的商品,且越多越好。首先我們要找出單獨一項商品被購買的頻數,根據頻數較高的單項商品集,通過篩選得出兩種商品被同時購買的頻數,以此類推,層層迭代,找出多種商品被同時購買的頻數。演算法使用頻繁項集的先驗性質,通過逐層搜尋的迭代方法,先掃瞄資料庫,再累積每個項的計數,並收集滿足最小支援度的項,找出頻繁項集的集合,直到所求條件。

此演算法體現出若是乙個頻繁項集,則的每乙個子集都是乙個頻繁項集。首先我們提出支援度的概念,支援度是中包含和的事務數與總的事務數的比值。可以利用支援度的大小來篩選資料。

設是同時購買項商品的人員集合。先從999中商品中找出單項頻繁項集,根據項頻繁項集,找出下一頻繁項集即,並算出其中的支援度,將支援度較小的元素刪除,最終得到結果。

大型超市員工手冊

xx超市員工手冊 顧客是企業利潤的源泉,員工是開啟這一源泉的鑰匙。一 歡迎加入萬隆超市尚品生活微笑館,我們是一支充滿活力的學習型零售業團隊。二 企業文化 企業理念 立德立人追求卓越 經營理念 顧客最大滿意度 服務準則 誠信謙和高效 發展目標 網路化與連鎖化相結合,資訊流與物質流相結合,人性化與專業化...

大型超市管理系統

前言visual foxpro 簡稱vfp 語言是乙個優秀的關係型資料庫管理平台,能夠方便地設計出各種管理資訊系統 mis 同時,vfp支援視覺化介面設計,可以設計豐富多彩的軟體介面 vfp的資料管理功能強大,但是實現非常簡單,高版本的vfp還支援各種現代程式設計技術。隨著計算機的發展,計算機系統的...

某大型超市配送中心選址分析

大型超市或稱綜合超市,英文叫general merchandisestore 簡稱gms 是採取自選銷售方式,以銷售大眾化實用品為主,並將超市和折扣店的經營優勢結合為一體的,品種齊全,滿足顧客一次性購齊的零售業態。大型超市在全世界範圍內蓬勃發展,大眾也越來越多的走進大型超市進行購物。隨著人們在超市進...