資料分析與資料探勘區別

2022-04-27 06:21:02 字數 2120 閱讀 6017

先談資料,其實很簡單,就是觀測值。例如測量資料。不過大家可能有個誤區。

認為,客戶填寫的表單就是資料。對程式設計序而言,是的。但是不是常規的資料。

當然填寫的內容,一旦落入的觀測空間,則自然就成了資料。

不談資料,就無以談資料分析和資料探勘。由此,上面先說了資料。這裡還要說下資訊。

資訊,抽象的說,就是可信的資料。那麼這裡和資料最大的區別就在於,乙個是客觀,乙個是主觀。例如你用尺子量桌子長寬。

那麼的出的值是資料。這是客觀存在的,無論你的尺子是英製還是公制。但對於你而言,你實際上,不會關心實際的長度。

通常你會說,我需要個更長的桌子,或者這個桌子,家裡放不下,太大了,得買個小的。你不會說,小二,來兩尺的桌子。這種主觀對客觀資料的接受和再描述,就是資訊。

區分資料和資訊的最大差別,就是我上面說的,主觀和客觀的差別。如果這個分不清,你做資料分析,和資料探勘,就失去了意義。那麼資料分析,和資料探勘的差異在於,資料分析是手段,資料探勘也是手段。

別噴我。不是錯別字。

資料分析,是對資料的一種操作手段。或者演算法。目標是針對先驗的約束,對資料進行整理,篩選,加工。由此得到資訊。

資料探勘,是對資料分析手段後的資訊,進行價值化的分析。

而資料分析和資料探勘,又是甚至是遞迴的。就是資料分析的結果是資訊,這些資訊作為資料,由去資料探勘。而資料探勘,又使用了資料分析的手段,周而復始。

估計有人要噴我。你這等於說了白說。有點遞迴思想好不好。

這裡再細化說一下。資料分析和資料探勘的最大區別在於,資料分析,是以輸入的資料為基礎,通過先驗的約束,對資料進行處理,但是不以結論何如為調整。例如你需要影象識別,這個屬於資料分析。

你要分析人臉。資料通過你的先驗的方法,就是出來個貓臉。你的資料分析也沒有問題。

你需要默默的承受結果,並且尊重事實。因此資料分析的重點在於資料的有效性,真實性,和先驗約束的正確性。

而資料探勘則不同,資料探勘是對資訊的價值化的獲取。價值化自然不考慮資料本身,而是考慮資料是否有價值。由此,一批資料,你嘗試對它做不同的價值評估,則就是資料探勘。

此時對比資料分析,最大的特點就是,你需要調整你的不同的先驗約束,再次對資料進行分析。而先驗的約束已經不是針對資料**自身的特點,例如訊雜比處理演算法。而是你期望得到的乙個有價值的內容,做先驗的約束。

以觀測,資料根據這個約束,是否有正確的反饋。

說了這麼多,恐怕可能還是有人不清楚。我就舉兩個簡單的例子,諸位如果去面資料分析師,或資料探勘師,不知道怎麼回答時,套用我的例子。

1、你打算送女朋友戒指,那麼你手上有批品牌和款型名單。你按照**,風格,材質分類,得出如下結論,鑽戒比鋼戒貴。大鑽戒比小鑽戒貴,鋼戒款式多。

鑽戒款式少。ok,這就是資料分析。對於一批資料,根據你的先驗約束(按照什麼什麼劃分)獲得的結論。

但是,不是最貴的你的女朋友就最喜歡,女人嘛,感性的動物。也不是最貴的你能買的起。這些資訊的價值,對你沒有意義,你需要的就是用最少的錢,讓你女朋友最開心。

由此你需要資料探勘。最優標準就是,最少的投入,最大的開心。ok。

你需要先驗的去尋找,貴的戒指不買的理由。哪怕從已有資料中得出。比如「鑽戒款式少」或者「大鑽戒也比鋼鑽戒要小」。

同時你要去問問你的女朋友,你覺得怎麼樣才開心啊。當然,如果你女朋友來一句「反正看你皮夾胖的可以卡住門,我就不開心」,那你就得繼續琢磨,我得找個,剛好投入能讓皮夾不卡門的,而且讓女朋友開心的。於是,你又去資料分析,此時實際上是用價值的評價標準,對資料進行價值化因此如果你確定了分析方式,則動作確實是資料分析,但是帶上你確定價值化的評價標準的動作,就是資料探勘了。

最終,你可以得到一堆理由,即少錢,也讓女朋友開心。

2、老婆早上就給你50元,讓你買一天的菜。要求雞豬魚肉俱全,且蛋菜蔥蒜豆品必備。你到菜場,先繞一圈,各個檔口拉拉家常,問問**。

豬肉十幾一斤,魚也不便宜。資料分析下來,計算器,劈里啪啦的按,數字長的比韭菜還快。最後得出一**。

這個就是資料分析。根據客觀資料,先驗的公式,得到的資訊。但對你而言,最大的價值是,用最少的錢,滿足老婆的要求,還可以截留1元買根棒棒糖吃。

那麼你就要開始進行資料探勘了。但是要有評價標準。多少肉算一天的菜量。

梅花,後坐,小排,蹄旁。怎麼個選法,可以讓老婆滿意,同時**落於希望承受的空間範圍。青菜白菜都是菜,便宜營養我最愛,於是,接著設定範圍。

幾個輪迴,包括中飯怎麼配,晚飯怎麼配,最終,到騰出乙個購買方案,這就是資料探勘。

巨集觀資料資料分析

cpi2011年10月份,全國居民消費 總水平同比 5.5 其中,城市 5.4 農村 5.9 食品 11.9 非食品 2.7 消費品 6.6 服務專案 2.8 cpi下降的主要原因分析 10月食品 趨於穩定,受歐元區債務危機進一步擴大的影響,歐元區經濟復甦狀況出現較大幅度的下滑,外圍 大跌 大宗商品...

資料分析總結

1.為何要進行資料分析 1.1 資料可以用來回答一些問題的依據 少,收入下降,為什麼?玩家到達什麼階段?需要什麼?比較喜歡什麼?遇到什麼困難?玩家在 流失比較嚴重?這些問題,都要靠資料來回答。1.2 為什麼要利用資料?網路遊戲是乙個玩家行為的集合,要從這麼多玩家的心理以及玩家的行為中尋找其中的規律,...

資料分析報告

yh qr840 01 公司各部門 我公司是從2010年8月開始貫徹iso9001 2008標準的,從貫標以來,各部門嚴格按標準要求執行。為對過程進行監視和測量,更好的按照標準要求實施,查詢工作中的不足,達到持續改進的目的,實驗室收集有關資料,特作如下資料分析報告 一 顧客滿意度調查 銷售部共下發5...