原創(chuàng)|大數(shù)據(jù)新聞|編輯:蔣永|2019-03-15 11:17:29.000|閱讀 277 次
概述:數(shù)據(jù)挖掘原理已經(jīng)存在了許多年,但是隨著大數(shù)據(jù)的出現(xiàn),它更為流行了。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
數(shù)據(jù)挖掘涉及“處理數(shù)據(jù)和識(shí)別信息中的模式和趨勢(shì)”,根據(jù)IBM所說,“數(shù)據(jù)挖掘原理已經(jīng)存在了許多年,但是隨著大數(shù)據(jù)的出現(xiàn),它更為流行了。”
IBM估計(jì),僅過去的兩年就產(chǎn)生了世界上百分之九十的數(shù)據(jù)。每天人們產(chǎn)生2.5兆字節(jié)的數(shù)據(jù),足以填滿1000萬(wàn)個(gè)藍(lán)光光盤。
數(shù)據(jù)挖掘技術(shù)幫助專業(yè)人員了解可用數(shù)據(jù)集。這些技術(shù)可以為企業(yè)和其他組織提供描述性和預(yù)測(cè)性的能力。
5個(gè)數(shù)據(jù)挖掘技術(shù)
關(guān)聯(lián)規(guī)則使兩個(gè)或多個(gè)項(xiàng)之間的關(guān)聯(lián)以確定它們之間的模式。例如,超市可以確定顧客在買草莓時(shí)也常買鮮奶油,反之亦然。關(guān)聯(lián)通常用于銷售點(diǎn)系統(tǒng),以確定產(chǎn)品之間的共同趨勢(shì)。
“這是一個(gè)非常簡(jiǎn)單的方法,但你會(huì)驚訝與其中有多少智慧和洞察,它可以提供許多企業(yè)的日常使用的信息,來提高效率和增加收入,根據(jù)科技公司Galvanize的說法。應(yīng)用領(lǐng)域包括物品的實(shí)物擺放組織、市場(chǎng)營(yíng)銷和產(chǎn)品的交叉銷售和上銷。
我們可以使用多個(gè)屬性來標(biāo)記特定類別的項(xiàng)。分類將項(xiàng)目分配到目標(biāo)類別或類中,以便準(zhǔn)確地預(yù)測(cè)該類內(nèi)部會(huì)發(fā)生什么。
某些行業(yè)會(huì)將客戶進(jìn)行分類。例如,一家信貸公司可以使用分類模型來確定貸款申請(qǐng)人的低、中或高信用風(fēng)險(xiǎn)。其他組織將當(dāng)前和目標(biāo)受眾分為不同年齡和社會(huì)團(tuán)體進(jìn)行營(yíng)銷活動(dòng)。
“聚類是將數(shù)據(jù)記錄組合在一起的方法”根據(jù)Alex Berson、Stephen Smith和Kurt Thearling在Building Data Mining Applications for CRM這本書中所說。“通常這樣做是為了讓最終用戶對(duì)數(shù)據(jù)庫(kù)中發(fā)生的事情有一個(gè)高層次的認(rèn)識(shí)。”
查看對(duì)象分組情況可以幫助市場(chǎng)細(xì)分領(lǐng)域的企業(yè)。在這個(gè)例子中可以使用聚類將市場(chǎng)細(xì)分為客戶子集。然后,每個(gè)子集可以根據(jù)簇的屬性來制定特定的營(yíng)銷策略,例如在一個(gè)簇中與另一個(gè)簇中的客戶的購(gòu)買模式的對(duì)比。
決策樹用于分類或預(yù)測(cè)數(shù)據(jù)。決策樹從一個(gè)簡(jiǎn)單的問題開始,它有兩個(gè)或多個(gè)的答案。每個(gè)答案將會(huì)引出進(jìn)一步的問題,該問題又可被用于分類或識(shí)別可被進(jìn)一步分類的數(shù)據(jù),或者可以基于每個(gè)答案進(jìn)行預(yù)測(cè)。
應(yīng)用決策樹圖分析手機(jī)供應(yīng)商如何分類流失的客戶,或不更新手機(jī)的客戶。Building Data Mining Applications for CRM的作者為決策樹圖的構(gòu)建提供了一些有趣的值得借鑒的東西。
將數(shù)據(jù)分成多個(gè)葉結(jié)點(diǎn),所有葉結(jié)點(diǎn)的數(shù)據(jù)記錄數(shù)的加和等于輸入數(shù)據(jù)的記錄總數(shù)。例如,父結(jié)點(diǎn)中的數(shù)據(jù)記錄總數(shù)等于其兩個(gè)子結(jié)點(diǎn)中包含的記錄總和。
當(dāng)在決策樹上上下移動(dòng)時(shí),流失前和流失后的客戶數(shù)量是需要存儲(chǔ)的。
能夠很容易的理解模型的構(gòu)建。
如果你需要針對(duì)可能流失的客戶提供一份市場(chǎng)營(yíng)銷方案,則該模型非常易于使用。
公司可以發(fā)展對(duì)其客戶群的直覺;例如,可以得出這樣的結(jié)論,那些多年一直在供應(yīng)商身邊客戶和擁有手機(jī)的客戶往往是忠誠(chéng)的。
序列模式識(shí)別相似事件的趨勢(shì)或通常情況發(fā)生的可能。這種數(shù)據(jù)挖掘技術(shù)經(jīng)常被用來助于理解用戶購(gòu)買行為。許多零售商通過數(shù)據(jù)和序列模式來決定他們用于展示的產(chǎn)品。
“根據(jù)客戶數(shù)據(jù),您可以識(shí)別客戶在一年中不同時(shí)間購(gòu)買的特定的商品集合,”根據(jù)IBM所說,“在購(gòu)物籃應(yīng)用中,你可以使用這些信息自動(dòng)地根據(jù)瀏覽頻率和過去的購(gòu)買歷史記錄來預(yù)測(cè)某些商品會(huì)被添加到購(gòu)物籃中。”
大數(shù)據(jù)趨勢(shì)下,企業(yè)到底如何應(yīng)用?慧都的大數(shù)據(jù)與BI,提供數(shù)據(jù)采集-處理-建模-可視化分析的全方位解決方案,實(shí)現(xiàn)企業(yè)決策智能化!
歡迎咨詢慧都網(wǎng),我們將幫您轉(zhuǎn)接大數(shù)據(jù)與BI顧問,并發(fā)送相關(guān)行業(yè)資料給您!
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn