時間:2022-07-23 10:06:02
序論:在您撰寫電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的運(yùn)用時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的1篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。
1數(shù)據(jù)挖掘過程
在電子商務(wù)進(jìn)行應(yīng)用的數(shù)據(jù)挖掘技術(shù)的實現(xiàn)過程大致要劃分為三個不同的階段:第一部分對需要挖掘的數(shù)據(jù)信息的準(zhǔn)備階段,第二部分對數(shù)據(jù)信息的挖掘階段,第三部分的主要任務(wù)是對數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋與評價.
1.1數(shù)據(jù)信息的準(zhǔn)備準(zhǔn)備部分又可以分成數(shù)據(jù)的選取、數(shù)據(jù)信息的預(yù)處理.對數(shù)據(jù)進(jìn)行選取的主要目的就是對操作對象進(jìn)行確定,即是對目標(biāo)數(shù)據(jù)進(jìn)行確定,所謂的目標(biāo)數(shù)據(jù)是在經(jīng)過對用戶的需要進(jìn)行細(xì)致分析之后,對最有可能得到有利用價值的信息的那些從數(shù)據(jù)庫中抽取出來的數(shù)據(jù).獲取到這些數(shù)據(jù)以后需要進(jìn)行預(yù)處理,主要包含數(shù)據(jù)的去噪、計算缺值數(shù)據(jù)的推導(dǎo)、數(shù)據(jù)類型的轉(zhuǎn)換,數(shù)據(jù)類型轉(zhuǎn)換舉個例子來說比如把連續(xù)型數(shù)據(jù)轉(zhuǎn)化成離散數(shù)據(jù),以方便進(jìn)行符號的歸納.
1.2挖掘過程數(shù)據(jù)信息的挖掘階段是在上一步的基礎(chǔ)之上,即在目標(biāo)數(shù)據(jù)已經(jīng)確定,并且已經(jīng)完成了初始化的基礎(chǔ)之上,需要確定數(shù)據(jù)挖掘的目的與挖掘的類型.在對挖掘任務(wù)的目標(biāo)確定之后,要根據(jù)數(shù)據(jù)挖掘的知識類型選取合適的數(shù)據(jù)挖掘方法,最終完成數(shù)據(jù)挖掘具體操作即采用特定的數(shù)據(jù)挖掘方法從數(shù)據(jù)倉庫中抽取所需的挖掘目標(biāo).
1.3挖掘結(jié)果的解釋和評價數(shù)據(jù)挖掘的結(jié)果的解釋和評價是在完成數(shù)據(jù)挖掘階段之后對發(fā)現(xiàn)的知識,進(jìn)行評估,對于冗余或者無關(guān)的知識要進(jìn)行刪除;對于獲得的知識不符合用戶的要求的要進(jìn)行重新的挖掘.與此同時,因為數(shù)據(jù)挖掘需要面臨用戶,所以,在得到目標(biāo)知識以后還需要對所挖掘的知識附加相關(guān)解釋,來用一種便于用戶理解的方式供用戶使用.綜上所述,整個數(shù)據(jù)信息的挖掘在實際情況下是一個不斷地循環(huán)與反復(fù)的過程,所以要對所挖掘出來的知識不斷求精和深化,最終要獲得用戶所需要的結(jié)果.
2電子商務(wù)中數(shù)據(jù)挖掘的特點(diǎn)
由于電子商務(wù)自身的某些獨(dú)特的特點(diǎn),同其他的應(yīng)用于普通商業(yè)領(lǐng)域中的數(shù)據(jù)挖掘相比,應(yīng)用于電子商務(wù)的數(shù)據(jù)挖掘具有如下幾個特點(diǎn):(1)應(yīng)用于電子商務(wù)的數(shù)據(jù)挖掘的最終目的主要表現(xiàn)在企業(yè)與客戶之間的關(guān)系管理方面,電子商務(wù)利用因特網(wǎng)的技術(shù)能夠使企業(yè)和客戶之間的關(guān)系處理變得更加方便.所以,其主要的功能是怎樣使企業(yè)采用這些頻繁的交流信息,快速的掌握客戶的趨向、改善與客戶交流情況或者獲取交流方向等;(2)電子商務(wù)本身就是一個信息化程度比較高的系統(tǒng),其自身累積的數(shù)據(jù)信息會存放在電子商務(wù)數(shù)據(jù)庫內(nèi),用戶可以比較便捷地得到這些信息,所以對于電子商務(wù)的數(shù)據(jù)挖掘的數(shù)據(jù)信息的準(zhǔn)備階段的相關(guān)工作就變得相對容易;(3)電子商務(wù)領(lǐng)域的數(shù)據(jù)挖掘的主要目標(biāo)一般是使電子商務(wù)系統(tǒng)得到有效的改進(jìn).例如為客戶提供個性化頁面、把用戶比較感興趣的信息展現(xiàn)在網(wǎng)站首頁或得到哪一些商品比較受到客戶的歡迎等.
3電子商務(wù)中的數(shù)據(jù)挖掘運(yùn)用
首先要講的是關(guān)聯(lián)規(guī)則在電子商務(wù)中的運(yùn)用,利用比較通俗的語言來講,從一個事件的發(fā)生與否方面進(jìn)行解釋,所謂的關(guān)聯(lián)規(guī)則法在大量的事件發(fā)生或者不發(fā)生的條件下,對這些事件中的任意兩個或者多個事件提取出來,通過一定的統(tǒng)計分析算法,最終確定兩個或者多個事件的發(fā)生與否是否存在著某種關(guān)系,而這種可能存在的管理,我們稱之為關(guān)聯(lián)規(guī)則.列舉一個有趣的故事,就是在一個超市里面,店家把小孩的尿布同啤酒放到了一起,來供購買者進(jìn)行購買,結(jié)果是二者的銷量都提升了一倍,其實這就是因為二者之間有著某種潛在聯(lián)系,店家通過數(shù)據(jù)挖掘的方法發(fā)現(xiàn)的這個規(guī)則,并對這一關(guān)聯(lián)規(guī)則進(jìn)行了實際的運(yùn)用,從中得到了益處.同樣在電子商務(wù)中通過數(shù)據(jù)挖掘得到關(guān)聯(lián)規(guī)則,有著類似的意義.其次在電子商務(wù)中數(shù)據(jù)挖掘聚類分析方法的應(yīng)用.在大量數(shù)據(jù)倉庫中,數(shù)據(jù)與數(shù)據(jù)之間,往往會有某些性質(zhì)的類型相似,同樣也會有某些性質(zhì)或者特點(diǎn)相異,我們把這些性質(zhì)或者特點(diǎn)稱為觀察指標(biāo),聚類分析就是對于某一個特點(diǎn)指標(biāo)而言,把指標(biāo)相差不多的數(shù)據(jù)劃分為同一個類型,若相差較大則要劃分為不同的類型、這種操作的主要意義就是將具有某種特定的相似特性的客戶或者數(shù)據(jù)分成一個類.在電子商務(wù)活動中,這一方法的應(yīng)用主要集中在市場細(xì)分的工作之中.分類分析系統(tǒng)的建立以生物的遺傳算法為基礎(chǔ),屬于其中的自學(xué)習(xí)的一種,它一般會包含三個子系統(tǒng),第一個是以串規(guī)則為基礎(chǔ)的并行生成子系統(tǒng)、第二個是規(guī)則評價子系統(tǒng).第三個是遺傳算法子系統(tǒng).分類分析可以說是電子商務(wù)中運(yùn)用到數(shù)據(jù)挖掘最多的一種挖掘方式.主要原因就是在于其能夠形成一種預(yù)測模型能夠?qū)σ恍I銷方式或者其他的一些商業(yè)措施做出正確的預(yù)測.
4數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用
更高效的利用企業(yè)現(xiàn)有資源以及開發(fā)新資源是當(dāng)代企業(yè)發(fā)展的關(guān)鍵.電子商務(wù)通過采用數(shù)據(jù)挖掘的技術(shù),能夠更加及時和正確的獲得企業(yè)當(dāng)前所有資源的具體使用情況,而且通過數(shù)據(jù)挖掘的技術(shù)可以分析以往的各種企業(yè)數(shù)據(jù),比如說企業(yè)財務(wù)數(shù)據(jù)、企業(yè)庫存數(shù)據(jù)或者企業(yè)交易數(shù)據(jù),能夠較為及時的發(fā)現(xiàn)企業(yè)資源過度消耗的主要問題所在,或者能夠得到各種商務(wù)活動的投入與產(chǎn)出的比例,來為企業(yè)領(lǐng)導(dǎo)進(jìn)行經(jīng)營決策提供有力的根據(jù)[6].另外在企業(yè)的經(jīng)營過程中,人們不斷推崇“以客戶為中心”的經(jīng)營理念,在這一趨勢下,如何正確快速的分析和了解客戶的需求已成為企業(yè)提高自身市場競爭力的一大課題.通過把數(shù)據(jù)挖掘應(yīng)用到電子商務(wù)之中,能夠使企業(yè)最準(zhǔn)確的分析客戶資源并最有效的利用企業(yè)客戶資源,通過對已有客戶行為進(jìn)行相關(guān)性分析,可以形成潛在客戶資源的預(yù)測模型.除此之外在企業(yè)經(jīng)營過程中,利用數(shù)據(jù)挖掘可以解決另外一個嚴(yán)重影響了商業(yè)正常秩序的重要問題.即當(dāng)前時區(qū)商務(wù)活動中的地下的信用狀況問題,這一問題的嚴(yán)重程度已經(jīng)引起了人們的廣泛關(guān)注.在電子商務(wù)經(jīng)營過程中,因為網(wǎng)上詐騙公司或者企業(yè)財務(wù)的現(xiàn)象屢見不鮮,信用危機(jī)已經(jīng)成為影響其快速正常發(fā)展的一個重要因素.而通過在電子商務(wù)中采用數(shù)據(jù)挖掘技術(shù)實現(xiàn)對企業(yè)經(jīng)營活動的跟蹤,在此基礎(chǔ)上實現(xiàn)企業(yè)的資產(chǎn)評估、利潤收益分析以及發(fā)展?jié)摿︻A(yù)測分析等,為電子商務(wù)在經(jīng)營過程中提供了完善的安全保障體系,同時利用數(shù)據(jù)挖掘?qū)崿F(xiàn)企業(yè)網(wǎng)上全程監(jiān)控.另外通過實現(xiàn)基于數(shù)據(jù)挖掘的信用評估模型,可以在很大程度上進(jìn)行防范或者化解信用風(fēng)險,從而提高企業(yè)的信用度以及應(yīng)對風(fēng)險能力.
5結(jié)束語
電子商務(wù)是而今信息化時代進(jìn)步的產(chǎn)物,在未來的幾年內(nèi)電子商務(wù)必將會成為商業(yè)中存在的主要運(yùn)營模式.隨著時間的積累,各種電子商務(wù)都會得到巨大的數(shù)據(jù)信息資源,這也是數(shù)據(jù)挖掘在電子商務(wù)中應(yīng)用的基本條件.從另外一方面而言,隨著數(shù)據(jù)挖掘在電子商務(wù)方面中的不斷深入研究與發(fā)展,已經(jīng)能夠向電子商務(wù)系統(tǒng)提供必不可少的技術(shù)支持,促進(jìn)了電子商務(wù)的發(fā)展與普及。
作者:張莉單位:合肥工業(yè)大學(xué)淮北職業(yè)技術(shù)學(xué)院
[摘要]電子商務(wù)的廣泛應(yīng)用使企業(yè)產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),按企業(yè)既定業(yè)務(wù)目標(biāo)對這些數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘可以幫助企業(yè)分析出完成任務(wù)所需的關(guān)鍵因素。文章介紹了數(shù)據(jù)挖掘技術(shù),以實例分析了數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用,并介紹了在電子商務(wù)中如何應(yīng)用數(shù)據(jù)挖掘技術(shù)。
[關(guān)鍵詞]電子商務(wù);數(shù)據(jù)挖掘;路徑分析
隨著Internet的普及,電子商務(wù)的興起,人們的商務(wù)理念正在改變,電子商務(wù)的廣泛應(yīng)用使企業(yè)產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),如何更快、更好地利用各種有效的數(shù)據(jù)更好地開展電子商務(wù),這是目前電子商務(wù)急需解決的問題。
一、數(shù)據(jù)挖掘技術(shù)
20世紀(jì)90年代以來,隨著信息技術(shù)和數(shù)據(jù)庫技術(shù)的迅猛發(fā)展,人們可以非常方便地獲取和存儲大量的數(shù)據(jù)。面對大規(guī)模的海量的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)分析工具(如管理信息系統(tǒng))只能進(jìn)行一些表層的處理(如查詢、統(tǒng)計等),而不能獲得數(shù)據(jù)之間的內(nèi)在關(guān)系和隱含的信息。為了擺脫“數(shù)據(jù)豐富,知識貧乏”的困境,人們迫切需要一種能夠智能地自動地把數(shù)據(jù)轉(zhuǎn)換成有用信息和知識的技術(shù)和工具,這種對強(qiáng)有力數(shù)據(jù)分析工具的迫切需求使得數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。人們認(rèn)識到數(shù)據(jù)庫中存儲的數(shù)據(jù)量急劇增大,在大量的數(shù)據(jù)背后隱藏著許多重要的信息,如果能把這些信息從數(shù)據(jù)庫中抽取出來,將為公司創(chuàng)造很多潛在的利潤。這種從海量數(shù)據(jù)庫中挖掘信息的技術(shù),就稱之為數(shù)據(jù)挖掘。數(shù)據(jù)挖掘一般有以下四類主要任務(wù):
(一)數(shù)據(jù)總結(jié)
數(shù)據(jù)挖掘能夠?qū)?shù)據(jù)庫中的有關(guān)數(shù)據(jù)從較低的個體層次抽象總結(jié)到較高的總體層次上,從而實現(xiàn)對原始基本數(shù)據(jù)的總體把握。
(二)分類
分析數(shù)據(jù)的各種屬性,并找出數(shù)據(jù)的屬性模型,確定哪些數(shù)據(jù)屬于哪些組。這樣我們就可以利用該模型來分析已有數(shù)據(jù),并預(yù)測新數(shù)據(jù)將屬于哪一個組。
(三)關(guān)聯(lián)分析
數(shù)據(jù)庫中的數(shù)據(jù)一般都存在著關(guān)聯(lián)關(guān)系,也就是說,兩個或多個變量的取值之間存在某種規(guī)律性。通過挖掘數(shù)據(jù)派生關(guān)聯(lián)規(guī)則,可以了解客戶的行為。
(四)聚類
聚類分析是按照某種相近程度度量方法,將用戶數(shù)據(jù)分成一系列有意義的子集合。每一個集合中的數(shù)據(jù)性質(zhì)相近,不同集合之間的數(shù)據(jù)性質(zhì)相差較大。
數(shù)據(jù)挖掘的特點(diǎn)和性質(zhì)對于企業(yè)而言,有助于發(fā)現(xiàn)其企業(yè)業(yè)務(wù)發(fā)展的趨勢,揭示已知的事實,預(yù)測未知的結(jié)果,并幫助企業(yè)分析出完成任務(wù)所需的關(guān)鍵因素,以達(dá)到增加收入,降低成本,使企業(yè)處于更有利的競爭位置的目的。
二、數(shù)據(jù)挖掘在電子商務(wù)中的作用
數(shù)據(jù)挖掘技術(shù)源于商業(yè)的直接需求,因此它在各種商業(yè)領(lǐng)域都存在廣泛的使用價值。電子商務(wù)是商業(yè)領(lǐng)域的一種新興商務(wù)模式,是指利用電子信息技術(shù)開展一切商務(wù)活動。當(dāng)電子商務(wù)在企業(yè)中得到應(yīng)用時,企業(yè)信息系統(tǒng)將產(chǎn)生大量數(shù)據(jù),這些海量數(shù)據(jù)使數(shù)據(jù)挖掘有了豐富的數(shù)據(jù)基礎(chǔ),同時高性能計算機(jī)和高傳輸速率網(wǎng)絡(luò)的使用也給數(shù)據(jù)挖掘技術(shù)提供了堅實的保障。因此數(shù)據(jù)挖掘技術(shù)在電子商務(wù)活動中有了更大的用武之地。下面介紹數(shù)據(jù)挖掘在以下電子商務(wù)幾個方面的作用:
(一)客戶細(xì)分
隨著“以客戶為中心”的經(jīng)營理念的不斷深入人心,分析客戶、了解客戶并引導(dǎo)客戶的需求已成為企業(yè)經(jīng)營的重要課題。通過對電子商務(wù)系統(tǒng)收集的交易數(shù)據(jù)進(jìn)行分析,可以按各種客戶指標(biāo)(如自然屬性、收入貢獻(xiàn)、交易額、價值度等)對客戶分類,然后確定不同類型客戶的行為模式,以便采取相應(yīng)的營銷措施,促使企業(yè)利潤的最大化。
(二)客戶獲得
利用數(shù)據(jù)挖掘可以有效地獲得客戶。比如通過數(shù)據(jù)挖掘可以發(fā)現(xiàn)購買某種商品的消費(fèi)者是男性還是女性,學(xué)歷、收入如何,有什么愛好,是什么職業(yè)等等。甚至可以發(fā)現(xiàn)不同的人在購買該種商品的相關(guān)商品后多長時間有可能購買該種商品,以及什么樣的人會購買什么型號的該種商品等等。也許很多因素表面上看起來和購買該種商品不存在任何聯(lián)系,但數(shù)據(jù)挖掘的結(jié)果卻證明它們之間有聯(lián)系。在采用了數(shù)據(jù)挖掘后,針對目標(biāo)客戶發(fā)送的廣告的有效性和回應(yīng)率將得到大幅度的提高,推銷的成本將大大降低。
(三)客戶保持
數(shù)據(jù)挖掘可以把你大量的客戶分成不同的類,在每個類里的客戶擁有相似的屬性,而不同類里的客戶的屬性也不同。你完全可以做到給不同類的客戶提供完全不同的服務(wù)來提高客戶的滿意度。數(shù)據(jù)挖掘還可以發(fā)現(xiàn)具有哪些特征的客戶有可能流失,這樣挽留客戶的措施將具有針對性,挽留客戶的費(fèi)用將下降。
(四)交叉銷售
交叉銷售可以使企業(yè)比較容易地得到關(guān)于客戶的豐富的信息,而這些大量的數(shù)據(jù)對于數(shù)據(jù)挖掘的準(zhǔn)確性來說是有很大幫助的。在企業(yè)所掌握的客戶信息,尤其是以前購買行為的信息中,可能正包含著這個客戶決定他下一個購買行為的關(guān)鍵,甚至決定因素。這個時候數(shù)據(jù)挖掘的作用就會體現(xiàn)出來,它可以幫助企業(yè)尋找到這些影響他購買行為的因素。
(五)個性服務(wù)
當(dāng)客戶在電子商務(wù)網(wǎng)站注冊時,客戶將會看到帶有客戶姓名的歡迎詞。根據(jù)客戶的訂單紀(jì)錄,系統(tǒng)可以向客戶顯示那些可能引起客戶特殊興趣的新商品。當(dāng)客戶注意到一件特殊的商品時,系統(tǒng)會建議一些在購買中可以增加的其他商品。普通的產(chǎn)品目錄手冊常常簡單地按類型對商品進(jìn)行分組,以簡化客戶挑選商品的步驟。然而對于在線商店,商品分組可能是完全不同的,它常常以針對客戶的商品補(bǔ)充條目為基礎(chǔ)。不僅考慮客戶看到的條目,而且還考慮客戶購物籃中的商品。使用數(shù)據(jù)挖掘技術(shù)可以使推薦更加個性化。
(六)資源優(yōu)化
節(jié)約成本是企業(yè)盈利的關(guān)鍵。通過分析歷史的財務(wù)數(shù)據(jù)、庫存數(shù)據(jù)和交易數(shù)據(jù),可以發(fā)現(xiàn)企業(yè)資源消耗的關(guān)鍵點(diǎn)和主要活動的投入產(chǎn)出比例,從而為企業(yè)資源優(yōu)化配置提供決策依據(jù),例如降低庫存、提高庫存周轉(zhuǎn)率、提高資金使用率等。
(七)異常事件的確定
在許多商業(yè)領(lǐng)域中,異常事件具有顯著的商業(yè)價值,如客戶流失、銀行的信用卡欺詐、電信中移動話費(fèi)拖欠等。通過數(shù)據(jù)挖掘中的奇異點(diǎn)分析可以迅速準(zhǔn)確地甄別這些異常事件。
由此可見數(shù)據(jù)挖掘在電子商務(wù)中有著重要的作用。在生活中采用數(shù)據(jù)挖掘的成功的例子很多。例如總部位于美國阿肯色州的WalMart零售商的“尿布與啤酒”的故事。WalMart擁有世界上最大的數(shù)據(jù)倉庫系統(tǒng),它利用數(shù)據(jù)挖掘工具對數(shù)據(jù)倉庫中的原始交易數(shù)據(jù)進(jìn)行分析,得到了一個意外發(fā)現(xiàn):跟尿布一起購買最多的商品竟然是啤酒。如果不是借助于數(shù)據(jù)倉庫和數(shù)據(jù)挖掘,商家決不可能發(fā)現(xiàn)這個隱藏在背后的事實:在美國,一些年輕的父親下班后經(jīng)常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時也為自己買一些啤酒。有了這個發(fā)現(xiàn)后,超市調(diào)整了貨架的擺放,把尿布和啤酒放在一起,明顯增加了銷售額。
三、電子商務(wù)中如何應(yīng)用數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘在電子商務(wù)中有廣泛的應(yīng)用。那么在電子商務(wù)中是如何應(yīng)用數(shù)據(jù)挖掘技術(shù)的?
首先,從挖掘過程說,對在線訪問客戶數(shù)據(jù)的挖掘主要有兩部分:一部分是客戶訪問信息的挖掘,另一部分是客戶登記信息的挖掘。面對大量的訪問日志,首先要做的就是對數(shù)據(jù)進(jìn)行清洗,即預(yù)處理,把無關(guān)的數(shù)據(jù),不重要的數(shù)據(jù)等處理掉;接著對數(shù)據(jù)進(jìn)行事務(wù)識別,通過對事務(wù)進(jìn)行劃分后,就可以根據(jù)具體的分析需求選擇模式發(fā)現(xiàn)的技術(shù),如路徑分析、興趣關(guān)聯(lián)規(guī)則、聚類等。通過模式分析,找到有用的信息,再通過聯(lián)機(jī)分析(OLAP)的驗證,結(jié)合客戶登記信息,找出有價值的市場信息,或發(fā)現(xiàn)潛在的市場。
其次,挖掘方法主要有以下幾種:
1.路徑分析
路徑分析是一種找尋頻繁訪問路徑的方法,它通過對Web服務(wù)器的日志文件中客戶訪問站點(diǎn)的訪問次數(shù)分析,挖掘出頻繁訪問路徑。例如:一客戶從某一站點(diǎn)訪問到某一感興趣的頁面后就會經(jīng)常訪問該頁面,通過路徑分析確定頻繁訪問路徑,可以了解客戶對哪些頁面感興趣,(下轉(zhuǎn)第78頁)(上接第80頁)從而更好地改進(jìn)設(shè)計,為客戶服務(wù)。
2.興趣關(guān)聯(lián)規(guī)則
當(dāng)客戶訪問某一網(wǎng)頁時,一般會通過興趣詞條找出相關(guān)的興趣網(wǎng)頁通過鏈接繼續(xù)訪問,這種關(guān)聯(lián)產(chǎn)生的數(shù)據(jù)如果能夠按照某種策略進(jìn)行挖掘分析,統(tǒng)計出客戶訪問某些頁面及興趣關(guān)聯(lián)頁面的比率,就可以很好地組織站點(diǎn),實施有效的市場策略。
3.聚類分析
聚類分析是電子商務(wù)中很重要的一個方面,通過分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,更好地幫助電子商務(wù)的用戶了解自己的客戶,向客戶提供更合適的服務(wù)。如通過對眾多的瀏覽“camera”網(wǎng)頁的客戶分析,發(fā)現(xiàn)在該網(wǎng)頁上經(jīng)?;ㄒ欢螘r間瀏覽的客戶,再通過對這部分客戶的登記資料分析,知道這些客戶是潛在要買相機(jī)的客戶群體。就可以調(diào)整“camera”網(wǎng)頁的內(nèi)容和風(fēng)格,以適應(yīng)客戶的需要。
通過以上幾種數(shù)據(jù)分析的方法可以有效地對電子商務(wù)中的信息進(jìn)行分析,從而更有效地開展電子商務(wù)。
目前,數(shù)據(jù)挖掘技術(shù)正以前所未有的速度發(fā)展,并且擴(kuò)大著用戶群體,在未來越來越激烈的市場競爭中,擁有數(shù)據(jù)挖掘技術(shù)必將比別人獲得更快速的反應(yīng),贏得更多的商業(yè)機(jī)會?,F(xiàn)在世界上的主要數(shù)據(jù)庫廠商紛紛開始把數(shù)據(jù)挖掘功能集成到自己的產(chǎn)品中,加快數(shù)據(jù)挖掘技術(shù)的發(fā)展。我國在這一領(lǐng)域正處在研究開發(fā)階段,加快研究數(shù)據(jù)挖掘技術(shù),并把它應(yīng)用于電子商務(wù)中,應(yīng)用到更多行業(yè)中,勢必會有更好的商業(yè)機(jī)會和更光明的前景。
摘要:本文從浙江電子商務(wù)發(fā)展概況出發(fā),介紹了數(shù)據(jù)挖掘技術(shù),分析了數(shù)據(jù)挖掘技術(shù)在浙江電子商務(wù)中應(yīng)用的可行性。
關(guān)鍵詞:數(shù)據(jù)挖掘;浙江;電子商務(wù)
當(dāng)前,電子商務(wù)正在全國范圍內(nèi)迅猛發(fā)展,隨著國務(wù)院《關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》、《關(guān)于大力發(fā)展電子商務(wù)加快培育經(jīng)濟(jì)新動力的意見》等一系列的政策落地,“農(nóng)村電商、跨境電商、行業(yè)電商”等多種電商模式迎來了重要發(fā)展機(jī)遇。浙江的電子商務(wù)起步早、發(fā)展快、創(chuàng)新性強(qiáng),在全國電商市場里名列前茅,已經(jīng)成為浙江經(jīng)濟(jì)發(fā)展重要的增長極,產(chǎn)生了巨大的經(jīng)濟(jì)效應(yīng)和社會效應(yīng)。
1浙江電子商務(wù)發(fā)展概況
1.1電商服務(wù)發(fā)達(dá)
2015年浙江省實現(xiàn)網(wǎng)絡(luò)零售額7610.62億元,同比增長49.9%,總量居全國第二位,超額完成“十二五”規(guī)劃目標(biāo)。網(wǎng)絡(luò)零售額與社會消費(fèi)品零售總額比值達(dá)38%,遠(yuǎn)遠(yuǎn)高于全國約15%的水平。各類電子商務(wù)市場主體蓬勃發(fā)展,擁有各類活躍網(wǎng)店100多萬家,天貓網(wǎng)店近2.5萬家,跨境電商經(jīng)營主體近4萬個,電商服務(wù)企業(yè)3000家左右,其中規(guī)模以上電子商務(wù)服務(wù)企業(yè)約1000家;建有電商產(chǎn)業(yè)基地204個;電子商務(wù)帶動直接就業(yè)超過200萬人。
1.2線上線下高度融合
浙江是制造業(yè)大省,也是電子商務(wù)大省。成熟的市場環(huán)境,促成線上線下的高度融合。以金華為例,線下有“義烏小商品市場”、“永康五金市場”等國內(nèi)乃至國際一流的行業(yè)市場,依托這些實體市場的突出優(yōu)勢,著力打造“義烏購”、“尚五金”等線上平臺,構(gòu)建線上線下高度融合的市場環(huán)境。
2數(shù)據(jù)挖掘技術(shù)初探
2.1數(shù)據(jù)挖掘簡介
數(shù)據(jù)挖掘技術(shù)起源于20世紀(jì)80年代,它是從數(shù)據(jù)庫海量數(shù)據(jù)中提取使用者所感興趣的知識、數(shù)據(jù)和規(guī)律,進(jìn)行深入的分析,提取隱含在其中的、潛在有用的信息,為使用者提供決策支持。從電子商務(wù)的角度來看,它的主要作用是從電子商務(wù)活動中抽取大量數(shù)據(jù),進(jìn)行轉(zhuǎn)讓、分析和模式化處理,從中獲得能幫助電子商務(wù)企業(yè)決策的關(guān)鍵信息,即從電子商務(wù)大量業(yè)務(wù)數(shù)據(jù)中尋找隱含的商機(jī)或者新的商業(yè)模式。
2.2數(shù)據(jù)挖掘在電子商務(wù)領(lǐng)域的應(yīng)用
在電商商務(wù)活動的過程中,電商企業(yè)積累了大量的銷售記錄、瀏覽記錄、消費(fèi)和服務(wù)記錄等數(shù)據(jù),隨著電子商務(wù)不斷發(fā)展,相關(guān)數(shù)據(jù)不斷的膨脹擴(kuò)大,在堆積如山的數(shù)據(jù)中包含著許多待提取的有用知識,這些有用知識進(jìn)行挖掘是非常有意義的。數(shù)據(jù)挖掘有助于電商企業(yè)識別客戶購買行為,發(fā)現(xiàn)客戶的購買模式及趨勢,便于電商企業(yè)改進(jìn)銷售模式、提高服務(wù)質(zhì)量,提高客戶的用戶體驗。并且,可以根據(jù)海量數(shù)據(jù)分析,提高貨品銷售比率,優(yōu)化物流和分銷策略,進(jìn)一步降低成本。1)分析客戶的購買行為和習(xí)慣。例如“男性客戶購買尿不濕的同時會購買啤酒”,“該女性客戶對化妝品和護(hù)膚品的品牌偏好”,“某客戶偏好折扣商品”,這些信息雖然看起來微不足道,卻非常有用,電商企業(yè)可以根據(jù)客戶購買行為和習(xí)慣向客戶推送他們偏好的信息。2)分析電商企業(yè)的商品構(gòu)成。將各類商品按盈利水平和銷售情況進(jìn)行分類,挖掘同類商品的共同特征,提取有用信息。幫助企業(yè)決策市場定位、商品定價等問題。3)數(shù)據(jù)挖掘還可以幫助企業(yè)進(jìn)行銷售商品預(yù)測、商品價格分析等,在浙江線上線下高度融合的市場環(huán)境下,電商企業(yè)可以挖掘商品價格、銷售和物流信息的關(guān)聯(lián),合理安排線上線下商品銷售模式,提高企業(yè)運(yùn)營效率,降低銷售成本。
3結(jié)束語
浙江電子商務(wù)的快速發(fā)展,各類電商企業(yè)在這片土地上生根發(fā)芽,數(shù)量不斷增多,市場競爭日趨激烈。有效的利用數(shù)據(jù)挖掘工具,挖掘隱含在海量數(shù)據(jù)中的有用信息,能夠使企業(yè)做出正常的市場決策,保持有力的競爭優(yōu)勢,贏得消費(fèi)者的青睞。隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘的不斷深入,電子商務(wù)數(shù)據(jù)挖掘的研究和應(yīng)用必將取得長遠(yuǎn)的發(fā)展。
作者:陳麗燕 何士產(chǎn) 洪改艷 單位:上海財經(jīng)大學(xué)浙江學(xué)院
1數(shù)據(jù)挖掘的概念及其過程
1.1數(shù)據(jù)挖掘
數(shù)據(jù)挖掘,即在數(shù)據(jù)庫中的信息發(fā)現(xiàn),是指在大量的、不完整的、模糊的、有噪音的和隨機(jī)的數(shù)據(jù)中,提取出潛在的、不為人知的、同時又是非常有用的知識和信息的過程。數(shù)據(jù)挖掘是一項應(yīng)用技術(shù)廣泛的交叉學(xué)科,它聚集了眾多不同領(lǐng)域的知識,例如人工智能、可視化、數(shù)據(jù)庫、數(shù)理統(tǒng)計等。從始至終數(shù)據(jù)挖掘技術(shù)都是面向應(yīng)用領(lǐng)域,不僅是對于特定數(shù)據(jù)庫的簡單檢索查詢,還包括對數(shù)據(jù)的不同層面、不同角度的統(tǒng)計、分析、推理和綜合,以此得到問題的求解,以及發(fā)現(xiàn)事件之間的聯(lián)系,還有對未發(fā)生活動的預(yù)測。另外數(shù)據(jù)挖掘技術(shù)在存在大量數(shù)據(jù)積累的電子商務(wù)行業(yè)有著廣泛的應(yīng)用,是現(xiàn)代商務(wù)企業(yè)發(fā)展的不二選擇。
1.2數(shù)據(jù)挖掘的過程
1.2.1數(shù)據(jù)預(yù)處理
在實際情況中,企業(yè)獲得的數(shù)據(jù)具有不完整性、模糊性和冗余性,所以數(shù)據(jù)挖掘技術(shù)針對的不是已得到的數(shù)據(jù),而是潛在的數(shù)據(jù)信息,并通過預(yù)處理技術(shù)獲得簡潔、準(zhǔn)確的數(shù)據(jù)。預(yù)處理的工作分為三步,數(shù)據(jù)合并、數(shù)據(jù)選擇和數(shù)據(jù)清洗。先將多個數(shù)據(jù)庫和文件中的數(shù)據(jù)進(jìn)行合并,然后選擇適合分析的數(shù)據(jù)信息集合,最后剔除無關(guān)記錄,并將各個文件轉(zhuǎn)換成方便數(shù)據(jù)挖掘的格式。
1.2.2模式發(fā)現(xiàn)
這個階段就是利用挖掘計算技術(shù)挖掘出有用的、潛在的、新穎的、可以理解的知識和信息。像關(guān)聯(lián)分析、聚類分析、路徑選擇、序列分析等都可以用于Web的挖掘技術(shù)。
1.2.3模式分析
這個階段是將模式發(fā)現(xiàn)中沒有用的模式和規(guī)則過濾掉。通過技術(shù)分析,得到有效的結(jié)論。常用關(guān)聯(lián)規(guī)則、序列等手段。
2數(shù)據(jù)挖掘技術(shù)的方法
2.1關(guān)聯(lián)分析
所謂的關(guān)聯(lián)分析,就是利用數(shù)據(jù)間相互關(guān)聯(lián)的規(guī)則進(jìn)行數(shù)據(jù)挖掘,為的是挖掘數(shù)據(jù)間潛在的聯(lián)系規(guī)則。比如,在進(jìn)行關(guān)聯(lián)分析時,能發(fā)現(xiàn)類似哪些產(chǎn)品更受客戶的歡迎、為什么、產(chǎn)品優(yōu)勢有哪些、有多少客戶會再次購買等問題。
2.2序列模式分析
這個過程和第一個關(guān)聯(lián)分析有些類似,但主要任務(wù)是發(fā)現(xiàn)數(shù)據(jù)間的前后順序聯(lián)系,比如在這段時間里,企業(yè)先銷售出x產(chǎn)品,隨后銷售y產(chǎn)品,然后是z產(chǎn)品,所以就形成x-y-z的銷售序列,出現(xiàn)頻率較高,進(jìn)而對其進(jìn)行分析。序列模式分析工作方向是:在指定的交易數(shù)據(jù)庫中,找出按照時間排布的交易集,發(fā)現(xiàn)其中的高頻序列,從而進(jìn)行下一個步驟。
2.3分類分析
假設(shè)有一個數(shù)據(jù)庫和一組互相區(qū)別的標(biāo)記,利用特殊標(biāo)記數(shù)據(jù)庫中的每一個數(shù)據(jù),這樣的數(shù)據(jù)庫被叫做訓(xùn)練集或者實例數(shù)據(jù)庫。分類分析就是利用分析標(biāo)記數(shù)據(jù)庫中的每一個數(shù)據(jù),對每個類別建立分析模型或做出精準(zhǔn)的描述或者挖掘出分析模型,然后利用分類模式對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分類分析。
2.4聚類分析
聚類分析所根據(jù)的分類規(guī)則主要取決于聚類分析工具。不同的聚類方法,對于同樣的記錄集合會有不同的劃分結(jié)果。聚類分析針對的未分類的記錄,而且所有記錄適合分成幾類,事先也不知情,然后依據(jù)一定的分類規(guī)則,分析記錄數(shù)據(jù),確定每一個數(shù)據(jù)所對應(yīng)的類別。
3數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用
3.1優(yōu)化企業(yè)資源
企業(yè)盈利的關(guān)鍵是節(jié)約成本,利用數(shù)據(jù)挖掘技術(shù)可以找到企業(yè)消耗資源的關(guān)鍵點(diǎn)和各種活動的投入與產(chǎn)出比例,進(jìn)而為企業(yè)提供科學(xué)合理的調(diào)整方案,例如資源循環(huán)利用、降低庫存等方法。通過數(shù)據(jù)挖掘技術(shù),企業(yè)可以預(yù)先知道市場上的商業(yè)信息,使企業(yè)把握市場動態(tài),創(chuàng)造更多的盈利。
3.2管理客戶資料
俗話說知己知彼,百戰(zhàn)不殆。對于企業(yè)來說,了解客戶是至關(guān)重要的,比如客戶是男是女、愛好是什么、職業(yè)是什么等,從而根據(jù)不同客戶需求,改善網(wǎng)絡(luò)結(jié)構(gòu),推出個性化網(wǎng)頁,吸引更多的客戶對本企業(yè)的關(guān)注。例如對電子商務(wù)網(wǎng)站的網(wǎng)站流量進(jìn)行分析。人們在點(diǎn)擊或者是訪問某一個網(wǎng)站的同時,就將個人對網(wǎng)站內(nèi)容的反饋信息反映了出來,用戶點(diǎn)擊了哪一個鏈接,在哪個網(wǎng)頁中停留的時間最長,采用了哪個搜索的項目或者是總共使用的瀏覽時間等信息都會被保存在網(wǎng)站中,將這些信息保存下來,進(jìn)行數(shù)據(jù)分析,能夠有效的確定用戶的訪問特點(diǎn)以及產(chǎn)品特征,從而提高電子商務(wù)信息提供的精確性。
3.3評估商業(yè)信譽(yù)
一個企業(yè)若是沒有良好的商業(yè)信譽(yù)做基礎(chǔ),一切都是空口說白話。所以建立有效的商業(yè)評估制度就成了重中之重。利用數(shù)據(jù)挖掘技術(shù)對企業(yè)營銷進(jìn)行追蹤,開展資產(chǎn)評估、發(fā)展?jié)摿︻A(yù)測以及利潤收益分析,建立完善的安全系統(tǒng),對企業(yè)商譽(yù)安全進(jìn)行保障,可以有效的預(yù)防和解決信用風(fēng)險,提高企業(yè)信譽(yù)度。例如,商品售賣出去,要進(jìn)行科學(xué)有效的跟蹤,了解客戶用后體驗,對客戶使用產(chǎn)品情況進(jìn)行追蹤式分析,開展科學(xué)合理的資產(chǎn)評估,不斷發(fā)展?jié)撛谟脩趔w驗,通過客戶的反饋信息進(jìn)行綜合性分析,提高客戶滿意度,提高商家的信用。
3.4確定異常事件
在商業(yè)領(lǐng)域中,確定異常事件具有十分重要的商業(yè)價值。在企業(yè)經(jīng)營時間里,經(jīng)常會有異常事件發(fā)生,例如話費(fèi)拖欠、客戶流失、信用卡欺詐等,通過數(shù)據(jù)挖掘技術(shù)中的異常點(diǎn)分析可以十分準(zhǔn)確快速地發(fā)現(xiàn)異常點(diǎn),使企業(yè)及時修整系統(tǒng),減少不必要損失。例如,當(dāng)客戶將商品加入購物車后,對沒有付款的原因進(jìn)行科學(xué)合理的分析,從而確定要催付的客戶群體。這種催付的行為在一定程度上可能會打擾到客戶,所以需要準(zhǔn)確的分析其真正的原因。例如客戶沒有付款的主要原因為:遺忘、沖動消費(fèi)不想買了、貨比三家,發(fā)現(xiàn)更好地商品、支付發(fā)生故障等。這個時候就需要商家對號入座,確定是否要進(jìn)行客戶催付。這就需要數(shù)據(jù)挖掘技術(shù)發(fā)揮自身的優(yōu)勢,進(jìn)行數(shù)據(jù)分析,提出相應(yīng)的解決方案。在催付時間的選擇上,根據(jù)數(shù)據(jù)挖掘技術(shù)的分析通常情況下理論上在第三天進(jìn)行催付是最為合理的,因為在第二天有不少會自發(fā)付款的客戶。同時還需要考慮到女性消費(fèi)者沖動購物的習(xí)慣,過了這個沖動期就不容易再購買。所以實際上要在客戶下單的第二天進(jìn)行催付最為合理。在擬定催付內(nèi)容的時候需要科學(xué)分析客戶一天各個時間段的情緒變化,減少客戶對商家的排斥與厭煩的心理。
4結(jié)語
隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,電子商務(wù)已經(jīng)成為現(xiàn)如今經(jīng)濟(jì)發(fā)展的主要方式。數(shù)據(jù)挖掘技術(shù)是電子商務(wù)發(fā)展的重要手段。利用數(shù)據(jù)挖掘可以幫助企業(yè)從大量的繁雜的數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)律,找到有效的信息,以此指導(dǎo)企業(yè)調(diào)整經(jīng)營策略,提高企業(yè)聲譽(yù),獲得更有利的競爭能力。
作者:邢玉鳳 單位:云南經(jīng)濟(jì)管理學(xué)院