- 相關推薦
探析電子商務中數(shù)據挖掘方法的應用
摘要: 電子商務是現(xiàn)代商業(yè)的主流趨勢,如何充分利用網絡技術和數(shù)據庫技術發(fā)揮企業(yè)優(yōu)勢,成為企業(yè)制勝的法寶。本文介紹了常用的數(shù)據挖掘方法,以及在電子商務領域的應用,分析了利用數(shù)據挖掘技術建設動態(tài)、高效電子商務的可行性。關鍵詞:數(shù)據挖掘 電子商務 數(shù)據庫
一、引言
電子商務是指以Internet網絡為載體、利用數(shù)字化電子方式開展的商務活動。隨著網絡技術和數(shù)據庫技術的飛速發(fā)展,電子商務正顯示越來越強大的生命力。電子商務的發(fā)展促使公司內部收集了大量的數(shù)據,并且迫切需要將這些數(shù)據轉換成有用的信息和知識,為公司創(chuàng)造更多潛在的利潤。利用數(shù)據挖掘技術可以有效地幫助企業(yè)分析從網上獲取的大量數(shù)據,發(fā)現(xiàn)隱藏在其后的規(guī)律性,提取出有效信息,進而指導企業(yè)調整營銷策略,給客戶提供動態(tài)的個性化的高效率服務。
二、數(shù)據挖掘技術
1.數(shù)據挖掘
數(shù)據挖掘(Data Mining),又稱數(shù)據庫中的知識發(fā)現(xiàn)(Knowledge Discovery in Database, KDD),是從大量的、不完全的、有噪聲的、模糊的和隨機的數(shù)據中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識的過程。數(shù)據挖掘是一門廣義的交叉學科,它匯聚了不同領域尤其是數(shù)據庫、人工智能、數(shù)理統(tǒng)計、可視化、并行計算等方面的知識。數(shù)據挖掘技術從一開始就是面向應用領域,它不僅是面向特定數(shù)據庫的簡單檢索查詢調用,而且,要對數(shù)據進行微觀、中觀乃至宏觀的統(tǒng)計、分析、綜合和推理,以指定實際問題的求解,企圖發(fā)現(xiàn)事件間的相互關聯(lián),甚至利用已有的數(shù)據對未來的活動進行預測。數(shù)據挖掘技術在金融、保險、電信、大型超市等積累有大量數(shù)據的電子商務行業(yè)有著廣泛的應用,如信用分析、風險分析、欺詐檢驗、用戶聚類分析、消費者習慣分析等。
2.數(shù)據挖掘過程
挖掘數(shù)據過程可以分為3個步驟:數(shù)據預處理、模式發(fā)現(xiàn)、模式分析。
(1)數(shù)據預處理。實際系統(tǒng)中的數(shù)據一般都具有不完全性、冗余性和模糊性。因此,數(shù)據挖掘一般不對原始數(shù)據進行挖掘,要通過預處理提供準確、簡潔的數(shù)據。預處理主要完成以下工作:包括合并數(shù)據,將多個文件或多個數(shù)據庫中的數(shù)據進行合并處理;選擇數(shù)據,提取出適合分析的數(shù)據集合;數(shù)據清洗、過濾,剔除一些無關記錄,將文件、圖形、圖像及多媒體等文件轉換成可便于數(shù)據挖掘的格式等。
(2)模式發(fā)現(xiàn)。模式發(fā)現(xiàn)階段就是利用挖掘算法挖掘出有效的、新穎的、潛在的、有用的以及最終可以理解的信息和知識。可用于Web的挖掘技術有路徑選擇、關聯(lián)分析、分類規(guī)則、聚類分析、序列分析、依賴性建模等等。
(3)模式分析。模式分析是從模式發(fā)現(xiàn)階段獲得的模式、規(guī)則中過濾掉不感興趣的規(guī)則和模式。通過技術手段,對得到的模式進行數(shù)據分析,得出有意義的結論。常用的技術手段有:關聯(lián)規(guī)則、分類、聚類、序列模式等。
三、電子商務中幾種常用的數(shù)據挖掘方法
1.關聯(lián)規(guī)則
關聯(lián)規(guī)則是數(shù)據挖掘研究的主要模式之一,側重于確定數(shù)據中不同領域之間的關系,找出滿足給定條件下的多個域間的依賴關系。關聯(lián)規(guī)則挖掘對象一般是大型數(shù)據庫,該規(guī)則一般表示式為:A1∧A2∧…Am=