

  • 加入收藏
  • 下載文章
篇名 有效降低空間使用量的一種混合型結構於探勘頻繁封閉項目集
卷期 5:2
並列篇名 Mining Frequent Closed Itemsets using a Hybrid Structure to Reduce Memory Usage
作者 黃賢卿王珮倩
頁次 031-041
關鍵字 資料探勘頻繁項目集頻繁封閉項目集data miningfrequent itemsetsfrequent closed itemsets
出刊日期 201207


探勘頻繁項目集是資料探勘領域中的一個熱門研究方向,此技術也被廣範運用於從資料庫中找出大部分客戶會常常一起購買商品組合。頻繁封閉項目集的概念是希望在沒有遺失資訊的情況下將資料進行壓縮。探勘頻繁封閉項目集的數量往往比頻繁項目集的數量少很多,所以探勘頻繁封閉項目集可減少執行的時間與記憶體的使用量進行壓縮。然而探勘頻繁封閉項目集會依據資料形態的不同,儲存空間也會因演算法有所改變,當資料量增加時,探勘頻繁項目集過程所使用的記憶體,也可能將使用的記憶體快速成長。本論文提出一個稱為Comset 的垂直資料格式表示法,它為結合交易資料集及其補集的一種混合型結構。我們說明如何將Comset 與之前的探勘頻繁封閉項目集演算法整合,此外我們也提出一個新的探勘頻繁封閉項目集演算法。實驗結果顯示出我們提出的演算法可以有效地改善記憶體使用量。


Mining frequent itemset is one of the most widely used data mining techniques, and it has a wide range of application of fining most customers buy more or less products frequently in a transaction database. Frequent closed itemset is concise to represent exactly the same knowledge of frequent itemsets. However, mining frequent closed itemset would be limiting different data sets, which may make the size of memory grows quickly.In this paper we present a new vertical data representation called Comset, which is a hybrid structure of the transaction id set and its complement set. We show how to incorporate Comset into previous vertical mining frequent closed itemset. We propose a new algorithm, using Comset, for mining frequent closed itemset.Experimental results reveal that our proposed algorithm can effectively improve memory usage.
