99热精品69堂国产-97超级碰在线精品视频-日韩欧美中文字幕在线视频-欧美日韩大尺码免费专区-最新国产三级在线不卡视频-在线观看成人免费视频-亚洲欧美国产精品完整版-色综久久天天综合绕视看-中文字幕免费在线看线人-久久国产精品99精品国产

基于多維數(shù)據(jù)集的異常子群發(fā)現(xiàn)技術

作者:張靜恬; 伍賽; 陳剛; 壽黎但; 陳珂 浙江大學計算機科學與技術學院; 杭州310027; 浙江省大數(shù)據(jù)智能計算重點實驗室; 杭州310027; 浙江大學計算機輔助設計與圖形學國家重點實驗室; 杭州310027

摘要:非頻繁項集是未被標準化的頻繁項集產(chǎn)生算法(如APRIORI以及FP-Growth算法)提取的所有項集.在數(shù)據(jù)集上挖掘有意義的非頻繁項集是數(shù)據(jù)挖掘的重要工作之一.目前,基于傳統(tǒng)數(shù)據(jù)集的非頻繁項集挖掘研究主要集中在負相關、負模式以及間接關聯(lián)等方面,且主要是對整個數(shù)據(jù)集上的性質(zhì)進行分析,而沒有對數(shù)據(jù)集的切片進行分析.該文提出了一種新的模式,試圖找到符合如下條件的特定子群,其描述的數(shù)據(jù)集切片上存在某些特殊項集,這些項集在整個數(shù)據(jù)集上并非頻繁項集,但是在該數(shù)據(jù)集切片上卻是頻繁項集.根據(jù)用戶要求自動找出這些異常子群以及其對應項集的算法在數(shù)據(jù)分析中有著十分重要的意義.該文提出的解決方案由兩部分組成:候選產(chǎn)生階段以及查詢交互階段.前者是一個脫機處理的過程,而后者則是在線實時反饋的過程.在候選產(chǎn)生階段,該文提出了一種基于多維數(shù)據(jù)集高效產(chǎn)生頻繁項集以及顯著子群并有效建立索引的算法.根據(jù)索引,在查詢交互階段,該文提出的算法框架可以快速準確地返回給定查詢對應的異常子群以及對應項集.基于多個真實數(shù)據(jù)集的實驗表明,該文提出的方案可以根據(jù)用戶要求實時返回有意義的異常子群以及對應項集.此外,該文提出的算法在多維數(shù)據(jù)集上的挖掘效率比UTMTU算法提升了數(shù)倍.

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

計算機學報

北大期刊 下單

國際刊號:0254-4164

國內(nèi)刊號:11-1826/TP

雜志詳情
相關熱門期刊

服務介紹LITERATURE

正規(guī)發(fā)表流程 全程指導

多年專注期刊服務,熟悉發(fā)表政策,投稿全程指導。因為專注所以專業(yè)。

保障正刊 雙刊號

推薦期刊保障正刊,評職認可,企業(yè)資質(zhì)合規(guī)可查。

用戶信息嚴格保密

誠信服務,簽訂協(xié)議,嚴格保密用戶信息,提供正規(guī)票據(jù)。

不成功可退款

如果發(fā)表不成功可退款或轉(zhuǎn)刊。資金受第三方支付寶監(jiān)管,安全放心。