期刊文献+

基于中医方剂数据库的Top-Rank-k频繁模式挖掘算法 被引量:1

Top-Rank-k frequent patterns mining algorithm based on TCM prescription database
在线阅读 下载PDF
导出
摘要 为降低中医(TCM)方剂频繁模式挖掘过程中对经验参数的依赖,提高挖掘结果的准确性,针对中医方剂的数据特点,提出一种基于带权无向图的Top-Rank-k频繁模式挖掘算法。该算法可以直接挖掘出频繁k-itemset(k≥3)而无需产生1-itemset和2-itemset,并随之快速回溯到核心药物组合的频繁项集所对应的方剂信息;此外,采用一种动态位向量(DBV)的压缩机制对无向图中边的权重进行压缩存储,以有效地提高算法的空间存储效率。分别对中医方剂数据集、真实数据集(Chess、Pumsb和Retail)和合成数据集(T10I4D100K和Test2K50KD1)进行测试和比较,结果表明该算法与i NTK和BTK相比具有更高的时间和空间效率,而且也可以应用于其他类型的数据集。 The dependency of the empirical parameters in frequent patterns mining of Traditional Chinese Medicine (TCM) prescriptions should be reduced to improve the accuracy of mining results. Aiming at the characteristics of TCM prescription data, an efficient Top-Rank-k frequent patterns mining algorithm based on Weighted Undirected Graph (WUG) was proposed. The new algorithm can directly mining frequent k-itemset (k≥3) without mining 1-times and 2-times, and then quikly backtrack to the corresponding prescription of the frequent itemsets of core drugs combination. Besides, the compression mechanism of Dynamic Bit Vector (DBV) was used to store the edge weights in undirected graph to improve the spatial storage efficiency of the algorithm. Experiments were conducted on TCM prescription datasets, real datasets ( Chess, Pumsb and Retail) and synthetic datasets (T1014D100K and Test2K50KD1). The experimental results show that compared with iNTK ( improved Node-list Top-Rank-K) and BTK ( B-list Top-Rank-K), the proposed algorithm has better performance in terms of time and space, and it can be applied to other types of data sets.
作者 秦琦冰 谭龙 QIN Qibingl TAN Long(College of Computer Science and Technology, Heilongjiang University, Harbin Heilongjiang 150080, China Key Laboratory of Database and Parallel Computing of Heilongjiang Province ( Heilongjiang University), Harbin Heilongjiang 150080, China)
出处 《计算机应用》 CSCD 北大核心 2017年第2期329-334,共6页 journal of Computer Applications
基金 国家自然科学基金面上项目(81273649) 黑龙江省自然科学基金面上项目(F201434) 黑龙江大学研究生创新科研项目重点项目(YJSCX2016-018HLJU)~~
关键词 中医方剂 Top-Rank-k 频繁模式 带权无向图 动态位向量 Traditional Chinese Medicine (TCM) prescription Top-Rank-k frequent pattern Weighted Undirected Graph (WUG) Dynamic Bit Vector (DBV)
作者简介 秦琦冰(1990-),男,山东潍坊人,硕士研究生,主要研究方向:机器学习、数据仓库、数据挖掘; 通信作者 谭龙(1971-),男,黑龙江哈尔滨人,副教授,硕士,CCF会员,主要研究方向:机器学习、传感器网络、数据挖掘。电子邮箱tanlong@hlju.edu.cn
  • 相关文献

参考文献2

二级参考文献17

  • 1苗东升.从复杂性科学看中医——发现中医的科学性[J].首都师范大学学报(社会科学版),2008(S1):1-19. 被引量:9
  • 2黄顺基.从科学哲学看中、西医学之异同——再诘难何祚庥院士“中医不科学”之说[J].首都师范大学学报(社会科学版),2008(S1):20-33. 被引量:5
  • 3张介宾.类经[M].北京:中国中医药出版社,1997.197.
  • 4张景岳.景岳全书.北京:人民卫生出版社,2007:55
  • 5中共中央文献研究室.毛泽东早期文稿[M].长沙:湖南人民出版社,1990.29.
  • 6胡适.科学与人生观[M].济南:山东人民出版社,1997.
  • 7忽思慧.饮膳正要.北京:中国中医药出版社,2009.
  • 8《中共中央关于全面深化改革若干重大问题的决定》辅导读本[M].北京:人民出版社,2013.
  • 9李梃.医学入门.北京:人民卫生出版社,2006:336.
  • 10李俊峰,振兴中医药应从独立自主开始[EB/OL].http://news.if-eng.corn/a/20140518/40345468-0.shtml,2015-05-18.

共引文献6

同被引文献7

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部