基于关联规则的党的十九大报告关键词相关性分析被引量：5

A Correlation Analysis of Key Words in Report of the 19th National Congress of the Communist Party of China Based on Association Rules

在线阅读下载PDF

导出

摘要党的十九大报告提出了习近平新时代中国特色社会主义思想,如何深入学习和分析十九大报告成为当下的一大研究热点。本文运用word2vec和TFIDF对党的十九大报告的内容进行分析,对其中的关键词进行相似度计算,利用Python与Weka实现报告中关键词的关联规则挖掘。通过挖掘计算发现,报告中"中华民族""发展""文明""小康社会"等词语与样本中提取的50个关键词联系较为紧密。在规则中,许多关键词均与小康社会建设有较强的关联度,且部分关键词之间具有特定的相关关系。 The report of the 19 th National Congress of the Communist Party of China puts forward the socialistic thoughts with Chinese characteristics in the new era,how to deeply study and analyze the contents of the Report become research hotspot.word2 Vec and TFIDF are used in the paper to analyze the words in the Report and conduct similarity calculation on key words,Python and Weka are used to mine association rule of keywords in the report. According to data mining and calculation,there is a specific correlation among key words in the report. In the rules,many keywords have strong correlation with well-off society,and some key words have specific correlation. Based on the results of the above research,the paper provides a technical support of text quantization for analyzing the 19 th National Congress of the Communist Party of China.

作者马琳琳刘继 MA Linlin;LIU Ji(Xinjiang University of Finance and Economics,Urumqi 830012,China)

机构地区新疆财经大学

出处《新疆财经大学学报》 2018年第2期20-28,共9页 Journal of Xinjiang University of Finance & Economics

基金国家自然科学基金项目"基于网络社群的网络舆情演化分析及突发事件预警机制研究"(项目编号:71261025) 新疆维吾尔自治区普通高等学校教学改革研究项目"大数据背景下实践教学知识网络创新体系研究"(项目编号:2017JG016)

关键词数据挖掘关联规则文本分析党的十九大报告 data mining association rule text analysis the report of the 19th National Congress of the Communist Party of China

分类号 D220 [政治法律—中共党史] TP391.1 [自动化与计算机技术—计算机应用技术]

作者简介马琳琳（1994-），女，新疆财经大学统计与信息学院硕士研究生，研究方向为网络舆情、数据挖掘；;刘继（1974-），男，管理科学与工程博士，新疆财经大学统计与信息学院教授，研究方向为网络舆情、数据挖掘。

引文网络
相关文献

参考文献9

1张军玲.我国网络舆情信息挖掘研究综述[J].情报科学,2016,34(11):167-172. 被引量：23
2郭韧,李红,陈福集.基于可拓聚类的网络舆情演化预测研究[J].情报理论与实践,2017,40(1):83-87. 被引量：16
3黄仁,张卫.基于word2vec的互联网商品评论情感倾向研究[J].计算机科学,2016,43(S1):387-389. 被引量：51
4张冬雯,杨鹏飞,许云峰.基于word2vec和SVMperf的中文评论情感分类研究[J].计算机科学,2016,43(S1):418-421 447. 被引量：21
5翟东海,鱼江,高飞,于磊,丁锋.最大距离法选取初始簇中心的K-means文本聚类算法的研究[J].计算机应用研究,2014,31(3):713-715. 被引量：109
6李新福,赵蕾蕾,何海斌,李芳.使用Logistic回归模型进行中文文本分类[J].计算机工程与应用,2009,45(14):152-154. 被引量：10
7王彦增,曹正.基于WEKA数据挖掘中关联规则的分析及应用举例[J].经济论坛,2013(1):165-167. 被引量：7
8汪祖柱,阮振秋.基于关联规则的政务微博公众评论观点挖掘[J].情报科学,2017,35(8):19-22. 被引量：10
9阮光册,夏磊.基于关联规则的文本主题深度挖掘应用研究[J].现代图书情报技术,2016(12):50-56. 被引量：15

二级参考文献70

1邹娟,周经野,邓成.一种基于语义分析的中文特征值提取方法[J].计算机工程与应用,2005,41(36):164-166. 被引量：6
2谈文蓉,符红光,刘莉,杨宪泽.一种基于贝叶斯分类与机读词典的多义词排歧方法[J].计算机应用,2006,26(6):1389-1391. 被引量：5
3何玉,冯剑琳,王元珍.基于最大关联规则的文本分类[J].计算机科学,2006,33(11):143-145. 被引量：6
4Rennie J D M,Shih L,Teevan J,et al.Tackling the poor assumptions of Naive Bayes text classifiers [C]//Proceedings of the Twentieth International Conference on Machine Learning,2003,2:616-623.
5Chiang J H,Chen Y C.Hierarchical fuzzy-KNN networks for news documents categorization[C]//lOth IEEE International Conference on Fuzzy Systems,2001(2) :720-723.
6Sebastiani F,Nazionale C,Valdambrini N.An improved boosting algorithm and its application to text categorization[C]//Proceedings of the Ninth International Conference on Information and Knowledge Management, 2000: 78-85.
7Zhang Hao,Berg A C,Maire M,et al.SVM-KNN:Discriminative nearest neighbor classification for visual category recognition[C]// IEEE Computer Society Conference on HHComputer Vision and Pattern Recognition, 2006 : 2126-2136.
8Yang Y.An evaluaton of statistical approaches to text categorization[J].Information Retrieval, 1999,1 ( 1 ) : 76-78.
9Komarek P,Moore A.Fast robust logistic regression for large sparse datasets with binary outputs[C]//Proceedings of the Ninth International Workshop on Artifical Intelligence and Statistics,2003:197-204.
10Keerth S S,Duan K B,Shevade S K,et al.A fast dual algorithm for kernel logistic regression[J].Machine Learning,2005,61( 1 ) : 151-165.

共引文献246

1段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
2陈艳君,周欣,卿粼波,王正勇.基于多头注意机制的用户评论情感可视分析[J].智能计算机与应用,2020(8):33-36.
3张志武.跨领域迁移学习产品评论情感分析[J].现代图书情报技术,2013(6):49-54. 被引量：6
4张启徽.关联规则挖掘在网上竞拍中的应用[J].商业经济,2013(21):89-90.
5王祎,董智勇.学术不端案例数据库构建与评价指标相关性研究[J].石油教育,2014(3):104-106.
6孔建华.国内网络舆情治理研究综述[J].电子政务,2018(12):67-78. 被引量：30
7段桂芹.基于均值与最大距离乘积的初始聚类中心优化K-means算法[J].计算机与数字工程,2015,43(3):379-382. 被引量：17
8安计勇,高贵阁,史志强,孙磊.一种改进的K均值文本聚类算法[J].传感器与微系统,2015,34(5):130-133. 被引量：19
9陈庄,罗告成.一种改进的K-means算法在异常检测中的应用[J].重庆理工大学学报（自然科学）,2015,29(5):66-70. 被引量：11
10安计勇,韩海英,侯效礼.一种改进的DBscan聚类算法[J].微电子学与计算机,2015,32(7):68-71. 被引量：13

同被引文献39

1魏伟,郭崇慧,邢小宇.基于语义关联规则的试题知识点标注及试题推荐[J].数据分析与知识发现,2020,4(2):182-191. 被引量：10
2胥桂仙,高旭,于绍娜.关联规则算法在中文文本挖掘中的应用研究[J].中央民族大学学报（自然科学版）,2004,13(4):332-338. 被引量：5
3何玉,冯剑琳,王元珍.基于最大关联规则的文本分类[J].计算机科学,2006,33(11):143-145. 被引量：6
4彭坤,吴明,陈立新.基于关联规则的医院感染数据挖掘[J].感染．炎症．修复,2007,8(4):227-229. 被引量：4
5刘菲,黄萱菁,吴立德.利用关联规则挖掘文本主题词的方法[J].计算机工程,2008,34(7):81-83. 被引量：10
6彭纪生,仲为国,孙文祥.政策测量、政策协同演变与经济绩效：基于创新政策的实证研究[J].管理世界,2008,24(9):25-36. 被引量：499
7曹堂哲.公共行政执行协同机制——概念、模型和理论视角[J].中国行政管理,2010(1):115-120. 被引量：41
8聂广盂,辛有清,潘习龙,张桂林,王乔.综合医院医疗质量评价的对比研究[J].中华医院管理杂志,2011,27(10):734-736. 被引量：6
9刘耀南.Apriori算法的分析及应用[J].佛山科学技术学院学报（自然科学版）,2012,30(3):70-74. 被引量：4
10石正喜,葛科奇,曹财耀.基于关联规则的数据挖掘算法研究[J].计算机与网络,2013,39(6):62-64. 被引量：6

引证文献5

1梁茵,张艳玲,郑建灵,黄子豪,田俊雄.Apriori算法改进及其在校园舆情焦点问题的应用[J].数字通信世界,2019,0(8):180-182.
2赵娜,王吉善,王圣友,张艳丽,孙辉,孙佳璐,王莹,明敏馨,陈晓红.基于关联规则的综合医院评审评价数据挖掘及管理启示[J].中华医院管理杂志,2020,36(8):687-691. 被引量：12
3韩娜,马海群,刘兴丽.基于知识图谱的政策文本协同性推理研究[J].情报科学,2021,39(11):180-186. 被引量：4
4赵娜,陈晓红,孙辉,孙佳璐,王莹,张艳丽.三级综合医院院感评价数据关联规则分析及启示[J].中国卫生质量管理,2022,29(2):26-29. 被引量：3
5马海群,刘兴丽,韩娜.基于关联规则的开放政府数据主题多政策协同性研究[J].情报科学,2022,40(4):3-8. 被引量：12

二级引证文献31

1韩璐,殷逸竹,曾彦.基于Apriori算法的全国省级疾病预防控制中心青年职工思想状况调查数据挖掘及管理启示[J].中国卫生标准管理,2021,12(12):18-22. 被引量：2
2李曙光,赵敏,张秀英,赵琦,蒋红.关联规则法用于护士给药错误的数据挖掘分析[J].护理学杂志,2021,36(13):104-107. 被引量：17
3李颖.基于决策树算法的信息系统数据挖掘研究[J].信息技术,2022,46(2):116-120. 被引量：17
4赵娜,陈晓红,孙辉,孙佳璐,王莹,张艳丽.三级综合医院院感评价数据关联规则分析及启示[J].中国卫生质量管理,2022,29(2):26-29. 被引量：3
5高瞻,高艳,韩玖阳,赵亮.以诊疗数据挖掘为指导的三甲医院发展策略研究[J].医学信息学杂志,2022,43(2):43-47. 被引量：3
6胡晓星,马雪.等级医院评审标准下不良事件管理体系的构建及实施效果分析[J].中国卫生产业,2021,18(35):38-41.
7郭霏霏.基于关联规则算法的医院财务信息自动处理系统[J].自动化技术与应用,2022,41(7):155-158. 被引量：2
8林金雄,任义涛,廖月华,安宁波.基于广义估计方程的某皮肤病专科医院超长住院日影响因素分析[J].中国医院统计,2022,29(3):174-178. 被引量：1
9赵娜,张艳丽.面向过程控制的围手术期精细化管理评价量表研制及实证研究[J].中华医院管理杂志,2022,38(4):304-311. 被引量：2
10沈鸣雁,万鹏夏,劳玲娣,傅亚红,冯志仙.基于关联规则的《外科护理学》在线学习数据挖掘分析研究[J].护理与康复,2022,21(9):23-26. 被引量：1

1田玲芳,张欢,皮赛奇.教育史观:经学化和神学化教育演变[J].学园,2017,0(14):133-136.
2刘卓军.文明创造机会[J].中关村,2017,0(9):72-72.
3姚晶晶.中国优秀传统文化融入高校思想政治教育的重要性[J].现代商贸工业,2017,38(34):153-154. 被引量：1
4陈珊.舞蹈教学对学生的审美能力的促进作用[J].科教导刊（电子版）,2018,0(16):77-77.
5武涛,侯沙杉.图形在书籍设计中的运用[J].文艺生活（中旬刊）,2016,0(7):69-69.
6“地铁十年感谢有你”摄影大赛[J].黑龙江画报,2017,0(11):1-1.
7张永涛.自主设计相似度算法的套餐推荐系统[J].电信技术,2018(4):63-65.
8乔羽,姚舒威.基于不同文本表示的大规模蛋白功能预测探究[J].微型电脑应用,2018,34(7):1-5.
9江苏省泰兴市文明办.培育新农民弘扬新风尚美化新环境[J].精神文明导刊,2018,0(7):33-33.
10尹倩,李致富,韩爽.关联规则挖掘技术在社会服务中的应用研究——以某体育院校为例[J].现代信息科技,2018,2(2):150-151. 被引量：2

新疆财经大学学报

2018年第2期

浏览历史

内容加载中请稍等...

基于关联规则的党的十九大报告关键词相关性分析被引量：5

参考文献9

二级参考文献70

共引文献246

同被引文献39

引证文献5

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

基于关联规则的党的十九大报告关键词相关性分析 被引量：5

参考文献9

二级参考文献70

共引文献246

同被引文献39

引证文献5

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

基于关联规则的党的十九大报告关键词相关性分析被引量：5