摘要
党的十九大报告提出了习近平新时代中国特色社会主义思想,如何深入学习和分析十九大报告成为当下的一大研究热点。本文运用word2vec和TFIDF对党的十九大报告的内容进行分析,对其中的关键词进行相似度计算,利用Python与Weka实现报告中关键词的关联规则挖掘。通过挖掘计算发现,报告中"中华民族""发展""文明""小康社会"等词语与样本中提取的50个关键词联系较为紧密。在规则中,许多关键词均与小康社会建设有较强的关联度,且部分关键词之间具有特定的相关关系。
The report of the 19 th National Congress of the Communist Party of China puts forward the socialistic thoughts with Chinese characteristics in the new era,how to deeply study and analyze the contents of the Report become research hotspot.word2 Vec and TFIDF are used in the paper to analyze the words in the Report and conduct similarity calculation on key words,Python and Weka are used to mine association rule of keywords in the report. According to data mining and calculation,there is a specific correlation among key words in the report. In the rules,many keywords have strong correlation with well-off society,and some key words have specific correlation. Based on the results of the above research,the paper provides a technical support of text quantization for analyzing the 19 th National Congress of the Communist Party of China.
作者
马琳琳
刘继
MA Linlin;LIU Ji(Xinjiang University of Finance and Economics,Urumqi 830012,China)
出处
《新疆财经大学学报》
2018年第2期20-28,共9页
Journal of Xinjiang University of Finance & Economics
基金
国家自然科学基金项目"基于网络社群的网络舆情演化分析及突发事件预警机制研究"(项目编号:71261025)
新疆维吾尔自治区普通高等学校教学改革研究项目"大数据背景下实践教学知识网络创新体系研究"(项目编号:2017JG016)
关键词
数据挖掘
关联规则
文本分析
党的十九大报告
data mining
association rule
text analysis
the report of the 19th National Congress of the Communist Party of China
作者简介
马琳琳(1994-),女,新疆财经大学统计与信息学院硕士研究生,研究方向为网络舆情、数据挖掘;;刘继(1974-),男,管理科学与工程博士,新疆财经大学统计与信息学院教授,研究方向为网络舆情、数据挖掘。