微信群组中存在大量会话文本数据,对其进行关键词提取有助于理解群组动态和主题演变。由于微信会话文本存在长度短、主题交叉、语言不规范等特点,传统提取方法效果欠佳。为此,提出了一个基于会话主题聚类的多阶段关键词提取算法。首先,...微信群组中存在大量会话文本数据,对其进行关键词提取有助于理解群组动态和主题演变。由于微信会话文本存在长度短、主题交叉、语言不规范等特点,传统提取方法效果欠佳。为此,提出了一个基于会话主题聚类的多阶段关键词提取算法。首先,提出了一种结合预训练知识的会话主题聚类算法(Single Pass Using Thread Segmentation and Pre-training Knowledge,SP_(TSPK)),综合考虑语义相关性、消息活跃度和用户亲密度,有效解决了会话主题交叉和信息量不足的问题。其次,设计了一种多阶段关键词提取算法(Multi-Stage Keyword Extraction,MSKE),将任务分解为无监督关键词抽取和有监督关键词生成,有效提取原文中存在和缺失的关键词,减少了候选词规模和语义冗余;最终,组合SP_(TSPK)算法与MSKE算法实现微信会话文本关键词提取。在WeChat数据集上相比AutoKeyGen算法,F_(1)@5和F_(1)@O平均提升了12.8%与10.8%,R@10平均达到其2.59倍。实验结果表明,该算法能有效地提取微信会话文本关键词。展开更多
利用CiteSpace软件从关键词聚类、合作网络、引文分析等多个角度,对Web of Science Core Collection数据库中2002—2023年发表的1146篇与根域限制有关的学术论文进行知识图谱分析,深入研究了植物根域限制领域的研究热点和发展趋势。结...利用CiteSpace软件从关键词聚类、合作网络、引文分析等多个角度,对Web of Science Core Collection数据库中2002—2023年发表的1146篇与根域限制有关的学术论文进行知识图谱分析,深入研究了植物根域限制领域的研究热点和发展趋势。结果显示:1)“根际”“群体”“定植”“基因表达”作为突现词的持续时间长,“干旱胁迫”“水分”“耐受力”为目前突现强度较高的突现词。2)根域限制在植物根际生态学、植物生长与发育及真菌和植物相互作用等领域意义重大。3)2002—2023年,相关文献发文量呈波动增长趋势。根域限制研究受多学科重视,其中植物科学与农学的文献占比达65%。美国发文量居首,其次是中国、巴西;中国突现强度排名第一。本研究涵盖了植物适应逆境的机制、植物与土壤相互作用、根腐病、土壤菌群等多个热点领域,旨在揭示当前植物根域限制研究的主要领域、关键问题以及未来可能的研究方向,为研究者提供参考和指导。展开更多
文摘微信群组中存在大量会话文本数据,对其进行关键词提取有助于理解群组动态和主题演变。由于微信会话文本存在长度短、主题交叉、语言不规范等特点,传统提取方法效果欠佳。为此,提出了一个基于会话主题聚类的多阶段关键词提取算法。首先,提出了一种结合预训练知识的会话主题聚类算法(Single Pass Using Thread Segmentation and Pre-training Knowledge,SP_(TSPK)),综合考虑语义相关性、消息活跃度和用户亲密度,有效解决了会话主题交叉和信息量不足的问题。其次,设计了一种多阶段关键词提取算法(Multi-Stage Keyword Extraction,MSKE),将任务分解为无监督关键词抽取和有监督关键词生成,有效提取原文中存在和缺失的关键词,减少了候选词规模和语义冗余;最终,组合SP_(TSPK)算法与MSKE算法实现微信会话文本关键词提取。在WeChat数据集上相比AutoKeyGen算法,F_(1)@5和F_(1)@O平均提升了12.8%与10.8%,R@10平均达到其2.59倍。实验结果表明,该算法能有效地提取微信会话文本关键词。
文摘利用CiteSpace软件从关键词聚类、合作网络、引文分析等多个角度,对Web of Science Core Collection数据库中2002—2023年发表的1146篇与根域限制有关的学术论文进行知识图谱分析,深入研究了植物根域限制领域的研究热点和发展趋势。结果显示:1)“根际”“群体”“定植”“基因表达”作为突现词的持续时间长,“干旱胁迫”“水分”“耐受力”为目前突现强度较高的突现词。2)根域限制在植物根际生态学、植物生长与发育及真菌和植物相互作用等领域意义重大。3)2002—2023年,相关文献发文量呈波动增长趋势。根域限制研究受多学科重视,其中植物科学与农学的文献占比达65%。美国发文量居首,其次是中国、巴西;中国突现强度排名第一。本研究涵盖了植物适应逆境的机制、植物与土壤相互作用、根腐病、土壤菌群等多个热点领域,旨在揭示当前植物根域限制研究的主要领域、关键问题以及未来可能的研究方向,为研究者提供参考和指导。