期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一种PST_LDA中文文本相似度计算方法 被引量:18
1
作者 张超 陈利 李琼 《计算机应用研究》 CSCD 北大核心 2016年第2期375-377,383,共4页
为了降低中文文本相似度计算方法的时间消耗、提高文本聚类的准确率,提出了一种PST_LDA(词性标注潜在狄利克雷模型)中文文本相似度计算方法。首先,对文本中的名词、动词和其他词进行词性标注;然后,分别对名词、动词和其他词建立相应的LD... 为了降低中文文本相似度计算方法的时间消耗、提高文本聚类的准确率,提出了一种PST_LDA(词性标注潜在狄利克雷模型)中文文本相似度计算方法。首先,对文本中的名词、动词和其他词进行词性标注;然后,分别对名词、动词和其他词建立相应的LDA主题模型;最后,按照一定的权重比例综合这三个主题模型,计算文本之间的相似度。由于考虑了不同词性的词集对文本相似度计算的贡献差异,利用文本的语义信息提高了文本聚类准确率。将分离后的三个词集的LDA建模过程并行化,减少建模的时间消耗,提高文本聚类速度。在TanCorp-12数据集分别用LDA和PST_LDA方法进行中文文本相似度计算模拟实验。实验结果显示,PST_LDA方法不仅减少了建模时间消耗,同时在聚类准确率上有一定的提高。 展开更多
关键词 词性标注 LDA模型 PST_LDA模型 文本相似度计算
在线阅读 下载PDF
文本相似度计算的一种新方法 被引量:6
2
作者 张焕炯 李玉鉴 钟义信 《计算机科学》 CSCD 北大核心 2002年第7期92-93,共2页
1引言 目前信息检索技术已应用于许多领域,尤其广泛应用在Intcrnet网络、图书馆等领域,为快速查阅文本信息提供极大便利.文本信息检索利用文本相似度描述文本与查询式之间的匹配程度.
关键词 INTERNET 文本相似度计算 信息检索 向量空间模型 信息论
在线阅读 下载PDF
面向情感聚类的文本相似度计算方法研究 被引量:9
3
作者 李欣 李旸 王素格 《中文信息学报》 CSCD 北大核心 2018年第5期97-104,共8页
在文本情感分析时,使用无监督的聚类方法,可以有效节省人力和数据资源,但同时也面临聚类精度不高的问题。相似性是文本聚类的主要依据,该文从文本相似度计算的角度,针对情感聚类中文本—特征向量的高维和稀疏问题,以及对评论文本潜在情... 在文本情感分析时,使用无监督的聚类方法,可以有效节省人力和数据资源,但同时也面临聚类精度不高的问题。相似性是文本聚类的主要依据,该文从文本相似度计算的角度,针对情感聚类中文本—特征向量的高维和稀疏问题,以及对评论文本潜在情感因素的表示问题,提出一种基于子空间的文本语义相似度计算方法(RESS)。实验结果表明,基于RESS的文本相似度计算方法,有效解决了文本向量的高维问题,更好地表达了文本间情感相似性,并获得较好的聚类结果。 展开更多
关键词 文本情感聚类 文本相似度计算 文本语义子空间
在线阅读 下载PDF
基于深度学习的文本相似度计算 被引量:9
4
作者 邵恒 冯兴乐 包芬 《郑州大学学报(理学版)》 CAS 北大核心 2020年第1期66-71,78,共7页
提出了一种基于改进堆叠自动编码器提取低维度句子特征的方法,同时采用自动编码器的降噪技术以增加鲁棒性和表达能力。接着用提取的特征计算文本间句子的相似度并组成相似矩阵,用对应的文本生成文本特征矩阵,然后分别通过对应的深度卷... 提出了一种基于改进堆叠自动编码器提取低维度句子特征的方法,同时采用自动编码器的降噪技术以增加鲁棒性和表达能力。接着用提取的特征计算文本间句子的相似度并组成相似矩阵,用对应的文本生成文本特征矩阵,然后分别通过对应的深度卷积网络训练并提取特征。最后用特征融合技术将两个深度卷积网络提取的特征融合,经全连接的多层感知机计算相似度。实验结果证明,提出的方法能够表达句子的语义特征和文本的上下文特征,有效提高文本相似度计算的准确度。 展开更多
关键词 学习 自动编码器 卷积神经网络 文本相似度计算
在线阅读 下载PDF
基于文本计算和链接分析的主题导航优化——以ERS网站为例 被引量:4
5
作者 许鑫 苏晓兰 《情报学报》 CSSCI 北大核心 2015年第9期938-948,共11页
网站的信息组织是图书情报领域研究的重要内容,尤其在导航优化方面也有较多探讨。本文综合运用了文本相似度计算、链接分析、社会网络分析、聚类分析等方法,提出了兼顾页面内容和已有链接关系的网站主题导航优化方案,并针对ERS网站... 网站的信息组织是图书情报领域研究的重要内容,尤其在导航优化方面也有较多探讨。本文综合运用了文本相似度计算、链接分析、社会网络分析、聚类分析等方法,提出了兼顾页面内容和已有链接关系的网站主题导航优化方案,并针对ERS网站提出了优化的具体做法。论文通过与仅基于内容和仅基于链接的网站主题导航构建方案进行比较,证明所提方案的可行性和有效性。针对ERS网站,实例也证明通过增加语义相似度高于阈值的主题间链接,并按照相似程度对相关主题的链接进行排序,可以有效地实现主题导航优化。研究表明链接关系也是一种隐含语义关系,网站导航既要考虑语义相似度高的页面,也要考虑语义相似度低但存在链接关系的页面。 展开更多
关键词 文本相似度计算 链接分析 网站导航
在线阅读 下载PDF
面向大规模社交网络的潜在好友推荐方法 被引量:7
6
作者 贺超波 汤庸 +2 位作者 陈国华 刘海 吴琳琳 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第4期420-424,共5页
有效的潜在好友推荐是促进社交网络不断增长的重要途径,对于大规模社交网络环境下的复杂计算问题,文章提出了一种适用于大规模社交网络的潜在好友推荐方法,该方法首先将用户的潜在好友划分为"可能认识的"和"可能感兴趣的... 有效的潜在好友推荐是促进社交网络不断增长的重要途径,对于大规模社交网络环境下的复杂计算问题,文章提出了一种适用于大规模社交网络的潜在好友推荐方法,该方法首先将用户的潜在好友划分为"可能认识的"和"可能感兴趣的"2类,然后分别基于用户共同好友关系拓扑图和Profile文本相似性计算模型进行描述,最后基于MapReduce云计算模型对相关方法进行了设计实现。探讨了云计算环境下的潜在好友推荐系统框架设计、大规模用户共同好友关系拓扑图以及Profile文本相似性计算的方法,并通过实验以及应用实例验证了该方法的有效性以及可扩展性。 展开更多
关键词 好友推荐 社交网络 文本相似MapReduce云计算模型
在线阅读 下载PDF
混合神经网络模型与注意力机制的地址匹配算法 被引量:6
7
作者 陈健鹏 陈剑 +2 位作者 佘祥荣 水新莹 陈刚 《计算机工程与科学》 CSCD 北大核心 2022年第5期901-909,共9页
中文地名地址的标准化在当前智慧城市的建设中起到至关重要的作用。传统的地名地址标准化技术通常使用基于文本字符层面的相似度计算或规则库匹配的方法,对复杂、特殊或冗余地址的处理效果较差。通过将地址标准化任务转换为针对地址相... 中文地名地址的标准化在当前智慧城市的建设中起到至关重要的作用。传统的地名地址标准化技术通常使用基于文本字符层面的相似度计算或规则库匹配的方法,对复杂、特殊或冗余地址的处理效果较差。通过将地址标准化任务转换为针对地址相似的匹配度计算任务,提出了一种融合注意力机制与多层次语义表征的地址匹配算法。首先依据地址文本特殊的语法结构,利用Trie语法树构建标准地址树;而后基于注意力机制,利用Bi-LSTM网络与CNN网络生成地址对的多层次语义表示;最后通过曼哈顿距离计算相似度。在自主构建的数据集上,提出的SGAM模型的匹配准确度(91.22%)相比TextRCNN、FastText、基于注意力的卷积神经网络(ABCNN)等模型提升了4%~10%,表明SGAM模型在地址匹配任务上有着更好的性能表现。 展开更多
关键词 地名地址 文本相似度计算 注意力机制 混合神经网络 智慧城市
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部