期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
中文短文本自动关键词提取的改进RAKE算法 被引量:12
1
作者 陈可嘉 黄思翌 《小型微型计算机系统》 CSCD 北大核心 2021年第6期1171-1175,共5页
针对RAKE(Rapid Automatic Keywords Extraction)算法在中文短文本关键词提取算法中未考虑词语语义和候选关键词过长的问题,提出一种以RAKE算法为基础的改进方法.在词语特征值计算阶段,利用词项距离、词间关系频率、共现频率构建共现矩... 针对RAKE(Rapid Automatic Keywords Extraction)算法在中文短文本关键词提取算法中未考虑词语语义和候选关键词过长的问题,提出一种以RAKE算法为基础的改进方法.在词语特征值计算阶段,利用词项距离、词间关系频率、共现频率构建共现矩阵,利用语境值计算公式计算每个候选关键词的特征值;按照特征值的降序输出候选关键词,若候选关键词词语个数超过n个,则利用窗口输出算法限制关键词的长度.实验表明,本文方法在中文短文本关键词提取方面相比RAKE算法及其它算法有更好的表现. 展开更多
关键词 RAKE算法 自动关键词提取 语境 窗口输出
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部