期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于改进的TF-IDF算法及共现词的主题词抽取算法 被引量:18
1
作者 公冶小燕 林培光 +2 位作者 任威隆 张晨 张春云 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第6期1072-1080,共9页
信息主题的抽取是快速定位用户需求的基础任务,主题词抽取时主要存在三个问题:一是词语权重的计算,二是词语间关系的度量,三是数据维度灾难.在计算词权重时首先利用互信息确定共现词对,与词频、词性、词位置信息非线性组合,然后,根据词... 信息主题的抽取是快速定位用户需求的基础任务,主题词抽取时主要存在三个问题:一是词语权重的计算,二是词语间关系的度量,三是数据维度灾难.在计算词权重时首先利用互信息确定共现词对,与词频、词性、词位置信息非线性组合,然后,根据词权重构建文档—共现词矩阵并建立潜在语义分析(Latent Semantic Analysis,LSA)模型.该方法借助LSA模型的奇异值分解(Singular Value Decomposition,SVD)将文档—共现词矩阵映射到潜在语义空间,不仅实现数据降维,而且获得低维度的文档相似矩阵.最后,对文档相似矩阵进行k-means聚类,在同类文档中选出词权重最大的前几对共现词,作为该类文章的主题词.对比基于TF-IDF(Term Frequency-Inverse Document Frequency)和共现词抽取主题词的实验,该算法的准确度分别提高了19%和10%. 展开更多
关键词 共现词 互信息 语义分析(LSA) 奇异值分解(SVD) term frequency-Inverse document frequency(tf-idf)
在线阅读 下载PDF
一种基于改进TF-IDF的SLAM回环检测算法 被引量:14
2
作者 董蕊芳 柳长安 杨国田 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第2期251-258,共8页
提出了一种基于改进TF-IDF的视觉SLAM回环检测算法,用于检测曾经访问过的位置,来消除定位过程中的累积误差.首先,针对在人造建筑场景中使用SLAM算法对图像点特征进行计算容易导致检测失败的问题,采用图像中的直线作为特征来进行回环检... 提出了一种基于改进TF-IDF的视觉SLAM回环检测算法,用于检测曾经访问过的位置,来消除定位过程中的累积误差.首先,针对在人造建筑场景中使用SLAM算法对图像点特征进行计算容易导致检测失败的问题,采用图像中的直线作为特征来进行回环检测的计算.其次,在LBD(line band descriptor)图像线特征描述子的基础上进一步提取了二进制LBD描述子来进行视觉词典的构建,保证了线特征的处理效率.提出了一种改进的TF-IDF(term frequency&inverse document frequency)单词权重确定方法,提高了视觉单词评分之间的区分度.最后,以室内建筑环境和输电线路场景为例进行实验,结果显示,所提出的基于线特征的回环检测算法比基于点特征的算法有较高的检测准确率,有助于提高SLAM算法的计算性能. 展开更多
关键词 SLAM 回环检测 人造建筑场景 二进制LBD 改进的tf-idf方法
在线阅读 下载PDF
基于社会化标注的博客标签推荐方法 被引量:10
3
作者 赵亚楠 董晶 董佳梁 《计算机工程与设计》 CSCD 北大核心 2012年第12期4609-4613,共5页
为了提高博客系统推荐标签的质量,分析了现有的标签推荐算法及相关技术,提出了一种基于社会化标注的博客标签推荐方法。该方法的优势在于:利用相似博客的社会化标签作为候选标签集,确保了推荐标签的全面性和可用性;基于TF-IDF相似度方... 为了提高博客系统推荐标签的质量,分析了现有的标签推荐算法及相关技术,提出了一种基于社会化标注的博客标签推荐方法。该方法的优势在于:利用相似博客的社会化标签作为候选标签集,确保了推荐标签的全面性和可用性;基于TF-IDF相似度方法定义筛选步骤去除候选标签集中冗余和冷僻的标签,提高了推荐标签的准确性和高效性。实验结果表明了该方法的有效性。 展开更多
关键词 社会化标注 标签推荐算法 典型相关分析 文本特征加权方法 标签冗余
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部