-
题名基于向量距离的词序相似度算法
被引量:11
- 1
-
-
作者
董刊生
方金云
-
机构
中国科学院计算技术研究所空间信息处理技术实验室
-
出处
《中文信息学报》
CSCD
北大核心
2009年第3期45-50,共6页
-
文摘
手机POI搜索已经成为手机搜索的主要应用之一。该文结合手机搜索的特点以及POI数据的结构性特征采用简拼进行POI搜索。由于词序相似度是影响简拼搜索排序结果的主要因素,该文提出了基于向量距离计算词序相似度的算法。该算法采用空间向量模型作为简拼的表示方法,将提取的公共简拼映射为位置向量,进而利用位置向量间的距离计算词序相似度。通过理论分析,该算法相比基于逆序数的词序相似度算法,将时间复杂度由O(nlogn)降为O(n),空间复杂度由O(n)降为O(1)。实验结果表明,基于向量距离的词序相似度算法有效地保证了准确性,可以满足手机POI简拼搜索的应用需求,并在性能上将词序相似度的计算效率提高16.88%。
-
关键词
计算机应用
中文信息处理
手机POI搜索
简拼搜索
词序相似度
向量距离
-
Keywords
computer applications Chinese information processing
mobile POI search
jianpin search
word order similarity
vector distance
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于NLP技术的装备故障文本匹配算法研究
被引量:7
- 2
-
-
作者
祖月芳
凌海风
吕永顺
-
机构
陆军工程大学野战工程学院
-
出处
《兵器装备工程学报》
CSCD
北大核心
2021年第11期204-208,共5页
-
文摘
基于当前装备故障诊断的现状,依据在装备维修手册、装备履历书以及装备管理信息系统中存在大量的装备故障和维修经验等数据,结合装备故障文本的特点,提出了一种融合词性、语义及词序因子的故障文本相似度计算方法。该方法将装备故障文本中词汇的词性、语义及位置关系相联系,在余弦公式的基础上,通过文本中的词汇之间的相似度与词性权重的关联关系,改进相似度计算方法,并引入词序相似度进一步优化文本相似度。实验表明,所提出的方法较其他方法有更好的精确率和召回率,有效提高了装备故障文本的匹配效果。
-
关键词
装备故障文本
词向量
词性
语义
词序相似度
文本相似度
匹配算法
-
Keywords
equipment fault text
word vector
part of speech
semantics
word order similarity
text similarity
matching algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-