-
题名集合和字符串的相似度查询
被引量:35
- 1
-
-
作者
林学民
王炜
-
机构
华东师范大学软件学院
澳大利亚新南威尔士大学计算机科学与工程系
-
出处
《计算机学报》
EI
CSCD
北大核心
2011年第10期1853-1862,共10页
-
基金
澳大利亚研究理事会Discovery Projects(DP110102937
DP0987557
+4 种基金
DP0987273
DP0881035
DP0881779)
国家自然科学基金(NSFC61021004)
Google的资助~~
-
文摘
相似度查询是计算机学科中一个重要的问题,它的应用遍及多个领域,例如数据库、数据集成、互联网、数据挖掘以及生物信息学等.该文主要讨论在集合和字符串上的相似度查询.学术界从2000年来在这个领域内取得了大量的进展.作者总结了主要工作,并给出了作者的分析和归类.最后,该文提出了一些未来工作的方向.
-
关键词
相似度查询
相似度连接
前缀过滤
jaccard
编辑距离
-
Keywords
similarity query
similarity join
prefix filtering
jaccard
edit distance
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于混合策略的中文查询串相似度计算
被引量:3
- 2
-
-
作者
章成敏
鞠海燕
-
机构
中国药科大学图书馆
南京农业大学工学院
-
出处
《情报杂志》
CSSCI
北大核心
2005年第11期101-103,105,共4页
-
文摘
综合考虑查询串所包含关键词的词形、语义、语用三个层面的信息计算查询串相似度的计算方法。首先利用字面相似度算法计算查询串在词形上的相似度,然后利用义类词典进行关键词在语义层面上的匹配,得到查询串在语义层面上的相似度,接着以搜索引擎作为语料库来源,将查询串提交给搜索引擎,通过对返回结果中重叠部分的统计分析,计算查询串在语用上的相似度,最后综合这三个相似度,完成相似度的计算。实验结果表明该算法的有效性。
-
关键词
查询串相似度
语义相似度
字面相似度
语用相似度
查询
混合策略
中文
搜索引擎
语义层
计算方法
-
分类号
G254.1
[文化科学—图书馆学]
H315.9
[语言文字—英语]
-