-
题名维吾尔文网络查询扩展词的构建研究
被引量:3
- 1
-
-
作者
年梅
张兰芳
-
机构
新疆大学计算机科学与技术博士后流动站
新疆师范大学网络信息安全与舆情分析实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第4期187-189,194,共4页
-
基金
国家自然科学基金资助项目(61163064)
新疆师范大学网络信息安全与舆情分析实验室公开招标课题基金资助项目(WLYQ2012110)
新疆师范大学研究生科技创新基金资助项目(20131204)
-
文摘
为提高维吾尔文网络内容查询的扩展性能,提出一种将维语同义词和互联网资源相结合的扩展词构建算法。利用维吾尔语同义词词典、近义词词典和反义词词典等建立基本候选词库,将互联网作为超大规模语料库,以搜索引擎为工具,使用改进的点互信息对基本扩展词进行相似度评价,选取前N个词形成候选扩展词库1,对包含关键词的互联网语料,基于局部共现和点互信息分析,构建候选扩展词库2,对上述2种候选扩展词库加权求和,按顺序选择部分词为扩展词。通过搜索引擎实现扩展查询验证,结果表明,与常规查询和同义词查询扩展算法相比,该算法能明显提高查询的准确率。
-
关键词
查询扩展
局部共现分析
点互信息算法
扩展词
大规模语料库
-
Keywords
query expansion
local co-occurrence analysis
point mutual information algorithm
expansion word
large scale corpus
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-