-
题名基于扩展查询表达式的XML关键字查询
被引量:4
- 1
-
-
作者
朱菁华
王晓玲
-
机构
复旦大学计算机科学技术学院
-
出处
《计算机工程》
CAS
CSCD
2014年第10期25-31,共7页
-
基金
国家自然科学基金资助项目(60773075)
-
文摘
目前可扩展标示语言(XML)关键字查询大多是基于最小公共祖先(LCA)语义子树产生查询结果,而未能加入除LCA语义子树之外与用户查询意图相关的结果。为解决该问题,提出一种基于扩展查询表达式的XML关键字查询方法。将用户查询日志作为查询扩展统计模型,对其进行统计分析,并结合最佳检索概念判断是否需要扩展查询表达式。使用XML TF-IDF方法计算候选属性的权重,根据初检结果的上下文信息,利用聚类方法获得与查询意图最相关的扩展查询关键字,从而扩展查询表达式。实验结果表明,与XSeek和基于语义词典的查询扩展方法相比,该方法的平均F度量值分别提高了7%和17%,具有较高的查询质量。
-
关键词
信息检索
可扩展标示语言
最小公共祖先语义
关键字查询
查询扩展
上下文信息
-
Keywords
information retrieval
eXtensive Markup Language (XML)
Lowest Common Ancestor ( LCA ) semantic
keyword search
query expansion
context information
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-