-
题名异质知识网络相关度算法研究
被引量:2
- 1
-
-
作者
裘江南
秦璇
仲秋雁
-
机构
大连理工大学管理学院
-
出处
《情报学报》
CSSCI
北大核心
2011年第5期495-502,共8页
-
基金
国家社会科学基金(批准号:07CTQ006)
-
文摘
异质知识网络是Web2.0的基础,其中的相关度算法是实现通过信息检索人、资源或通过人检索信息、资源的关键。然而目前的相关度算法研究大多局限于同质知识网络,忽略了在异质知识网络中的研究。因此,本文结合异质知识网络所具有的特性,明确异质知识网络相关度的定义,进而对现有的相关度算法分析的基础上,总结并归纳适用于异质知识网络的相关度算法,并根据Web2.0环境下产生的社会性信息检索需求,进一步说明其未来的发展趋势。
-
关键词
异质知识网络
同质知识网络
相关度算法
-
Keywords
heterogeneous knowledge networks
homogeneous knowledge networks
relatedness algorithm
-
分类号
G229.24
[文化科学]
-
-
题名半结构化中文信息检索中查询结果相关度算法的研究
被引量:2
- 2
-
-
作者
曲卫民
孙乐
孙玉芳
-
机构
中科院软件所系统软件与中文信息中心
-
出处
《中文信息学报》
CSCD
北大核心
2004年第4期15-22,共8页
-
基金
国家自然科学基金资助项目 (6 99830 0 9)
国家 86 3计划资助项目 (2 0 0 1AA1 1 4 0 4 0 )
-
文摘
本文研究了对富含文本信息的XML数据进行基于关键字的查询时 ,查询结果与查询条件之间相关度的计算问题 ,分析了利用传统信息检索技术解决该问题时存在的一些不足 ,提出了一种基于节点的动态的关键字权重计算法 ,以及综合考虑关键字在查询结果中的频率分布特征和结构分布特征的查询结果相关度计算法 ,有效解决了XML数据中的结构信息对相关度计算的影响 。
-
关键词
计算机应用
中文信息处理
XML
息检索
相关度算法
-
Keywords
and a ranking function that consider both the frequency distribution and structural distribution of keywords in the result. Experimental results prove the effectiveness of our solution. Key words: computer application
Chinese information proc
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于概念树剪枝的LCA查询扩展
被引量:2
- 3
-
-
作者
李卫疆
王锋
-
机构
昆明理工大学信息工程与自动化学院
-
出处
《计算机科学》
CSCD
北大核心
2015年第S1期479-483,共5页
-
基金
国家自然科学基金项目:基于统计机器翻译和自动文摘的查询扩展研究(61363045)资助
-
文摘
在信息检索应用实践中存在用户表达查询请求不够准确、文档与查询词不匹配以及查询优化等问题。针对这些问题,提出了基于概念树剪枝的LCA查询扩展方法,这种混合的查询扩展技术综合了语义和局部上下文分析这两种查询扩展方法,利用LCA方法检索得到的扩展词集对语义词典构造的概念树进行适当剪枝,以弥补概念树的不足,并对扩展词候选集用改进的算法重新分配权重。在TREC数据集的实验结果表明:与单独基于统计或者基于语义的查询扩展方法相比,基于概念树剪枝的LCA查询扩展方法性能有较大提高。
-
关键词
查询扩展
局部上下文分析方法
概念树
剪枝
相关度算法
-
Keywords
Query expansion,Local context analysis,Concept tree,Pruning,Relevance algorithm
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Lucene的数字作品搜索引擎的研究与设计
被引量:10
- 4
-
-
作者
吴洁明
韩云辉
冀单单
-
机构
北方工业大学信息工程学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2013年第5期166-172,共7页
-
基金
国家科技部支撑计划课题基金资助项目(2012BAH04f03)
科研基地-科研创新平台资助项目(PXM2013_014212_000011)
-
文摘
在Lucene的全文检索工具包的基础上,分析现有的主流中文分词算法和Lucene相关度排序算法,提出了改进的分词算法和改进的相关度排序算法。还采用倒排索引、检索技术、分布式存储和并行计算等技术,分析并设计了一个对海量数字作品信息的搜索引擎,为用户提供对海量数字作品信息的快速、准确的搜索服务。实验分析比较了分词速度和分词效果,还比较了关键词搜索结果的响应时间、命中数量、准确率和召回率。实验结果表明,本系统在很大程度上提高了搜索速度,保证了搜索结果的准确性。
-
关键词
LUCENE
分词算法
索引
相关度排序算法
分布式
-
Keywords
Lucene
segmentation algorithm
index
relevance sorting algorithm
distributed
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-