-
题名跨语言信息检索中的命名实体识别与翻译
被引量:7
- 1
-
-
作者
吴丹
何大庆
陆伟
-
机构
武汉大学信息管理学院
匹兹堡大学信息科学学院.美国匹兹堡
-
出处
《图书情报知识》
CSSCI
北大核心
2012年第3期13-19,共7页
-
基金
武汉大学“70后”学者学术发展计划项目“跨语言环境下的细粒度信息检索与可视化知识挖掘”
教育部人文社会科学研究项目“多语言信息获取中的用户相关反馈研究”(09YJC870022)成果之一
-
文摘
综述命名实体识别与翻译研究现状,提出基于信息抽取的命名实体识别与翻译方法,以及对该方法进行一系列集成优化处理,并实现了基于命名实体识别与翻译的跨语言信息检索实验。实验结果显示出命名实体识别与翻译在跨语言信息检索中的重要性,并证明了所提出的翻译加权和网络挖掘未登录命名实体方法的应用能显著提高跨语言信息检索的性能。
-
关键词
命名实体
跨语言信息检索
识别
翻译
-
Keywords
Named entity Cross language information retrieval Extraction Translation
-
分类号
G350
[文化科学—情报学]
-
-
题名基于伪相关反馈的跨语言查询扩展
被引量:19
- 2
-
-
作者
吴丹
何大庆
王惠临
-
机构
武汉大学信息管理学院
美国匹兹堡大学信息科学学院
中国科学技术信息研究所
-
出处
《情报学报》
CSSCI
北大核心
2010年第2期232-239,共8页
-
基金
本文为2008年武汉大学人文社会科学研究青年项目成果之一.
-
文摘
相关反馈是一种重要的查询重构技术,本文分析了两类相关反馈技术,一是按用户是否参与可分为伪相关反馈和交互式相关反馈,二是按作用于查询的方式可分为查询扩展与检索词重新加权。在此基础上,本文重点探讨了将相关反馈技术应用于跨语言信息检索,提出了翻译前查询扩展、翻译后查询扩展、翻译前与翻译后相结合的查询扩展三种方法。最后,本文通过伪相关反馈实验对这三种方法进行了比较,实验结果显示,三种跨语言查询扩展方法都能够有效地提高检索结果的精度,其中翻译后查询扩展方法相对更优越。此外,查询式的长度对不同跨语言查询扩展方法产生着不同程度的影响。
-
关键词
相关反馈
伪相关反馈
跨语言信息检索
查询扩展
-
Keywords
relevance feedback, pseudo relevance feedback, cross-language information retrieval, query expansion
-
分类号
G250.73
[文化科学—图书馆学]
-
-
题名一种基于统计语义聚类的查询语言模型估计
被引量:3
- 3
-
-
作者
蒲强
何大庆
杨国纬
-
机构
电子科技大学计算机科学与工程学院
匹兹堡大学信息科学学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2011年第2期224-231,共8页
-
基金
中国国家留学基金项目
美国国家自然科学基金项目(NSF/IIS0704628)
-
文摘
如何有效生成文档聚类并使用聚类信息提高检索效果是信息检索中的重要研究课题.如果假设文档中存在若干隐含的独立主题,那么文档可以看成是由这些隐含的独立主题混合噪声相互作用的结果.基于这个假设提出了一种基于独立分量分析的语义聚类技术,试图借助于独立分量分析的良好主题区分能力,将一组文档按照实际隐含的主题在语义空间上聚类.在语言模型的框架下,语义主题聚类将由用户初始查询按照一定的度量方式激活.利用激活语义聚类的信息估计一个反馈语义主题模型,并与初始查询模型一起形成新的查询模型.在5个TREC数据集上的实验结果表明:基于统计语义聚类估计的查询模型相比传统的查询模型以及其他基于聚类的语言模型在检索性能上有显著性提高.其主要原因是应用了和用户查询最相似的语义聚类信息来估计查询模型.
-
关键词
语义聚类
独立分量分析
查询模型
相关模型
语言模型
伪相关反馈
-
Keywords
semantic clustering
independent component analysis
query model
relevance model
language model
pseudo relevance feedback
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名期刊网络引文可追溯性研究与实现
被引量:1
- 4
-
-
作者
邓晰
韩曙光
沈祥兴
-
机构
海南大学艺术学院
匹兹堡大学信息科学学院
武汉大学信息管理学院
-
出处
《实验室研究与探索》
CAS
北大核心
2014年第8期252-257,303,共7页
-
基金
国家社科基金青年艺术学项目(13CB135)
中央高校基本科研业务费专项资金项目(2012GSP084)
-
文摘
从期刊网络引文的可追溯性角度,研究网络信息资源的变化规律,对传统引文数据库的发展起到一定的借鉴作用。本文分析了网络引文不可追溯性的国内外研究现状,探讨了该现象产生的原因,并对这一问题提出了主要解决方法:期刊网络引文可追溯性系统平台应着重解决网络信息资源变化规律,该平台可由现刊和过刊网络引文可追溯检索模块构成,重构期刊网络引文访问机制,以实现网络引文的可追溯性。
-
关键词
网络引文
可追溯性
现刊
过刊
信息存储
-
Keywords
Web citation
accessibility
current issues
archive issues
information memory
-
分类号
G252.34
[文化科学—图书馆学]
-