-
题名一种基于语言概念空间聚类的信息检索方法
被引量:4
- 1
-
-
作者
吴晨
张全
-
机构
中国科学院研究生院
中国科学院声学研究所
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第8期51-53,56,共4页
-
基金
国家"973"计划基金资助项目"自然语言理解的交互引擎研究"(2004CB318104)
中科院声学研究所知识创新工程项目"HNC语言知识处理理论及技术"
-
文摘
提出了一种以语言概念空间中的概念为聚类对象的信息检索方法以及适合于该方法的聚类算法。该聚类算法通过曲线拟合技术来实现文本的自动阈值确定和聚类划分,并最终通过聚类间的迭代和结果修正来完成整个聚类过程。概念的引入为解决词语的同义、多义问题提供了有力保障。实验表明,采用该方法的信息检索系统,与Jelinek-Mercer、k-means模型相比有较高的准确率和召回率,效果理想。
-
关键词
信息检索
语言概念空间
聚类
自动阈值下的聚类划分
-
Keywords
Information retrieval
Language concept space
Clustering
Auto threshold-detection and classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语言概念空间的跨语种信息检索模型
- 2
-
-
作者
吴晨
张全
缪建明
-
机构
中国科学院研究生院
中国科学院声学研究所
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第18期9-11,19,共4页
-
基金
国家"973"计划基金资助项目"自然语言理解的交互引擎研究"(2004CB318104)
中科院声学所知识创新工程基金资助项目"HNC语言知识处理理论及技术"
-
文摘
提出了一种基于语言概念空间的跨语种信息检索模型,该模型以建立在语言概念空间中的形式化语境单元框架表示处理所需的中间信息,通过用以描述语境单元框架的语义符号间的匹配和生成机制来实现文本的跨语种检索,有助于避开用形式多样的具体语言作为处理中介存在的模糊消解问题。实验证明,这一模型显著改善了检索系统的性能。
-
关键词
跨语种信息检索
语言概念空间
语境单元框架
-
Keywords
Cross-language information retrieval
Language concept space
Sentences group unit framework
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于概念匹配的中文问答处理模型核心问题探讨
被引量:2
- 3
-
-
作者
吴晨
张全
-
机构
中国科学院研究生院
中国科学院声学研究所
-
出处
《中文信息学报》
CSCD
北大核心
2006年第4期49-55,共7页
-
基金
国家973项目资助(2004CB318104)
中科院声学所知识创新工程资助项目
-
文摘
为了解决问答处理系统中的语义模糊问题,提高问答处理的性能,研究人员尝试采用概念作为系统处理的对象,而不再是语言表层符号,然而,在引入概念进行处理的同时引来了一些新的问题,如概念的抽取、概念关联计算以及特定于问答系统的问题理解、问题求解、答案生成等问题。在概念抽取、概念关联计算方面,已有一些比较成功的算法。本文将在此基础上,针对实现这样一个问答处理系统所存在的一些未涉及的核心问题进行一个探讨,同时提出解决以上问题的方法。实验及实际应用表明基于所提出算法的概念问答系统具有较强的性能,系统总体自动处理准确率将近达到40%。在实际应用中也表现出较高的应用价值。
-
关键词
计算机应用
中文信息处理
中文问答系统
语言概念空间
核心问题研究
概念匹配
算法
-
Keywords
computer application
Chinese information processing
Chinese question answering system
concept space of natural language
key problem
concept matching
algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于内容分析的中文问答处理算法及系统实现
被引量:4
- 4
-
-
作者
吴晨
张全
-
机构
中国科学院研究生院
中国科学院声学研究所
-
出处
《计算机应用研究》
CSCD
北大核心
2006年第9期139-142,共4页
-
基金
国家"973"计划资助项目(2004CB318104)
中科院声学所知识创新工程项目
-
文摘
提出了一种基于HNC自然语言理解框架下的中文问答处理算法,并在此算法基础上加以系统实现。试验证明,该系统在中等规模常识库基础上效果显著、准确率高。
-
关键词
中文信息处理
问答系统
语言概念空间
语义相关度
HNC理论
-
Keywords
Chinese Information Processing
Question Answering System
Concept Space of Language
Word Semantic Relativity
HNC Theory
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名HNC问答处理系统关键算法研究
- 5
-
-
作者
吴晨
张全
-
机构
中国科学院研究生院
中国科学院声学研究所北京
中国科学院声学研究所
-
出处
《计算机科学》
CSCD
北大核心
2006年第6期200-202,217,共4页
-
基金
国家973项目"自然语言理解的交互引擎研究"(2004CB318104)
中科院声学所知识创新工程"语言知识处理理论及技术"的资助。
-
文摘
HNC问答处理系统是一种崭新的问答处理模式,与传统的问答处理系统相比,它把对语言的处理深入到语言概念空间中进行,以求尽可能地减少语言中的同义和多义模糊。本文在介绍HNC问答处理系统整体构架的同时,设计和实现了问答系统中的3个关键算法,服务于问答系统的不同阶段处理需要。实际应用表明,在这些算法指导下的HNC问答处理系统具有良好的问题处理能力。
-
关键词
中文信息处理
问答系统
语言概念空间
语义相关度
HNC理论
-
Keywords
Chinese information processing, Question answering system, Concept splice of language, Word semantic relativity, Hierarchical network concept theory
-
分类号
TP317.2
[自动化与计算机技术—计算机软件与理论]
-