检索结果-维普期刊中文期刊服务平台

基于改进编辑距离的中文相似句子检索被引量：65: 1; 作者车万翔刘挺 +1 位作者秦兵李生《高技术通讯》 EI CAS CSCD 2004年第7期15-19,共5页; 中文相似句子检索的方法在基于实例的机器翻译等中文信息处理领域，具有非常广泛的应用背景。本文提出的基于改进编辑距离的中文相似句子检索方法，在使用信息检索技术提高检索效率的同时，以普通编辑距离算法为基础，加入了词汇的语义... 展开更多; 关键词改进编辑距离中文相似句子检索英文辅助写作机器翻译; 在线阅读下载PDF 职称材料

开放域问答技术研究进展被引量：17: 2; 作者张志昌张宇 +1 位作者刘挺李生《电子学报》 EI CAS CSCD 北大核心 2009年第5期1058-1069,共12页; 问答技术是信息检索和自然语言理解中的研究热点.本文对开放域问答技术在近年来的研究进展进行了总结.针对不同类型的问题,比较了问答系统中问题分析、文档和句段检索、答案抽取各个部分不同实现方法的特点,讨论了这些技术中存在的不足... 展开更多; 关键词开放域问答问题分析相关文档检索句段检索答案抽取; 在线阅读下载PDF 职称材料

统计词义消歧的研究进展被引量：28: 3; 作者卢志茂刘挺李生《电子学报》 EI CAS CSCD 北大核心 2006年第2期333-343,共11页; 本文参考大量的文献资料,分析了当前国内外统计词义消歧研究中采用的多种方法和技术,指出了统计词义消歧研究的关键问题,并围绕关键问题阐述了统计词义消歧的研究进展,探讨了研究中存在的问题和未来研究的重点.; 关键词统计词义消歧自然语言处理综述; 在线阅读下载PDF 职称材料

神经网络和贝叶斯网络在汉语词义消歧上的对比研究被引量：9: 4; 作者卢志茂刘挺 +1 位作者郎君李生《高技术通讯》 EI CAS CSCD 2004年第8期15-19,共5页; 神经网络和贝叶斯网络是两种经典的机器学习方法。本文通过实验考察了这两种网络模型在汉语词义消歧上的应用效果。实验对象是通过特定规则构造的6个伪词。使用伪词可以避免有指导的词义消歧方法中的数据稀疏问题，充分验证词义分类器... 展开更多; 关键词神经网络贝叶斯网络汉语互信息词义消歧机器学习; 在线阅读下载PDF 职称材料

基于线索词识别和训练集扩展的中文问题分类被引量：6: 5; 作者张志昌张宇 +1 位作者刘挺李生《高技术通讯》 EI CAS CSCD 北大核心 2009年第2期111-118,共8页; 针对问题分类的数据稀疏问题,提出了一种以疑问词和焦点词为关键线索的中文事实型问题分类方法。该方法首先自动识别用户提出的问题中的疑问词和焦点词,若疑问词和焦点词存在,则用最近邻模型进行分类,而对没有用最近邻方法分类的其他问... 展开更多; 关键词问题分类焦点词词义距离训练集扩展; 在线阅读下载PDF 职称材料

基于网络挖掘的实体关系元组自动获取被引量：7: 6; 作者李维刚刘挺李生《电子学报》 EI CAS CSCD 北大核心 2007年第11期2111-2116,共6页; 二元实体关系元组可以应用到知识库构建,数据挖掘,模式抽取等多个领域.本文利用特定关系的一个元组和一个关键词作为种子,结合多种自然语言处理底层技术,采取改进的模式获取方法和自举迭代策略,提出了一种新的从Web上抽取实体关系元组... 展开更多; 关键词自举方法实体关系元组信息抽取网络挖掘; 在线阅读下载PDF 职称材料

基于SVM的汉语句子片段划分: 7; 作者马金山刘挺李生《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2009年第5期52-55,共4页; 针对长句子引起句法分析性能下降的问题,本文提出了一种基于SVM的句子片段划分方法:先根据语法结构将句子划分为多个片段,识别出每个片段的类别;然后根据片段的类别将句子分割为几个部分,每个部分作为句法分析的基本单元;最后将句法分... 展开更多; 关键词依存句法分析句子片段依存关系支持向量机; 在线阅读下载PDF 职称材料

题名基于改进编辑距离的中文相似句子检索被引量：65: 1; 作者车万翔刘挺秦兵李生; 机构哈尔滨工业大学计算机学院信息检索研究室哈尔滨; 出处《高技术通讯》 EI CAS CSCD 2004年第7期15-19,共5页; 文摘中文相似句子检索的方法在基于实例的机器翻译等中文信息处理领域，具有非常广泛的应用背景。本文提出的基于改进编辑距离的中文相似句子检索方法，在使用信息检索技术提高检索效率的同时，以普通编辑距离算法为基础，加入了词汇的语义信息，使之更加符合中文句子相似度计算的要求。改进编辑距离与单纯基于语义辞典计算句子相似度的方法相比，具有便于扩展，准确率高等优点。在基于大规模双语句对检索的英文辅助写作系统中使用该算法进行中文句子检索，最后获得了81．33％的查准率和95．31％的查全率。; 关键词改进编辑距离中文相似句子检索英文辅助写作机器翻译; 分类号 G354.4 [文化科学—情报学] TP391.1 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名开放域问答技术研究进展被引量：17: 2; 作者张志昌张宇刘挺李生; 机构哈尔滨工业大学计算机学院信息检索研究室西北师范大学数学与信息科学学院; 出处《电子学报》 EI CAS CSCD 北大核心 2009年第5期1058-1069,共12页; 基金国家自然科学基金重点项目(No.60736044) 国家自然科学基金(No.60675034) 国家863计划探索类专题项目(No.2008AA01Z144); 文摘问答技术是信息检索和自然语言理解中的研究热点.本文对开放域问答技术在近年来的研究进展进行了总结.针对不同类型的问题,比较了问答系统中问题分析、文档和句段检索、答案抽取各个部分不同实现方法的特点,讨论了这些技术中存在的不足.最后,对问答技术未来的研究趋势进行了分析与展望.; 关键词开放域问答问题分析相关文档检索句段检索答案抽取; Keywords open domain question answering question analysis relevant document retrieval passage retrieval answer extraction; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名统计词义消歧的研究进展被引量：28: 3; 作者卢志茂刘挺李生; 机构哈尔滨工业大学计算机学院信息检索研究室; 出处《电子学报》 EI CAS CSCD 北大核心 2006年第2期333-343,共11页; 基金国家自然科学基金(No.60435020) 国家自然科学基金(No.60575042) 国家自然科学基金(No.60573072); 文摘本文参考大量的文献资料,分析了当前国内外统计词义消歧研究中采用的多种方法和技术,指出了统计词义消歧研究的关键问题,并围绕关键问题阐述了统计词义消歧的研究进展,探讨了研究中存在的问题和未来研究的重点.; 关键词统计词义消歧自然语言处理综述; Keywords statistical word sense disambiguation natural language processing survey; 分类号 TP301.6 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名神经网络和贝叶斯网络在汉语词义消歧上的对比研究被引量：9: 4; 作者卢志茂刘挺郎君李生; 机构哈尔滨工业大学计算机学院信息检索研究室哈尔滨; 出处《高技术通讯》 EI CAS CSCD 2004年第8期15-19,共5页; 文摘神经网络和贝叶斯网络是两种经典的机器学习方法。本文通过实验考察了这两种网络模型在汉语词义消歧上的应用效果。实验对象是通过特定规则构造的6个伪词。使用伪词可以避免有指导的词义消歧方法中的数据稀疏问题，充分验证词义分类器的实验效果。贝叶斯网络用于词义分类简单高效，模型容易构造，而神经网络的结构则相对复杂，用于词义消歧需要先解决输入问题。实验中采用词间互信息成功构造了神经网络的输入模型，实验效果较为理想。实验数据表明贝叶斯网络比神经网络更适合解决汉语词义消歧问题。但贝叶斯网络的抗噪声能力却明显逊色于神经网络。; 关键词神经网络贝叶斯网络汉语互信息词义消歧机器学习; 分类号 TP391.12 [自动化与计算机技术—计算机应用技术] TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于线索词识别和训练集扩展的中文问题分类被引量：6: 5; 作者张志昌张宇刘挺李生; 机构哈尔滨工业大学计算机学院信息检索研究室哈尔滨; 出处《高技术通讯》 EI CAS CSCD 北大核心 2009年第2期111-118,共8页; 基金 863计划(2006AA012145) 国家自然科学基金(60435020,60503072)资助项目; 文摘针对问题分类的数据稀疏问题,提出了一种以疑问词和焦点词为关键线索的中文事实型问题分类方法。该方法首先自动识别用户提出的问题中的疑问词和焦点词,若疑问词和焦点词存在,则用最近邻模型进行分类,而对没有用最近邻方法分类的其他问题,则用支持向量机(SVM)模型进行分类。训练SVM模型时,从Web上自动获取新问题来对训练集进行扩展,最近邻方法只利用线索词词义距离进行类别判断。实验表明,这种按照问题结构的不同而选择不同分类器的方法,在性能上要优于单一分类方法;词义距离的应用和训练集自动扩展改善了训练数据的稀疏,提高了分类性能。; 关键词问题分类焦点词词义距离训练集扩展; Keywords question classification, focus word, word sense distance, extension of training set; 分类号 TP391.1 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于网络挖掘的实体关系元组自动获取被引量：7: 6; 作者李维刚刘挺李生; 机构哈尔滨工业大学计算机学院信息检索研究室; 出处《电子学报》 EI CAS CSCD 北大核心 2007年第11期2111-2116,共6页; 基金国家自然科学基金(No.60503072 No.60575042); 文摘二元实体关系元组可以应用到知识库构建,数据挖掘,模式抽取等多个领域.本文利用特定关系的一个元组和一个关键词作为种子,结合多种自然语言处理底层技术,采取改进的模式获取方法和自举迭代策略,提出了一种新的从Web上抽取实体关系元组的方法.基准方法的平均准确率达到了78.12%,采用过滤措施后抽取方法的平均准确率达到了98.42%.实验结果表明,利用网络挖掘方法获取的实体关系元组能够很好满足信息抽取的应用,对抽取出的元组进一步处理,能够获取更多有价值的信息.; 关键词自举方法实体关系元组信息抽取网络挖掘; Keywords bootstrapping entity relation tuples information extraction web mining; 分类号 TP391.2 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于SVM的汉语句子片段划分: 7; 作者马金山刘挺李生; 机构哈尔滨工业大学计算机学院信息检索研究室; 出处《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2009年第5期52-55,共4页; 基金国家自然科学基金资助项目(60575042 60675034); 文摘针对长句子引起句法分析性能下降的问题,本文提出了一种基于SVM的句子片段划分方法:先根据语法结构将句子划分为多个片段,识别出每个片段的类别;然后根据片段的类别将句子分割为几个部分,每个部分作为句法分析的基本单元;最后将句法分析之后的各个部分进行合并,形成完整的分析结果.该方法减小了句法分析的复杂度,提高了分析的准确率.; 关键词依存句法分析句子片段依存关系支持向量机; Keywords dependency parsing segment dependency relation SVM; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于改进编辑距离的中文相似句子检索	车万翔刘挺秦兵李生	《高技术通讯》 EI CAS CSCD	2004	65	在线阅读下载PDF 职称材料
2	开放域问答技术研究进展	张志昌张宇刘挺李生	《电子学报》 EI CAS CSCD 北大核心	2009	17	在线阅读下载PDF 职称材料
3	统计词义消歧的研究进展	卢志茂刘挺李生	《电子学报》 EI CAS CSCD 北大核心	2006	28	在线阅读下载PDF 职称材料
4	神经网络和贝叶斯网络在汉语词义消歧上的对比研究	卢志茂刘挺郎君李生	《高技术通讯》 EI CAS CSCD	2004	9	在线阅读下载PDF 职称材料
5	基于线索词识别和训练集扩展的中文问题分类	张志昌张宇刘挺李生	《高技术通讯》 EI CAS CSCD 北大核心	2009	6	在线阅读下载PDF 职称材料
6	基于网络挖掘的实体关系元组自动获取	李维刚刘挺李生	《电子学报》 EI CAS CSCD 北大核心	2007	7	在线阅读下载PDF 职称材料
7	基于SVM的汉语句子片段划分	马金山刘挺李生	《哈尔滨工业大学学报》 EI CAS CSCD 北大核心	2009	0	在线阅读下载PDF 职称材料