期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
受限域FAQ中文问答系统研究 被引量:6
1
作者 余正涛 邓锦辉 +3 位作者 韩露 毛存礼 郑志蕴 郭剑毅 《计算机研究与发展》 EI CSCD 北大核心 2007年第z2期388-393,共6页
在受限域中采用常问问题(FAQ)实现业务咨询系统是一种较好的问答模式,提出了一种受限域FAQ问答系统模型,借助于本体论的思想,构建了领域知识库,利用KDML语言定义和描述了领域本体及本体之间的关系,并实现了领域知识库"领域知网&qu... 在受限域中采用常问问题(FAQ)实现业务咨询系统是一种较好的问答模式,提出了一种受限域FAQ问答系统模型,借助于本体论的思想,构建了领域知识库,利用KDML语言定义和描述了领域本体及本体之间的关系,并实现了领域知识库"领域知网"与常识库"知网"的融合.在此基础上,提出了一种问句相似度的计算方法,该方法借助领域问句所具有的特点,结合问句中的词法关系、句法依存关系及领域概念关系,实现问句相似度计算.并以相似度计算为基础,从侯选问题集中检索相关问句,提取问题答案.云南旅游FAQ问答原型系统测试结果表明该方法可行,有较好的效果. 展开更多
关键词 受限域问答系统 常问问题库 领域本体库 问句相似度
在线阅读 下载PDF
中文专家实体主页识别方法研究
2
作者 李丽娜 余正涛 +2 位作者 王亚盛 毛存礼 郭剑毅 《广西师范大学学报(自然科学版)》 CAS 北大核心 2011年第1期157-161,共5页
专家实体主页识别是专家检索的一个重要的组成部分,本文提出了一种基于J48的机器学习算法来对中文专家实体主页进行分类识别。首先,人工收集中文专家实体及对应的专家主页面2 113个,针对中文专家实体特点,定义与链接和网页内容特征相关... 专家实体主页识别是专家检索的一个重要的组成部分,本文提出了一种基于J48的机器学习算法来对中文专家实体主页进行分类识别。首先,人工收集中文专家实体及对应的专家主页面2 113个,针对中文专家实体特点,定义与链接和网页内容特征相关的专家实体特征,并对这些特征进行提取,形成训练数据集。然后,采用不同学习算法对在不同特征上的页面进行主页识别,寻找最有效的分类特征和主页识别学习算法。最后,对不同特征、不同算法进行测试,实验结果表明,采用J48算法,结合链接与网页内容特征,中文专家实体主页识别取得了较好的效果,其识别准确率达到了81.05%。 展开更多
关键词 中文专家实体 主页识别 链接特征 网页特征 J48
在线阅读 下载PDF
中文问答对过滤方法研究
3
作者 毛煜 余正涛 +3 位作者 孟祥燕 张志坤 许洋波 郭剑毅 《广西师范大学学报(自然科学版)》 CAS 北大核心 2009年第3期142-145,共4页
问答对过滤是准确自动获取问答对的关键。提出针对领域和面向句子的中文问答对过滤方法,结合句法结构关系和领域特征,选取句子主干与领域词汇作为分类特征,采用贝叶斯分类学习方法进行领域问答对过滤;根据中文语言相关性,融合句法、词... 问答对过滤是准确自动获取问答对的关键。提出针对领域和面向句子的中文问答对过滤方法,结合句法结构关系和领域特征,选取句子主干与领域词汇作为分类特征,采用贝叶斯分类学习方法进行领域问答对过滤;根据中文语言相关性,融合句法、词法及语义要素,计算句子与问答对相关性,以相关性为基础,过滤面向句子相关的问答对。实验结果表明,提出的过滤方法均取得了较好的效果,相对传统过滤方法,能够提高问答对过滤的准确率。 展开更多
关键词 问答对过滤 贝叶斯 领域过滤 句子相关性 句子相关过滤
在线阅读 下载PDF
基于层叠条件随机场的旅游领域命名实体识别 被引量:37
4
作者 郭剑毅 薛征山 +3 位作者 余正涛 张志坤 张宜浩 姚贤明 《中文信息学报》 CSCD 北大核心 2009年第5期47-52,共6页
针对旅游领域,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法。该方法在低层条件随机场中以字为切分粒度,结合旅游景点常用字表、景点常用后缀表、地名常用字表等特征词典,实现简单旅游命名实体的识别;其识别结果传递到... 针对旅游领域,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法。该方法在低层条件随机场中以字为切分粒度,结合旅游景点常用字表、景点常用后缀表、地名常用字表等特征词典,实现简单旅游命名实体的识别;其识别结果传递到高层模型,以词为切分粒度,结合复杂特征,实现嵌套景点、特产风味、地点的识别。最后进行了两组相关实验,结果表明,在开放测试中,层叠条件随机场模型相比于单层模型,F值提高了8个百分点;相比于HMM模型,正确率提高了8个百分点,召回率提高了22个百分点,F值提高了15个百分点。 展开更多
关键词 计算机应用 中文信息处理 旅游领域 命名实体识别 层叠条件随机场 特征模板
在线阅读 下载PDF
基于条件随机场的英文产品命名实体识别 被引量:13
5
作者 张朝胜 郭剑毅 +3 位作者 线岩团 余正涛 雷春雅 王海雄 《计算机工程与科学》 CSCD 北大核心 2010年第6期115-117,共3页
英文产品命名实体识别目前国内外研究得较少,本文针对TREC 2009英文产品命名实体(EPNE)识别的任务,首次提出了一种基于条件随机场模型(CRF)的英文产品命名实体识别方法。在条件随机场中,该方法以词作为切分粒度,充分利用上下文和英文产... 英文产品命名实体识别目前国内外研究得较少,本文针对TREC 2009英文产品命名实体(EPNE)识别的任务,首次提出了一种基于条件随机场模型(CRF)的英文产品命名实体识别方法。在条件随机场中,该方法以词作为切分粒度,充分利用上下文和英文产品名特有的指示信息作为分类特征,结合手工构建的品牌词表进行建模。实验表明,该方法获得了较好的结果,英文产品实体识别准确率达到93.6%,召回率达到92.4%。 展开更多
关键词 英文产品 条件随机场 特征选择 命名实体识别
在线阅读 下载PDF
基于改进贝叶斯的领域问答对自动获取 被引量:4
6
作者 孟祥燕 余正涛 +2 位作者 许洋波 毛煜 郭剑毅 《广西师范大学学报(自然科学版)》 CAS 北大核心 2009年第1期189-192,共4页
问答对的规模和质量是影响基于常问问题集问答系统性能的重要因素,目前所使用的问答对库一般是人工构建的,往往需要耗费大量的时间和人力物力。针对此问题,提出一种基于改进贝叶斯的领域问答对自动获取方法。该方法将HTML页面解析成DOM... 问答对的规模和质量是影响基于常问问题集问答系统性能的重要因素,目前所使用的问答对库一般是人工构建的,往往需要耗费大量的时间和人力物力。针对此问题,提出一种基于改进贝叶斯的领域问答对自动获取方法。该方法将HTML页面解析成DOM树,选择DOM树的节点信息和结构信息作为问答对的分类特征,结合受限领域知识库,利用改进贝叶斯分类模型,从HTML页面中自动获取问答对并过滤出领域问答对。实验结果表明,该方法效果显著。 展开更多
关键词 问答系统 问答对获取 改进贝叶斯 受限领域
在线阅读 下载PDF
旅游领域实体答案的抽取 被引量:2
7
作者 李桂兰 余正涛 +3 位作者 毛存礼 郭剑毅 侯波 线岩团 《广西师范大学学报(自然科学版)》 CAS 北大核心 2009年第1期181-184,共4页
提出一种基于模式匹配与命名实体识别相结合的领域答案抽取方法,该方法用答案模式串、答案模式权值和答案类型三要素来定义并构建答案模式库,结合旅游领域命名实体识别方法和模式匹配方法,实现了旅游领域实体答案的抽取。在旅游领域进... 提出一种基于模式匹配与命名实体识别相结合的领域答案抽取方法,该方法用答案模式串、答案模式权值和答案类型三要素来定义并构建答案模式库,结合旅游领域命名实体识别方法和模式匹配方法,实现了旅游领域实体答案的抽取。在旅游领域进行实体答案抽取实验,取得了较好的效果,其中召回率达88.78%,准确率达86.04%。 展开更多
关键词 答案抽取 模式匹配 命名实体识别
在线阅读 下载PDF
纳-汉双语语料库构建及双语语料对齐 被引量:2
8
作者 赵芳婷 余正涛 +3 位作者 线岩团 郭剑毅 毛存礼 候波 《广西师范大学学报(自然科学版)》 CAS 北大核心 2009年第1期161-164,共4页
当前存在着部分纳西语-汉语双语互译文本,利用这些双语互译文本构建大规模的双语语料库,是双语互译文本的深层加工及其双语词典编纂、跨语言信息检索面临的关键问题。提出了一个大规模纳-汉双语语料库的构建方案,包括其总体规划标准制... 当前存在着部分纳西语-汉语双语互译文本,利用这些双语互译文本构建大规模的双语语料库,是双语互译文本的深层加工及其双语词典编纂、跨语言信息检索面临的关键问题。提出了一个大规模纳-汉双语语料库的构建方案,包括其总体规划标准制定、实施方案和流程细节。通过组织构建纳-汉双语语料库,实现双语语料库在统计的机器翻译系统中的应用,并实现纳-汉之间的双语对照翻译系统,较好地提高翻译的准确性和可读性,进而推动少数民族语言信息化的发展。 展开更多
关键词 双语语料库 双语对照 机器翻译
在线阅读 下载PDF
利用问句语义结构构建旅游领域数据库查询
9
作者 王凤林 余正涛 +1 位作者 毛存礼 郭剑毅 《广西师范大学学报(自然科学版)》 CAS 北大核心 2009年第1期185-188,共4页
为了提高数据库查询的准确率,提出一种利用问句语义结构构建领域自然语言数据库查询方法。该方法通过定义问句语义模板,借助领域知识,对领域问句进行语义分析,提取问句语义块,并通过语义模式匹配实现问句语义模板向SQL的转换,从而实现... 为了提高数据库查询的准确率,提出一种利用问句语义结构构建领域自然语言数据库查询方法。该方法通过定义问句语义模板,借助领域知识,对领域问句进行语义分析,提取问句语义块,并通过语义模式匹配实现问句语义模板向SQL的转换,从而实现自然语言数据库查询。在云南旅游领域实验的结果表明,该方法取得了较好的效果。 展开更多
关键词 问句语义结构 自然语言查询 数据库查询
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部