期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于启发式错误驱动学习的中文时间表达式识别 被引量:3
1
作者 贺瑞芳 秦兵 +2 位作者 潘越群 刘挺 李生 《高技术通讯》 EI CAS CSCD 北大核心 2008年第12期1258-1262,共5页
提出了一种基于启发式错误驱动学习的中文时间表达式识别的新方法。该方法先采用依存分析方法以时间触发词为切入点递归地识别时间表达式,有效地解决了长距离依赖的问题,大大提高了识别效果;在此基础上,对比错误识别结果和人工标注... 提出了一种基于启发式错误驱动学习的中文时间表达式识别的新方法。该方法先采用依存分析方法以时间触发词为切入点递归地识别时间表达式,有效地解决了长距离依赖的问题,大大提高了识别效果;在此基础上,对比错误识别结果和人工标注,采用启发式A*算法搜索策略进行错误驱动学习,降低了规则学习的复杂度,并具有区分每条规则的有效性和规则间相容性的优点,使系统性能提高近6%。最终在封闭测试集和开放测试集上,F值分别达到了77.96%和77.92%。 展开更多
关键词 时间表达式识别 时间触发词 依存分析 错误驱动学习 A*算法
在线阅读 下载PDF
基于SVM的组块识别及其错误驱动学习方法 被引量:6
2
作者 黄德根 王莹莹 《中文信息学报》 CSCD 北大核心 2006年第6期17-24,共8页
给出了一种错误驱动学习机制与SVM相结合的汉语组块识别方法。该方法在SVM组块识别的基础上,对SVM识别结果中的错误词语序列的词性、组块标注信息等进行分析,获得候选校正规则集;之后按照阈值条件对候选集进行筛选,得到最终的校正规则集... 给出了一种错误驱动学习机制与SVM相结合的汉语组块识别方法。该方法在SVM组块识别的基础上,对SVM识别结果中的错误词语序列的词性、组块标注信息等进行分析,获得候选校正规则集;之后按照阈值条件对候选集进行筛选,得到最终的校正规则集;最后应用该规则集对SVM的组块识别结果进行校正。实验结果表明,与单独采用SVM模型的组块识别相比,加入错误驱动学习方法后,组块识别的精确率、召回率和F值均得到了提高。 展开更多
关键词 计算机应用 中文信息处理 组块分析 错误驱动学习 支持向量机(SVM) 规则集
在线阅读 下载PDF
基于错误驱动学习和知网的中文人名识别 被引量:3
3
作者 李波 张蕾 《计算机工程》 CAS CSCD 2012年第12期179-181,共3页
针对统计与规则这2种方法的优缺点,提出一种基于转换的错误驱动学习与知网相结合的中文人名自动识别方法。利用标注语料库,根据在人名识别中的作用对人名上下文环境进行角色标注,提取标注后的实例,并采用基于转换的错误驱动方法和知网... 针对统计与规则这2种方法的优缺点,提出一种基于转换的错误驱动学习与知网相结合的中文人名自动识别方法。利用标注语料库,根据在人名识别中的作用对人名上下文环境进行角色标注,提取标注后的实例,并采用基于转换的错误驱动方法和知网对提取的实例进行可用规则提取,结合规则和实例对文本进行人名识别。实验结果表明,与其他方法相比,该方法的中文人名识别准确率、召回率和F值均有明显提高。 展开更多
关键词 中文人名识别 基于转换的错误驱动学习 知网 语料库 角色标注
在线阅读 下载PDF
基于CRF和转换错误驱动学习的浅层句法分析 被引量:1
4
作者 张芬 曲维光 +1 位作者 赵红艳 周俊生 《广西师范大学学报(自然科学版)》 CAS 北大核心 2011年第3期147-150,共4页
本文提出一种CRF和基于转换错误驱动相结合的中文浅层句法分析方法。该方法应用于宾州大学中文树库,取得不错的组块识别效果。在CRF识别的基础上,对初始识别结果中的组块标注信息进行统计分析,获得候选转换规则集合;再根据定义的规则评... 本文提出一种CRF和基于转换错误驱动相结合的中文浅层句法分析方法。该方法应用于宾州大学中文树库,取得不错的组块识别效果。在CRF识别的基础上,对初始识别结果中的组块标注信息进行统计分析,获得候选转换规则集合;再根据定义的规则评价函数对候选集进行筛选,得到最终的转换规则集合;最后应用转换规则集对CRF标注的结果进行校正。实验结果表明,与单独使用CRF结果相比,组块识别的精确率、召回率以及F值均得到了提高。 展开更多
关键词 浅层句法分析 CRF 转换错误驱动学习 转换规则集
在线阅读 下载PDF
SVM和基于转换的错误驱动学习相结合的汉语组块识别 被引量:4
5
作者 邹宏梅 王挺 《计算机工程与科学》 CSCD 2007年第4期91-94,123,共5页
本文研究了一种支持向量机(SVM)和基于转换的错误驱动学习相结合的汉语组块识别方法。SVM在选取特征方面有突出的优点,并且在高维特征空间也具有较高的泛化性能,通过核函数的原则,SVM能够在独立于训练数据维数的小计算范围内进行训练。... 本文研究了一种支持向量机(SVM)和基于转换的错误驱动学习相结合的汉语组块识别方法。SVM在选取特征方面有突出的优点,并且在高维特征空间也具有较高的泛化性能,通过核函数的原则,SVM能够在独立于训练数据维数的小计算范围内进行训练。利用基于转换的错误驱动学习方法对SVM的标注结果进行校正,转换规则较好地处理了语言现象中的特殊情况,进一步提高了SVM的识别结果。实验结果表明,该方法具有较好的效果。 展开更多
关键词 支持向量机 基于转换的错误驱动学习 汉语组块识别
在线阅读 下载PDF
基于CRF和错误驱动的中心词识别 被引量:3
6
作者 田卫东 李亚娟 《计算机应用研究》 CSCD 北大核心 2013年第8期2345-2348,共4页
针对中文问题分类的中心词识别不准确的问题,提出了一种基于条件随机场(CRF)和错误驱动学习相结合的识别方法。该方法采用CRF模型对问题的中心词进行初始标注,依据词的上下文信息用错误驱动的学习方法对其标注结果进行纠正。在训练有序... 针对中文问题分类的中心词识别不准确的问题,提出了一种基于条件随机场(CRF)和错误驱动学习相结合的识别方法。该方法采用CRF模型对问题的中心词进行初始标注,依据词的上下文信息用错误驱动的学习方法对其标注结果进行纠正。在训练有序规则的过程中,为了减少训练时间,结合中心词的特点对错误驱动算法进行了改进。实验结果表明,该方法在一定程度上提高了中心词的标注精度,达到88%。 展开更多
关键词 问题分类 中心词 条件随机场(CRF) 错误驱动学习(tbl) 上下文信息 有序规则
在线阅读 下载PDF
基于依存分析和错误驱动的中文时间表达式识别 被引量:21
7
作者 贺瑞芳 秦兵 +2 位作者 刘挺 潘越群 李生 《中文信息学报》 CSCD 北大核心 2007年第5期36-40,共5页
时间表达式识别是进行时间表达式归一化的基础,其识别结果的好坏直接影响归一化的效果。本文提出一种基于依存分析和错误驱动识别中文时间表达式的新方法。首先以时间触发词为切入点,据依存关系递归地识别时间表达式,大大地提高了识别效... 时间表达式识别是进行时间表达式归一化的基础,其识别结果的好坏直接影响归一化的效果。本文提出一种基于依存分析和错误驱动识别中文时间表达式的新方法。首先以时间触发词为切入点,据依存关系递归地识别时间表达式,大大地提高了识别效果;然后,采用错误驱动学习来进一步增强识别效果,根据错误识别结果和人工标注的差异自动地获取和改进规则,使系统的性能又提高了近3.5%。最终在封闭测试集和开放测试集上,F1值达到了76.38%和76.57%。 展开更多
关键词 计算机应用 中文信息处理 时间表达式识别 触发词 依存分析 错误驱动学习
在线阅读 下载PDF
基于错误驱动算法组合分类器及其在问题分类中的应用 被引量:19
8
作者 李鑫 黄萱菁 吴立德 《计算机研究与发展》 EI CSCD 北大核心 2008年第3期535-541,共7页
开放领域问答系统(QA)能够给用户提供相对简洁、准确的结果,越来越受到人们的关注.问题分类把问题分成若干语义类型,是QA系统的一个重要的模块,它的准确性直接影响到QA系统的性能.为提高分类器性能,在问题分类任务中使用了集成学习方法... 开放领域问答系统(QA)能够给用户提供相对简洁、准确的结果,越来越受到人们的关注.问题分类把问题分成若干语义类型,是QA系统的一个重要的模块,它的准确性直接影响到QA系统的性能.为提高分类器性能,在问题分类任务中使用了集成学习方法,并且实验比较了词汇、句法、同义词集等不同的分类特征及错误驱动、投票法、BP神经网络等分类器集成方法.通过采用基于错误驱动集成分类器,用规则方法TBL作为统计方法SVM的补充;利用来自Wordnet的同义词集和名词的上位概念及Minipar的依存关系等语言知识作为分类特征,在公开测试集中取得了更高的分类精度. 展开更多
关键词 问题分类 问题回答系统 支持向量机 基于转换的错误驱动学习 依存关系
在线阅读 下载PDF
基于错误驱动学习策略的藏语句法功能组块边界识别
9
作者 王天航 史树敏 +2 位作者 龙从军 黄河燕 李琳 《中文信息学报》 CSCD 北大核心 2014年第5期170-175,191,共7页
藏语句法功能组块分析旨在识别出藏语句子的句法成分,为后续句子级深入分析提供支持。根据藏语的语言特点,该文在藏语句法功能组块描述体系基础上,提出基于错误驱动学习策略的藏语功能组块边界识别方法。具体思路为,首先基于条件随机场(... 藏语句法功能组块分析旨在识别出藏语句子的句法成分,为后续句子级深入分析提供支持。根据藏语的语言特点,该文在藏语句法功能组块描述体系基础上,提出基于错误驱动学习策略的藏语功能组块边界识别方法。具体思路为,首先基于条件随机场(Conditional Random Fields,CRFs)识别组块,然后分别基于转换规则的错误驱动学习(Transformation-based Error-driven Learning,TBL)及基于新特征模板的CRFs错误驱动学习进行二次识别,并对初次结果进行校正,F值分别提高了1.65%、8.36%。最后通过实验分析,进一步将两种错误驱动学习机制融合,在18 073词级的藏语语料上开展实验,识别性能进一步提高,准确率、召回率与F值分别达到94.1%、94.76%与94.43%,充分验证了本文提出方法的有效性。 展开更多
关键词 错误驱动学习 藏语句法功能组块 组块边界识别 CRFs tbl
在线阅读 下载PDF
用决策树指导TBL进行多音字消歧 被引量:2
10
作者 刘方舟 周游 《计算机工程与应用》 CSCD 北大核心 2011年第12期137-140,共4页
多音字消歧是普通话语音合成系统中字音转换模块的核心问题。选择了常见易错的33个多音字和24个多音词作为研究对象,构建了一个平均每个多音字(词)5000句的语料库,并且提出了一种结合决策树和基于转换的错误驱动的学习(Transformation-B... 多音字消歧是普通话语音合成系统中字音转换模块的核心问题。选择了常见易错的33个多音字和24个多音词作为研究对象,构建了一个平均每个多音字(词)5000句的语料库,并且提出了一种结合决策树和基于转换的错误驱动的学习(Transformation-Basederror-driven Learning,TBL)的混合算法。该方法根据决策树的指导,自动生成TBL算法的模板,避免了手工总结模板这一费时费力的过程。实验结果表明,该方法生成的模板与手工模板性能相当,其平均准确率达90.36%,明显优于决策树。 展开更多
关键词 多音字消歧 字音转换 决策树 基于转换的错误驱动学习(tbl)
在线阅读 下载PDF
类别学习中的认知学习机制 被引量:2
11
作者 陈琳 钟罗金 +1 位作者 郑允佳 莫雷 《心理与行为研究》 CSSCI 2013年第3期305-311,共7页
采用归类任务,比较不同知识条件、不同特征呈现方式下,对非定义特征维度的掌握,验证类别学习的认知学习机制。结果发现对非定义特征维度的掌握,在样例特征固定位置呈现条件下较多,而在样例特征随机呈现条件下较少;在知识定义特征维度条... 采用归类任务,比较不同知识条件、不同特征呈现方式下,对非定义特征维度的掌握,验证类别学习的认知学习机制。结果发现对非定义特征维度的掌握,在样例特征固定位置呈现条件下较多,而在样例特征随机呈现条件下较少;在知识定义特征维度条件下较多,而在机械定义特征维度条件下较少。研究结果支持了类别学习的认知学习机制。 展开更多
关键词 类别学习 认知学习机制 双机制 错误驱动
在线阅读 下载PDF
开放式汉语自动分词的学习机制
12
作者 黄德根 岳函 李丽双 《小型微型计算机系统》 CSCD 北大核心 2005年第8期1406-1410,共5页
针对统计模型词典动态适应性不高及大规模语料库建设中人工代价昂贵的问题,在基于统计的汉语自动分词基础上,引入了以错误驱动为基础的开放学习机制,通过有监督和无监督相结合的学习方法,建立了包含可信度修正和部分三元语法信息的多元... 针对统计模型词典动态适应性不高及大规模语料库建设中人工代价昂贵的问题,在基于统计的汉语自动分词基础上,引入了以错误驱动为基础的开放学习机制,通过有监督和无监督相结合的学习方法,建立了包含可信度修正和部分三元语法信息的多元分词模型,讨论了切分算法和人机交互中的具体问题,并通过实验确定模型系数和阈值.实验结果表明,该分词模型经三次学习后,闭式分词中的切分错误有78.44%得到纠正,切分正确率达到99.43%,开式分词中的切分错误有63.56%得到纠正,切分正确率达到98.46%.系统具有较高的实用价值. 展开更多
关键词 自动分词 开放式 学习机制 错误驱动
在线阅读 下载PDF
基于语法树高度的汉语韵律短语预测 被引量:6
13
作者 杨鸿武 王晓丽 +3 位作者 陈龙 裴东 郭威彤 蔡莲红 《计算机工程与应用》 CSCD 北大核心 2010年第36期139-143,167,共6页
在文语转换系统中,从文本中预测出准确的韵律结构对于提高合成语音的自然度具有重要的作用。利用10 000句标注了词性标记的文本语料,在语言学专家的指导下,人工标注了语料的韵律词和韵律短语。选择了标注结果一致性最高的500句语句,标... 在文语转换系统中,从文本中预测出准确的韵律结构对于提高合成语音的自然度具有重要的作用。利用10 000句标注了词性标记的文本语料,在语言学专家的指导下,人工标注了语料的韵律词和韵律短语。选择了标注结果一致性最高的500句语句,标注了语法层级结构,并利用语法树高度描述语法词之间连接的紧密程度。通过分析韵律短语边界与语法结构的关系,发现韵律短语边界受语法树高度、语法词词性和语法词词长的影响,因此选择了这三个特征,利用TBL算法和400句训练语句训练了预测模型。测试集上的预测结果表明,提出的方法在小规模训练语料下,韵律短语预测的精确率达到了75.2%,召回率达到了77.1%,F-Score达到了76.1%。 展开更多
关键词 韵律结构预测 语法结构 韵律短语 语法树高度 错误驱动的规则学习算法(tbl)
在线阅读 下载PDF
汉语文语转换系统中停顿指数的自动标注 被引量:6
14
作者 赵永贞 刘挺 +2 位作者 王志伟 陈惠鹏 邵艳秋 《中文信息学报》 CSCD 北大核心 2004年第5期48-55,共8页
本文采用了一个基于C TOBI的停顿指数标注的语料库 ,利用有指导的学习方法对自动停顿指数标注方面做了一些有益的探索。本文共实现了三种方法 :基本的马尔科夫模型 ,引入了词长信息的马尔科夫模型 ,引入词长信息的马尔科夫模型结合基于... 本文采用了一个基于C TOBI的停顿指数标注的语料库 ,利用有指导的学习方法对自动停顿指数标注方面做了一些有益的探索。本文共实现了三种方法 :基本的马尔科夫模型 ,引入了词长信息的马尔科夫模型 ,引入词长信息的马尔科夫模型结合基于转换的错误驱动的学习方法。然后通过对 30 0 0句的真实文本进行开放测试 ,以基本的马尔科夫模型的结果作为基准 ,实验结果不断改进 ,最终达到了 78 6 %的准确率 ,错误代价降低了 14 5 % 展开更多
关键词 计算机应用 中文信息处理 文语转换 停顿指数 马尔科夫模型 基于转换的错误驱动学习
在线阅读 下载PDF
基于转换的时间-事件关系映射 被引量:19
15
作者 王昀 苑春法 《中文信息学报》 CSCD 北大核心 2004年第4期23-30,共8页
近些年来 ,中文时间信息抽取和处理已经变得越来越重要。然而 ,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息之间的映射关系。区别于传统的基于规则的方法 ,本文采用... 近些年来 ,中文时间信息抽取和处理已经变得越来越重要。然而 ,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息之间的映射关系。区别于传统的基于规则的方法 ,本文采用了一种机器学习的方法—基于转换的错误驱动学习—来确定事件相应的时间表达 ,这种学习算法可以自动的获取和改进规则。使用训练得到的转换规则集后 ,系统的时间 -事件映射错误率减少了 9 74 % 。 展开更多
关键词 计算机应用 中文信息处理 时间信息处理 基于转换的错误驱动学习 信息抽取
在线阅读 下载PDF
中文词法分析与句法分析融合策略研究 被引量:13
16
作者 米海涛 熊德意 刘群 《中文信息学报》 CSCD 北大核心 2008年第2期10-17,共8页
利用外部资源是提升句法分析性能的一种有效方法。本文利用中文词法分析器这一外部资源,提出了一种通用转换方法将中文词法分析器与句法分析器有机地融合在一起。通过基于转换的错误驱动学习和条件随机场解决不同切词、词性标注标准间... 利用外部资源是提升句法分析性能的一种有效方法。本文利用中文词法分析器这一外部资源,提出了一种通用转换方法将中文词法分析器与句法分析器有机地融合在一起。通过基于转换的错误驱动学习和条件随机场解决不同切词、词性标注标准间的转换问题。在句法分析方面,本文提出了多子模型句法分析器,将中心词驱动模型和结构上下文模型有效结合在一起。融合后的中文句法分析性能在宾州中文树库1.0版①测试集上F1值达到了82.5%的最好水平。 展开更多
关键词 计算机应用 中文信息处理 中文句法分析 中文词法分析 融合策略 基于转换的错误驱动学习 条件随机场
在线阅读 下载PDF
基于层叠条件随机场的哈语树库构建技术研究
17
作者 于智娟 古丽拉.阿东别克 《计算机应用与软件》 CSCD 2016年第3期71-75,82,共6页
针对如何提高基于统计的哈萨克语句法分析算法的处理性能问题,提出一种通过人机交互来构建哈萨克语树库的方法。在自动句法标注阶段,采用层叠条件随机场模型实现,并在其低层与高层模型之间加入改进的基于转换的错误驱动学习算法来进行... 针对如何提高基于统计的哈萨克语句法分析算法的处理性能问题,提出一种通过人机交互来构建哈萨克语树库的方法。在自动句法标注阶段,采用层叠条件随机场模型实现,并在其低层与高层模型之间加入改进的基于转换的错误驱动学习算法来进行简单句的自动句法标注及自动校正。最后对特殊的整体标记错误进行人工校对,形成基于短语结构的哈萨克语树库。实验结果表明,该方法在很大程度上减少了人力及物力的投入,提高了分析精度及整体处理效率,并为后期基于哈萨克语的句法机器翻译及文本挖掘奠定了一定的基础。 展开更多
关键词 哈萨克语树库 人机交互 层叠条件随机场 错误驱动学习算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部