期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
融合实体特性识别越南语复杂命名实体的混合方法 被引量:3
1
作者 刘艳超 郭剑毅 +3 位作者 余正涛 周兰江 严馨 陈秀琴 《智能系统学报》 CSCD 北大核心 2016年第4期503-512,共10页
命名实体识别是自然语言处理过程中的基础任务。本文针对越南语的复杂命名实体难识别及F值不够高的问题,提出了一种结合实体库的越南语命名实体识别混合方法。首先,本文根据越南语的语言和实体特点,选取有效的局部特征和全局特征,应用... 命名实体识别是自然语言处理过程中的基础任务。本文针对越南语的复杂命名实体难识别及F值不够高的问题,提出了一种结合实体库的越南语命名实体识别混合方法。首先,本文根据越南语的语言和实体特点,选取有效的局部特征和全局特征,应用最大熵模型进行越南语命名实体识别;其次,根据本文制定的命名实体的规则进行越南语命名实体识别;然后,结合两者的识别结果,以规则为主,统计为辅原则;最后经过人工校对,把获取到的正确标记的实体加入到实体库,动态扩增实体库,为规则制定和特征选取提供丰富的语料和依据。实验表明,该方法能够有效地结合规则与统计的方法优点,互相弥补不足,明显提高了识别的正确率、召回率和F值。 展开更多
关键词 越南语 实体库构建 实体识别 最大熵 规则 实体特点 全局特征 局部特征
在线阅读 下载PDF
基于最大熵模型的越南语交叉歧义消解 被引量:1
2
作者 熊明明 刘艳超 +3 位作者 郭剑毅 余正涛 周兰江 陈秀琴 《中文信息学报》 CSCD 北大核心 2017年第4期63-69,共7页
越南语中存在大量的交叉歧义片段。为了解决交叉歧义给分词、词性标注、实体识别和机器翻译等带来的影响,该文选取统计特征、上下文特征和歧义字段内部特征,尝试性地构建最大熵模型,对越南语的交叉歧义进行消解。该文通过三种方法整理... 越南语中存在大量的交叉歧义片段。为了解决交叉歧义给分词、词性标注、实体识别和机器翻译等带来的影响,该文选取统计特征、上下文特征和歧义字段内部特征,尝试性地构建最大熵模型,对越南语的交叉歧义进行消解。该文通过三种方法整理出包含174 646词条的越南语词典,然后通过正向和逆向最大匹配方法从25 981条人工标注好的越南语分词句子中抽取5 377条歧义字段,分别测试了三类特征对歧义模型的贡献程度,并对歧义字段做五折交叉验证实验,准确率达到了87.86%。同时,与CRFs进行对比实验,结果表明该方法能更有效消解越南语交叉歧义。 展开更多
关键词 交叉歧义 歧义消解 最大熵模型 越南语词典 CRFS
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部