期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
CRF与规则相结合的中文地名识别 被引量:17
1
作者 李丽双 党延忠 +2 位作者 廖文平 黄德根 张颖 《大连理工大学学报》 EI CAS CSCD 北大核心 2012年第2期285-289,共5页
采用递增式学习策略优化条件随机域(conditional random fields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规则库,以弥补机器学习模型获取知识不够全面导致召回率偏低的不足,最终实现了CRF与规则相结合的中文地... 采用递增式学习策略优化条件随机域(conditional random fields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规则库,以弥补机器学习模型获取知识不够全面导致召回率偏低的不足,最终实现了CRF与规则相结合的中文地名识别系统.实验结果表明,采用CRF与规则相结合的方法识别中文文本中的地名是有效的,对Bakeoff2007NER任务的MSRA语料进行开放测试,召回率、精确率和F值分别为94.67%、92.35%和93.50%. 展开更多
关键词 中文信息处理 中文地名识别 条件随机域 基于规则的后处理
在线阅读 下载PDF
基于统计的中文地名识别 被引量:49
2
作者 黄德根 岳广玲 杨元生 《中文信息学报》 CSCD 北大核心 2003年第2期36-41,共6页
本文针对有特征词的中文地名识别进行了研究。该系统使用从大规模地名词典和真实文本语料库得到的统计信息以及针对地名特点总结出来的规则 ,通过计算地名的构词可信度和接续可信度从而识别中文地名。该模型对自动分词的切分作了有效的... 本文针对有特征词的中文地名识别进行了研究。该系统使用从大规模地名词典和真实文本语料库得到的统计信息以及针对地名特点总结出来的规则 ,通过计算地名的构词可信度和接续可信度从而识别中文地名。该模型对自动分词的切分作了有效的调整 ,系统闭式召回率和精确率分别为 90 2 4 %和 93 14 % ,开式召回率和精确率分别达 86 86 %和 91 4 8%。 展开更多
关键词 计算机应用 中文信息处理 中文地名识别 构词可信度 接续可信度 自动分词
在线阅读 下载PDF
用支持向量机进行中文地名识别的研究 被引量:10
3
作者 李丽双 黄德根 +1 位作者 陈春荣 杨元生 《小型微型计算机系统》 CSCD 北大核心 2005年第8期1416-1419,共4页
用支持向量机(SVM)方法对中文地名的自动识别进行了探讨,对于含特征词的地名和非地名用支持向量机进行分类:结合中文地名的特点,抽取地名构词可信度及其前后词的词性作为特征向量的属性,建立了一定规模的训练集,并通过对不同kernel函数... 用支持向量机(SVM)方法对中文地名的自动识别进行了探讨,对于含特征词的地名和非地名用支持向量机进行分类:结合中文地名的特点,抽取地名构词可信度及其前后词的词性作为特征向量的属性,建立了一定规模的训练集,并通过对不同kernel函数的测试,得到了地名分类的机器学习模型.实验表明,对于切分正确的地名,本方法具有良好的效果. 展开更多
关键词 支持向量机 中文地名识别 机器学习
在线阅读 下载PDF
汉语自动分词中中文地名识别 被引量:10
4
作者 高红 黄德根 杨元生 《大连理工大学学报》 EI CAS CSCD 北大核心 2006年第4期576-581,共6页
以词语级的中文地名为识别对象,根据地名内部用字的统计信息和地名构成特点产生潜在地名.在汉语自动分词中将可信度较高的潜在地名等同于句子的候选切分词,利用候选切分词本身的可信度和上下文接续关系评价句子的各种切分方案.在确定句... 以词语级的中文地名为识别对象,根据地名内部用字的统计信息和地名构成特点产生潜在地名.在汉语自动分词中将可信度较高的潜在地名等同于句子的候选切分词,利用候选切分词本身的可信度和上下文接续关系评价句子的各种切分方案.在确定句子最佳切分时识别句子中的中文地名.对真实语料进行封闭和开放测试,封闭测试结果为召回率93.55%,精确率94.14%,F-1值93.85%;开放测试结果为召回率91.27%,精确率73.48%,F-1值81.42%.取得了比较令人满意的结果. 展开更多
关键词 中文地名识别 汉语自动分词 未登录词识别
在线阅读 下载PDF
双层CRF与规则相结合的中文地名识别方法研究 被引量:9
5
作者 孙虹 陈俊杰 《计算机应用与软件》 CSCD 北大核心 2014年第11期175-177,182,共4页
采用一种基于双层CRF模型与规则相结合的方法提高中文地名的识别性能。第一层CRF模型使用单字特征识别地名,将其结果添加至词典。第二层CRF模型利用词性、左指界词、右指界词和处理后的词典特征对地名进行识别。最后利用规则对识别结果... 采用一种基于双层CRF模型与规则相结合的方法提高中文地名的识别性能。第一层CRF模型使用单字特征识别地名,将其结果添加至词典。第二层CRF模型利用词性、左指界词、右指界词和处理后的词典特征对地名进行识别。最后利用规则对识别结果进行过滤修剪和补召。通过双层CRF模型获取文本的远距离特征,解决了同一词汇因位置不同而标记不一致的问题,结合依据地名语言学特点制定的规则提高召回率。实验表明,双层CRF与规则相结合的方法对中文地名的识别取得了较好的效果。对Bakeoff2007的MSRA语料进行开放测试,得到的准确率、召回率、F值分别为95.32%、90.34%、94.12%。 展开更多
关键词 自然语言处理 中文地名识别 双层CRF模型 规则
在线阅读 下载PDF
利用地名用字分析的中文地名识别处理 被引量:7
6
作者 李诺 张全 《计算机工程与应用》 CSCD 北大核心 2009年第28期230-232,共3页
对中文地名未登录词识别而言,首先充分挖掘地名用字本身的特征,及其上下文用字的特征,其次通过最大熵模型把这些来源不同的知识整合。在特征选择和知识获取时,通过对中文地名这个特定群体进行针对性分析,得到了更多的信息,如中文地名更... 对中文地名未登录词识别而言,首先充分挖掘地名用字本身的特征,及其上下文用字的特征,其次通过最大熵模型把这些来源不同的知识整合。在特征选择和知识获取时,通过对中文地名这个特定群体进行针对性分析,得到了更多的信息,如中文地名更常用哪些字以及这些字如何搭配更常见等。最终使得系统在真实语料的封闭测试和开放测试中分别达到了F值87%和83%的较好效果。 展开更多
关键词 中文地名识别 地名用字分析 最大熵
在线阅读 下载PDF
SVM与规则相结合的中文地名自动识别 被引量:32
7
作者 李丽双 黄德根 +1 位作者 陈春荣 杨元生 《中文信息学报》 CSCD 北大核心 2006年第5期51-57,共7页
在分析中文文本中地名特点的基础上,提出了一种支持向量机(SVM)与规则相结合的中文地名自动识别方法:按字抽取特征向量的属性,然后将这些属性转换成二进制向量并建立训练集,采用多项式Kernel函数,得到SVM识别地名的机器学习模型;通过对... 在分析中文文本中地名特点的基础上,提出了一种支持向量机(SVM)与规则相结合的中文地名自动识别方法:按字抽取特征向量的属性,然后将这些属性转换成二进制向量并建立训练集,采用多项式Kernel函数,得到SVM识别地名的机器学习模型;通过对错误识别结果的分析,构建规则库对识别结果进行后处理,弥补了机器学习模型获取知识不够全面导致召回率偏低的不足。实验表明,用SVM与规则相结合的机制识别中文文本中的地名是有效的:系统开式召回率、精确率和F-值分别达89.57%、93.52%和91.50%。 展开更多
关键词 计算机应用 中文信息处理 中文地名识别 支持向量机 机器学习 基于规则的后处理
在线阅读 下载PDF
句类分析准则在作战文书地名识别中的应用 被引量:3
8
作者 李颖 王青海 池毓焕 《计算机工程与设计》 CSCD 北大核心 2013年第8期2903-2907,共5页
针对军用要图自动标绘对地名识别高精度的要求,紧扣"作战文书行文规范"这一特点,将句类分析之标点准则(语句的首尾边界是首块和末块的天然首尾边界)、介词准则(汉语的语块移位标志符由介词充当)、动词准则(充当特征块的动词... 针对军用要图自动标绘对地名识别高精度的要求,紧扣"作战文书行文规范"这一特点,将句类分析之标点准则(语句的首尾边界是首块和末块的天然首尾边界)、介词准则(汉语的语块移位标志符由介词充当)、动词准则(充当特征块的动词是其它语块的天然边界)等应用于作战文书地名识别,采用基于规则的方法加以实现,实验结果F值在88%-97%之间。因此,作为作战文书向军用要图自动转换的预处理,地名识别这一结果是可用的。 展开更多
关键词 中文地名识别 语块边界感知 句类分析 作战文书 概念层次网络理论
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部