期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
14
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
匹配树和决策树方法识别英语句子中的BaseNP
被引量:
2
1
作者
荀恩东
李生
赵铁军
《计算机研究与发展》
EI
CSCD
北大核心
2000年第7期826-832,共7页
提出了语料库和机器学习相结合的方法识别英语句子中的简单的、非递归的名词短语 (Base NP) .在含有词性标注和 Base NP边界标注的训练语料中 ,抽取所有不同类型 Base NP短语对应的词性序列 (Base NP规则 ) ,通过规则排序和语言学知识 ...
提出了语料库和机器学习相结合的方法识别英语句子中的简单的、非递归的名词短语 (Base NP) .在含有词性标注和 Base NP边界标注的训练语料中 ,抽取所有不同类型 Base NP短语对应的词性序列 (Base NP规则 ) ,通过规则排序和语言学知识 ,对其中正确率低且明显不符合语法的规则进行剔除 .在识别时 ,采取规则匹配树的方法进行最大长度匹配 ,通过归纳机器学习 C4.5算法引入上下文信息 ,由 C4.5算法学习出有效 (或无效 )应用 Base NP规则的条件 ,参照上下文条件 ,约束应用 Base NP规则 .实验结果表明 ,提出的方法具有很高的正确率和召回率 .
展开更多
关键词
basenp
匹配树
决策树
英语句子
自然语言处理
在线阅读
下载PDF
职称材料
混合的汉语基本名词短语识别方法
被引量:
7
2
作者
胡乃全
朱巧明
周国栋
《计算机工程》
CAS
CSCD
北大核心
2009年第20期199-201,共3页
提出一种混合的汉语基本名词短语(BaseNP)识别模型,包括采用语法规则、统计方法和组合分类器方法。利用BaseNP词的信息、词性信息及上下文句法信息,构建组合分类器,提高判断的准确性。在中文树库(CTB5.0)上进行实验,F值达到了90.09%,证...
提出一种混合的汉语基本名词短语(BaseNP)识别模型,包括采用语法规则、统计方法和组合分类器方法。利用BaseNP词的信息、词性信息及上下文句法信息,构建组合分类器,提高判断的准确性。在中文树库(CTB5.0)上进行实验,F值达到了90.09%,证明该方法能有效地识别BaseNP。
展开更多
关键词
基本名词短语
规则模板
组合分类器
在线阅读
下载PDF
职称材料
融入双语最大名词短语的机器翻译模型
被引量:
9
3
作者
李业刚
梁丽君
+2 位作者
孙福振
王绍卿
于潇
《计算机应用研究》
CSCD
北大核心
2017年第5期1316-1320,共5页
在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略...
在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略,以硬约束的方式在统计机器翻译中融入最大名词短语,并在双语最大名词短语层面上融合了短语翻译模型和层次短语模型,对翻译系统的改善最显著。所述策略显著提高了短语翻译模型的质量,在复杂长句翻译中,Method-Ⅲ的BLEU值比基于短语的基线翻译模型提高了3.03%。
展开更多
关键词
统计机器翻译
短语翻译模型
最大名词短语
双语最大名词短语
在线阅读
下载PDF
职称材料
中英文指代消解中待消解项识别的研究
被引量:
14
4
作者
孔芳
朱巧明
周国栋
《计算机研究与发展》
EI
CSCD
北大核心
2012年第5期1072-1085,共14页
深入研究了中英文指代消解中的待消解项识别问题.在前人工作的基础上,首先使用规则方法识别与上下文无关或具有显著固定模式的非待消解项;针对与上下文相关的非待消解项识别,从平面特征方法和结构化树核函数方法两方面入手进行了探索;...
深入研究了中英文指代消解中的待消解项识别问题.在前人工作的基础上,首先使用规则方法识别与上下文无关或具有显著固定模式的非待消解项;针对与上下文相关的非待消解项识别,从平面特征方法和结构化树核函数方法两方面入手进行了探索;利用复合核函数将平面特征和结构化特征有效结合,对待消解识别问题进行了进一步研究.在ACE2003英文语料和ACE2005中文语料上的实验结果表明,提出的多种待消解项识别方案各具特色,都取得了不错的性能.最后将得到的待消解项识别模块应用于中英文的指代消解任务.实验结果表明,合适的待消解项识别能够大大提高中英文指代消解的性能.
展开更多
关键词
待消解项识别
规则方法
平面特征方法
结构化树核函数方法
复合核函数
在线阅读
下载PDF
职称材料
统计和规则相结合的汉语最长名词短语自动识别
被引量:
16
5
作者
代翠
周俏丽
+1 位作者
蔡东风
杨洁
《中文信息学报》
CSCD
北大核心
2008年第6期110-115,共6页
在分析汉语最长名词短语特点的基础上,提出了一种统计和规则相结合的汉语最长名词短语自动识别方法:通过实验词及词性的不同组合选择特征集合,基于该特征训练得到条件随机场(CRF)识别模型;分析错误识别结果,结合最长名词短语的边界信息...
在分析汉语最长名词短语特点的基础上,提出了一种统计和规则相结合的汉语最长名词短语自动识别方法:通过实验词及词性的不同组合选择特征集合,基于该特征训练得到条件随机场(CRF)识别模型;分析错误识别结果,结合最长名词短语的边界信息和内部结构信息构建规则库对识别结果进行后处理,弥补了机器学习模型获取知识不够全面的不足。实验结果表明,用统计和规则相结合的方法识别最长名词短语是有效的,系统开放测试结果F值达到了90.2%。
展开更多
关键词
计算机应用
中文信息处理
条件随机场
最长名词短语
基于规则的后处理
在线阅读
下载PDF
职称材料
基于混合策略的英语基本名词短语识别——边界统计和词性串规则校正相结合的策略
被引量:
2
6
作者
梁颖红
赵铁军
+2 位作者
姚建民
于浩
徐冰
《计算机工程与应用》
CSCD
北大核心
2004年第35期1-3,121,共4页
基本名词短语识别是自然语言处理领域非常重要的子任务。文中总结了一些有代表性的基本名词短语识别方法,并对多种典型英语基本名词短语识别的结果进行了比较和对照,提出并实现了边界统计和词性串校正相结合的英语基本名词短语识别方法...
基本名词短语识别是自然语言处理领域非常重要的子任务。文中总结了一些有代表性的基本名词短语识别方法,并对多种典型英语基本名词短语识别的结果进行了比较和对照,提出并实现了边界统计和词性串校正相结合的英语基本名词短语识别方法。该方法把基本名词短语识别分成主次分明的两部分,边界统计作为主要部分能够正确识别出大部分基本名词短语,词性串规则作为辅助手段在对前者识别出的基本名词短语进行核对和校正的同时还对边界统计方法遗漏的基本名词短语进行再回收。此方法中,词性串规则弥补了边界统计无法顾及基本名词短语内部组合规律的缺点,提高了精确率和召回率。采用此方法,基本名词短语识别的精确率达到96.22%,召回率97.59%,Fβ=196.90%,F值超出了目前报道的最好结果。
展开更多
关键词
基本名词短语识别
英语
混合策略
语块
边界统计
词性串规则校正
在线阅读
下载PDF
职称材料
基于归约的汉语最长名词短语识别方法
被引量:
4
7
作者
钱小飞
侯敏
《中文信息学报》
CSCD
北大核心
2015年第2期40-48,共9页
该文提出了最长名词短语(MNP)的操作性定义,分析了其构造和分布特征,并设计了一种基于baseNP归约的识别方法,利用MNP结构特性及起始有定成分、语义核心等语言学特征,缓解了最长名词短语长距离依赖与模型观察窗口受限的矛盾。开放测试取...
该文提出了最长名词短语(MNP)的操作性定义,分析了其构造和分布特征,并设计了一种基于baseNP归约的识别方法,利用MNP结构特性及起始有定成分、语义核心等语言学特征,缓解了最长名词短语长距离依赖与模型观察窗口受限的矛盾。开放测试取得了88.68%的正确率和89.21%的召回率;归约方法全面提升了识别性能,特别是将多词结构的调和平均值提高1%,优化幅度达6%以上,并且对长距离复杂结构有着更好的识别效果。
展开更多
关键词
最长名词短语
识别
归约
基本名词短语
在线阅读
下载PDF
职称材料
引入混合特征的最大名词短语双向标注融合算法
被引量:
4
8
作者
李业刚
黄河燕
鉴萍
《自动化学报》
EI
CSCD
北大核心
2015年第7期1274-1282,共9页
最大名词短语的识别对机器翻译等诸多自然语言处理任务有着:惹要的意义.以汉语最大名词短语识别为研究任务,在分析现有方法的基础上,从汉语的语H学特殊性以及基于支持向量机的序列标注算法的特点出发,考查了基于混合特征的融合算法的适...
最大名词短语的识别对机器翻译等诸多自然语言处理任务有着:惹要的意义.以汉语最大名词短语识别为研究任务,在分析现有方法的基础上,从汉语的语H学特殊性以及基于支持向量机的序列标注算法的特点出发,考查了基于混合特征的融合算法的适应性.实验证叨,釆用词和基本组块混合标注单元的标注方法对汉语最大名词短语的识别是有效的,并且其i E反向识别结果具有一定的互补性,在此基础上提出的基于"边界分歧"的双向序列标注融合算法恰能发掘双向识别的互补性,并达到较高的融合精度.
展开更多
关键词
最大名词短语
双向标注
基本组块
混合特征
在线阅读
下载PDF
职称材料
基于粗糙集的基本名词短语识别
被引量:
2
9
作者
郭永辉
杨红卫
+1 位作者
马芳
王炳锡
《中文信息学报》
CSCD
北大核心
2006年第3期14-21,共8页
本文提出了一种基于粗糙集的基本名词短语(BaseNP)识别方法。该方法首先进行BaseNP标注,然后实现BaseNP识别。它把BaseNP标注看作一个决策问题用粗糙集理论解决,因而具有特征约简和规则优化的特点。文章介绍了基于粗糙集的规则学习方法...
本文提出了一种基于粗糙集的基本名词短语(BaseNP)识别方法。该方法首先进行BaseNP标注,然后实现BaseNP识别。它把BaseNP标注看作一个决策问题用粗糙集理论解决,因而具有特征约简和规则优化的特点。文章介绍了基于粗糙集的规则学习方法和相应的算法,同时也给出了BaseNP标注和识别的算法流程,提出了解决实例冲突问题的方法,并提高了识别效果。文章最后给出了详细的实验步骤和结果,并与几个典型系统进行了比较与分析,提出了进一步改进的方向。
展开更多
关键词
人工智能
自然语言处理
基本名词短语
粗糙集
机器学习
规则方法
算法
在线阅读
下载PDF
职称材料
基于跨语言文本分类的跨语言特征提取方法研究
被引量:
2
10
作者
高影繁
王惠临
徐红姣
《情报学报》
CSSCI
北大核心
2011年第12期1242-1248,共7页
随着文本分类算法的实用化和多语种信息的日益丰富,当机构或组织的文档管理部门日益依赖自动文本分类时,如何解决多语种文档的归类问题成为新的研究热点,跨语言文本分类技术就是在这样的背景下提出的。本文以国家图书文献中心(NSTL...
随着文本分类算法的实用化和多语种信息的日益丰富,当机构或组织的文档管理部门日益依赖自动文本分类时,如何解决多语种文档的归类问题成为新的研究热点,跨语言文本分类技术就是在这样的背景下提出的。本文以国家图书文献中心(NSTL)的多语种语料为研究对象,以一部科技类的汉英科技词典为资源工具,提出了一种基于跨语言文本分类的跨语言特征提取方法,实验结果验证了在简单翻译资源条件下对科技文献进行跨语言分类的可行性,也为下一阶段建立实用跨语言文类系统奠定了基础。
展开更多
关键词
最长短语识别
类别信息消歧
特征提取
在线阅读
下载PDF
职称材料
现代汉语名词语法属性的计量研究初探
被引量:
2
11
作者
王萌
俞士汶
+1 位作者
段慧明
孙薇薇
《中文信息学报》
CSCD
北大核心
2008年第5期22-29,38,共9页
以《现代汉语语法信息词典》中语法属性的概率化描述为目标,基于1998年上半年《人民日报》标注语料,对名词语法属性的概率化进行了初步的实验研究。首先,考察了名词与数词、名词与量词搭配的相关属性,引进"分散度"概念,利用它...
以《现代汉语语法信息词典》中语法属性的概率化描述为目标,基于1998年上半年《人民日报》标注语料,对名词语法属性的概率化进行了初步的实验研究。首先,考察了名词与数词、名词与量词搭配的相关属性,引进"分散度"概念,利用它对"数名"结构进行了定量分析;其次,考察了名词受不同量词修饰的分布情况。最后,把实验结果与《现代汉语语法信息词典》的相应属性进行了比照和分析,在属性概率化的同时也对其正确性进行了验证。
展开更多
关键词
计算机应用
中文信息处理
现代汉语
现代汉语语法信息词典
概率语法属性描述
基本标注语料库
“数名”结构
“数量名”短语
在线阅读
下载PDF
职称材料
哈萨克语基本名词短语自动识别研究与实现
被引量:
11
12
作者
孙瑞娜
古丽拉.阿东别克
《中文信息学报》
CSCD
北大核心
2010年第6期114-119,共6页
以哈萨克语基本名词短语识别为目标,实现了哈萨克语基本名词短语自动识别系统。采用基于规则自动识别及人工标注的方法建立基本名词短语标注语料库,在此基础上,采用统计和规则相结合的识别方法,利用互信息进行基本名词短语边界预测,然...
以哈萨克语基本名词短语识别为目标,实现了哈萨克语基本名词短语自动识别系统。采用基于规则自动识别及人工标注的方法建立基本名词短语标注语料库,在此基础上,采用统计和规则相结合的识别方法,利用互信息进行基本名词短语边界预测,然后根据哈萨克语基本名词短语构成规则对预测边界进行调整,加入标注符,得到最终的识别结果。实验结果表明,两种方法封闭测试的识别精确率分别为80.2%和82.5%。
展开更多
关键词
语料库
基本名词短语
哈萨克语
互信息
规则
在线阅读
下载PDF
职称材料
英语功能名词短语研究及其应用
被引量:
1
13
作者
马建军
黄德根
《大连理工大学学报》
EI
CAS
CSCD
北大核心
2012年第1期126-131,共6页
根据英语名词短语的句法功能,提出了一种新的英语名词短语——功能名词短语,同时与基本名词短语和最长名词短语相比较.利用Google在线翻译系统,对存在结构歧义的句子进行了翻译,发现英汉机器翻译的错误主要是由结构歧义引起的,并应用功...
根据英语名词短语的句法功能,提出了一种新的英语名词短语——功能名词短语,同时与基本名词短语和最长名词短语相比较.利用Google在线翻译系统,对存在结构歧义的句子进行了翻译,发现英汉机器翻译的错误主要是由结构歧义引起的,并应用功能名词短语的定义对结构歧义问题予以解决.实验结果表明,功能名词短语的识别能够有效消解两种结构歧义:一是与动词构成固定搭配的名词引起的歧义;二是"介词+名词"结构是作状语还是作后置定语的歧义.功能名词短语的研究对消除句法结构歧义、提高英汉机器翻译译文质量具有重要意义.
展开更多
关键词
机器翻译
功能名词短语
基本名词短语
最长名词短语
在线阅读
下载PDF
职称材料
基于混合统计模型的中文基本名词短语识别
被引量:
3
14
作者
谭魏璇
孔芳
+1 位作者
倪吉
周国栋
《计算机应用与软件》
CSCD
2011年第8期254-256,共3页
采用一种基于混合统计模型的方法来实现中文基本名词短语识别。首先简要分析目前的研究现状,明确中文Base NP识别的任务,然后采用以基于转换的标注和条件随机域模型为底层,支持向量机模型为高层的混合统计模型来进行中文BaseNP的识别。...
采用一种基于混合统计模型的方法来实现中文基本名词短语识别。首先简要分析目前的研究现状,明确中文Base NP识别的任务,然后采用以基于转换的标注和条件随机域模型为底层,支持向量机模型为高层的混合统计模型来进行中文BaseNP的识别。在ACE2005中文语料上的实验表明,F值比使用单一模型提高了1.37%,达到了88.67%,能提高中文基本名词短语的识别性能。
展开更多
关键词
基本名词短语
支持向量机模型
特征模板
在线阅读
下载PDF
职称材料
题名
匹配树和决策树方法识别英语句子中的BaseNP
被引量:
2
1
作者
荀恩东
李生
赵铁军
机构
哈尔滨工业大学计算机科学与工程系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2000年第7期826-832,共7页
基金
国家自然科学基金
国家"八六三"高技术研究发展计划基金
文摘
提出了语料库和机器学习相结合的方法识别英语句子中的简单的、非递归的名词短语 (Base NP) .在含有词性标注和 Base NP边界标注的训练语料中 ,抽取所有不同类型 Base NP短语对应的词性序列 (Base NP规则 ) ,通过规则排序和语言学知识 ,对其中正确率低且明显不符合语法的规则进行剔除 .在识别时 ,采取规则匹配树的方法进行最大长度匹配 ,通过归纳机器学习 C4.5算法引入上下文信息 ,由 C4.5算法学习出有效 (或无效 )应用 Base NP规则的条件 ,参照上下文条件 ,约束应用 Base NP规则 .实验结果表明 ,提出的方法具有很高的正确率和召回率 .
关键词
basenp
匹配树
决策树
英语句子
自然语言处理
Keywords
basenp
,
noun
phrase
, matching tree, decision tree
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
混合的汉语基本名词短语识别方法
被引量:
7
2
作者
胡乃全
朱巧明
周国栋
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第20期199-201,共3页
基金
国家自然科学基金资助项目(0673041)
国家"863"计划基金资助项目(006AA01Z147)
文摘
提出一种混合的汉语基本名词短语(BaseNP)识别模型,包括采用语法规则、统计方法和组合分类器方法。利用BaseNP词的信息、词性信息及上下文句法信息,构建组合分类器,提高判断的准确性。在中文树库(CTB5.0)上进行实验,F值达到了90.09%,证明该方法能有效地识别BaseNP。
关键词
基本名词短语
规则模板
组合分类器
Keywords
base noun phrase(basenp)
rule templates
combined classifier
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
融入双语最大名词短语的机器翻译模型
被引量:
9
3
作者
李业刚
梁丽君
孙福振
王绍卿
于潇
机构
山东理工大学计算机科学与技术学院
出处
《计算机应用研究》
CSCD
北大核心
2017年第5期1316-1320,共5页
基金
国家"973"计划资助项目(2013CB329303)
国家自然科学基金重点资助项目(61132009)
文摘
在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略,以硬约束的方式在统计机器翻译中融入最大名词短语,并在双语最大名词短语层面上融合了短语翻译模型和层次短语模型,对翻译系统的改善最显著。所述策略显著提高了短语翻译模型的质量,在复杂长句翻译中,Method-Ⅲ的BLEU值比基于短语的基线翻译模型提高了3.03%。
关键词
统计机器翻译
短语翻译模型
最大名词短语
双语最大名词短语
Keywords
statistical machine translat ion
phrase
-
base
d translation model
maximal-length
noun
phrase
bilingual maiallength
noun
phrase
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
中英文指代消解中待消解项识别的研究
被引量:
14
4
作者
孔芳
朱巧明
周国栋
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2012年第5期1072-1085,共14页
基金
国家自然科学基金项目(60873150,90920004,61003153)
高等学校博士学科点专项科研基金项目(200802850006)
国家“八六三”高技术研究发展计划基金项目(2012AA011102)
文摘
深入研究了中英文指代消解中的待消解项识别问题.在前人工作的基础上,首先使用规则方法识别与上下文无关或具有显著固定模式的非待消解项;针对与上下文相关的非待消解项识别,从平面特征方法和结构化树核函数方法两方面入手进行了探索;利用复合核函数将平面特征和结构化特征有效结合,对待消解识别问题进行了进一步研究.在ACE2003英文语料和ACE2005中文语料上的实验结果表明,提出的多种待消解项识别方案各具特色,都取得了不错的性能.最后将得到的待消解项识别模块应用于中英文的指代消解任务.实验结果表明,合适的待消解项识别能够大大提高中英文指代消解的性能.
关键词
待消解项识别
规则方法
平面特征方法
结构化树核函数方法
复合核函数
Keywords
noun
phrase
anaphoricity determination
rule-
base
d method
flat feature-
base
d method
structured tree kernel-
base
d method
composite kernel
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
统计和规则相结合的汉语最长名词短语自动识别
被引量:
16
5
作者
代翠
周俏丽
蔡东风
杨洁
机构
沈阳航空工业学院知识工程中心
出处
《中文信息学报》
CSCD
北大核心
2008年第6期110-115,共6页
基金
国家863计划资助项目(2006AA01Z148)
教育部科学技术研究重点资助项目(207148)
文摘
在分析汉语最长名词短语特点的基础上,提出了一种统计和规则相结合的汉语最长名词短语自动识别方法:通过实验词及词性的不同组合选择特征集合,基于该特征训练得到条件随机场(CRF)识别模型;分析错误识别结果,结合最长名词短语的边界信息和内部结构信息构建规则库对识别结果进行后处理,弥补了机器学习模型获取知识不够全面的不足。实验结果表明,用统计和规则相结合的方法识别最长名词短语是有效的,系统开放测试结果F值达到了90.2%。
关键词
计算机应用
中文信息处理
条件随机场
最长名词短语
基于规则的后处理
Keywords
computer application
Chinese information processing
conditional random fields
maximum
noun
phrase
rule
base
d post-processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于混合策略的英语基本名词短语识别——边界统计和词性串规则校正相结合的策略
被引量:
2
6
作者
梁颖红
赵铁军
姚建民
于浩
徐冰
机构
东北林业大学信息与计算机工程学院
哈尔滨工业大学计算机科学与技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2004年第35期1-3,121,共4页
基金
国家自然科学基金(编号:60302021
60375019)
+1 种基金
国家863高技术研究发展计划项目(子课题)(编号:2002AA117010-09)
科技部政府间国际合作项目(编号:CI-2003-03)资助
文摘
基本名词短语识别是自然语言处理领域非常重要的子任务。文中总结了一些有代表性的基本名词短语识别方法,并对多种典型英语基本名词短语识别的结果进行了比较和对照,提出并实现了边界统计和词性串校正相结合的英语基本名词短语识别方法。该方法把基本名词短语识别分成主次分明的两部分,边界统计作为主要部分能够正确识别出大部分基本名词短语,词性串规则作为辅助手段在对前者识别出的基本名词短语进行核对和校正的同时还对边界统计方法遗漏的基本名词短语进行再回收。此方法中,词性串规则弥补了边界统计无法顾及基本名词短语内部组合规律的缺点,提高了精确率和召回率。采用此方法,基本名词短语识别的精确率达到96.22%,召回率97.59%,Fβ=196.90%,F值超出了目前报道的最好结果。
关键词
基本名词短语识别
英语
混合策略
语块
边界统计
词性串规则校正
Keywords
base
noun
phrase
,chunk,boundary statistic,bunches of part of speech
分类号
TP301 [自动化与计算机技术—计算机系统结构]
H313 [语言文字—英语]
在线阅读
下载PDF
职称材料
题名
基于归约的汉语最长名词短语识别方法
被引量:
4
7
作者
钱小飞
侯敏
机构
上海大学文学院
中国传媒大学国家语言资源监测与研究中心有声媒体中心
出处
《中文信息学报》
CSCD
北大核心
2015年第2期40-48,共9页
基金
上海市高校青年教师培养资助计划(shu11053)
国家语言资源监测与研究中心科研项目(YZYS08-04)
文摘
该文提出了最长名词短语(MNP)的操作性定义,分析了其构造和分布特征,并设计了一种基于baseNP归约的识别方法,利用MNP结构特性及起始有定成分、语义核心等语言学特征,缓解了最长名词短语长距离依赖与模型观察窗口受限的矛盾。开放测试取得了88.68%的正确率和89.21%的召回率;归约方法全面提升了识别性能,特别是将多词结构的调和平均值提高1%,优化幅度达6%以上,并且对长距离复杂结构有着更好的识别效果。
关键词
最长名词短语
识别
归约
基本名词短语
Keywords
maximal
noun
phrase
recognize
reduction
basenp
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
引入混合特征的最大名词短语双向标注融合算法
被引量:
4
8
作者
李业刚
黄河燕
鉴萍
机构
山东理工大学计算机科学与技术学院
北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心
出处
《自动化学报》
EI
CSCD
北大核心
2015年第7期1274-1282,共9页
基金
国家重点基础研究发展计划(973计划)
2013CB329303)
+2 种基金
国家自然科学基金(61132009
61202244
61201352)资助~~
文摘
最大名词短语的识别对机器翻译等诸多自然语言处理任务有着:惹要的意义.以汉语最大名词短语识别为研究任务,在分析现有方法的基础上,从汉语的语H学特殊性以及基于支持向量机的序列标注算法的特点出发,考查了基于混合特征的融合算法的适应性.实验证叨,釆用词和基本组块混合标注单元的标注方法对汉语最大名词短语的识别是有效的,并且其i E反向识别结果具有一定的互补性,在此基础上提出的基于"边界分歧"的双向序列标注融合算法恰能发掘双向识别的互补性,并达到较高的融合精度.
关键词
最大名词短语
双向标注
基本组块
混合特征
Keywords
Maximal-length
noun
phrase
bi-directional labeling
base
chunk
hybrid feature
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于粗糙集的基本名词短语识别
被引量:
2
9
作者
郭永辉
杨红卫
马芳
王炳锡
机构
解放军信息工程大学
河南工业大学信息科学与工程学院
出处
《中文信息学报》
CSCD
北大核心
2006年第3期14-21,共8页
基金
国家自然科学基金资助项目(60372038)
文摘
本文提出了一种基于粗糙集的基本名词短语(BaseNP)识别方法。该方法首先进行BaseNP标注,然后实现BaseNP识别。它把BaseNP标注看作一个决策问题用粗糙集理论解决,因而具有特征约简和规则优化的特点。文章介绍了基于粗糙集的规则学习方法和相应的算法,同时也给出了BaseNP标注和识别的算法流程,提出了解决实例冲突问题的方法,并提高了识别效果。文章最后给出了详细的实验步骤和结果,并与几个典型系统进行了比较与分析,提出了进一步改进的方向。
关键词
人工智能
自然语言处理
基本名词短语
粗糙集
机器学习
规则方法
算法
Keywords
artificial intelligence
natural language processing
base
noun
phrase
rough sets
machine learning
rule
base
d method
algorithm
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于跨语言文本分类的跨语言特征提取方法研究
被引量:
2
10
作者
高影繁
王惠临
徐红姣
机构
中国科学技术信息研究所
出处
《情报学报》
CSSCI
北大核心
2011年第12期1242-1248,共7页
基金
本文为“十一五”国家科技支撑计划项目(编号:2006BAH031302)
中国博士后科学基金项目(20090450465)
+1 种基金
中国科学技术信息研究所2010重点项目(编号:ZD2010-3-3)
中国科学技术信息研究所2010学科建设(XK2010-6)资金支持.
文摘
随着文本分类算法的实用化和多语种信息的日益丰富,当机构或组织的文档管理部门日益依赖自动文本分类时,如何解决多语种文档的归类问题成为新的研究热点,跨语言文本分类技术就是在这样的背景下提出的。本文以国家图书文献中心(NSTL)的多语种语料为研究对象,以一部科技类的汉英科技词典为资源工具,提出了一种基于跨语言文本分类的跨语言特征提取方法,实验结果验证了在简单翻译资源条件下对科技文献进行跨语言分类的可行性,也为下一阶段建立实用跨语言文类系统奠定了基础。
关键词
最长短语识别
类别信息消歧
特征提取
Keywords
identifying the maximal
noun
phrase
, translation disambiguation
base
d on category information, feature extraction
分类号
G35 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
现代汉语名词语法属性的计量研究初探
被引量:
2
11
作者
王萌
俞士汶
段慧明
孙薇薇
机构
北京大学计算语言学研究所
出处
《中文信息学报》
CSCD
北大核心
2008年第5期22-29,38,共9页
基金
国家973课题资助项目(2004CB318102)
文摘
以《现代汉语语法信息词典》中语法属性的概率化描述为目标,基于1998年上半年《人民日报》标注语料,对名词语法属性的概率化进行了初步的实验研究。首先,考察了名词与数词、名词与量词搭配的相关属性,引进"分散度"概念,利用它对"数名"结构进行了定量分析;其次,考察了名词受不同量词修饰的分布情况。最后,把实验结果与《现代汉语语法信息词典》的相应属性进行了比照和分析,在属性概率化的同时也对其正确性进行了验证。
关键词
计算机应用
中文信息处理
现代汉语
现代汉语语法信息词典
概率语法属性描述
基本标注语料库
“数名”结构
“数量名”短语
Keywords
computer application
Chinese information processing
contemporary Chinese
the grammatical knowledge-
base
of contemporary Chinese
description of probabilistic grammatical attribute^POS tagged corpus
"numeral-
noun
" structure
"numerallassifier-
noun
"
phrase
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
哈萨克语基本名词短语自动识别研究与实现
被引量:
11
12
作者
孙瑞娜
古丽拉.阿东别克
机构
新疆大学信息科学与工程学院
出处
《中文信息学报》
CSCD
北大核心
2010年第6期114-119,共6页
基金
国家自然科学基金资助项目(60763005)
国家教育部
国家语委民族语言文字规范标准建设及信息化科研项目(MZ115-92)
文摘
以哈萨克语基本名词短语识别为目标,实现了哈萨克语基本名词短语自动识别系统。采用基于规则自动识别及人工标注的方法建立基本名词短语标注语料库,在此基础上,采用统计和规则相结合的识别方法,利用互信息进行基本名词短语边界预测,然后根据哈萨克语基本名词短语构成规则对预测边界进行调整,加入标注符,得到最终的识别结果。实验结果表明,两种方法封闭测试的识别精确率分别为80.2%和82.5%。
关键词
语料库
基本名词短语
哈萨克语
互信息
规则
Keywords
corpus
base
noun
phrase
Kazakh
mutual information
rules
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
英语功能名词短语研究及其应用
被引量:
1
13
作者
马建军
黄德根
机构
大连理工大学计算机科学与技术学院
大连理工大学外国语学院
出处
《大连理工大学学报》
EI
CAS
CSCD
北大核心
2012年第1期126-131,共6页
基金
中央高校基本科研业务费专项资金资助项目(DUT10RW202)
文摘
根据英语名词短语的句法功能,提出了一种新的英语名词短语——功能名词短语,同时与基本名词短语和最长名词短语相比较.利用Google在线翻译系统,对存在结构歧义的句子进行了翻译,发现英汉机器翻译的错误主要是由结构歧义引起的,并应用功能名词短语的定义对结构歧义问题予以解决.实验结果表明,功能名词短语的识别能够有效消解两种结构歧义:一是与动词构成固定搭配的名词引起的歧义;二是"介词+名词"结构是作状语还是作后置定语的歧义.功能名词短语的研究对消除句法结构歧义、提高英汉机器翻译译文质量具有重要意义.
关键词
机器翻译
功能名词短语
基本名词短语
最长名词短语
Keywords
machine translation
functional
noun
phrase
s
base
noun
phrase
s
maximal
noun
phrase
s
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
H319.5 [语言文字—英语]
在线阅读
下载PDF
职称材料
题名
基于混合统计模型的中文基本名词短语识别
被引量:
3
14
作者
谭魏璇
孔芳
倪吉
周国栋
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
出处
《计算机应用与软件》
CSCD
2011年第8期254-256,共3页
文摘
采用一种基于混合统计模型的方法来实现中文基本名词短语识别。首先简要分析目前的研究现状,明确中文Base NP识别的任务,然后采用以基于转换的标注和条件随机域模型为底层,支持向量机模型为高层的混合统计模型来进行中文BaseNP的识别。在ACE2005中文语料上的实验表明,F值比使用单一模型提高了1.37%,达到了88.67%,能提高中文基本名词短语的识别性能。
关键词
基本名词短语
支持向量机模型
特征模板
Keywords
base
noun
phrase
Support vector machine(SVM) Feature template
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
匹配树和决策树方法识别英语句子中的BaseNP
荀恩东
李生
赵铁军
《计算机研究与发展》
EI
CSCD
北大核心
2000
2
在线阅读
下载PDF
职称材料
2
混合的汉语基本名词短语识别方法
胡乃全
朱巧明
周国栋
《计算机工程》
CAS
CSCD
北大核心
2009
7
在线阅读
下载PDF
职称材料
3
融入双语最大名词短语的机器翻译模型
李业刚
梁丽君
孙福振
王绍卿
于潇
《计算机应用研究》
CSCD
北大核心
2017
9
在线阅读
下载PDF
职称材料
4
中英文指代消解中待消解项识别的研究
孔芳
朱巧明
周国栋
《计算机研究与发展》
EI
CSCD
北大核心
2012
14
在线阅读
下载PDF
职称材料
5
统计和规则相结合的汉语最长名词短语自动识别
代翠
周俏丽
蔡东风
杨洁
《中文信息学报》
CSCD
北大核心
2008
16
在线阅读
下载PDF
职称材料
6
基于混合策略的英语基本名词短语识别——边界统计和词性串规则校正相结合的策略
梁颖红
赵铁军
姚建民
于浩
徐冰
《计算机工程与应用》
CSCD
北大核心
2004
2
在线阅读
下载PDF
职称材料
7
基于归约的汉语最长名词短语识别方法
钱小飞
侯敏
《中文信息学报》
CSCD
北大核心
2015
4
在线阅读
下载PDF
职称材料
8
引入混合特征的最大名词短语双向标注融合算法
李业刚
黄河燕
鉴萍
《自动化学报》
EI
CSCD
北大核心
2015
4
在线阅读
下载PDF
职称材料
9
基于粗糙集的基本名词短语识别
郭永辉
杨红卫
马芳
王炳锡
《中文信息学报》
CSCD
北大核心
2006
2
在线阅读
下载PDF
职称材料
10
基于跨语言文本分类的跨语言特征提取方法研究
高影繁
王惠临
徐红姣
《情报学报》
CSSCI
北大核心
2011
2
在线阅读
下载PDF
职称材料
11
现代汉语名词语法属性的计量研究初探
王萌
俞士汶
段慧明
孙薇薇
《中文信息学报》
CSCD
北大核心
2008
2
在线阅读
下载PDF
职称材料
12
哈萨克语基本名词短语自动识别研究与实现
孙瑞娜
古丽拉.阿东别克
《中文信息学报》
CSCD
北大核心
2010
11
在线阅读
下载PDF
职称材料
13
英语功能名词短语研究及其应用
马建军
黄德根
《大连理工大学学报》
EI
CAS
CSCD
北大核心
2012
1
在线阅读
下载PDF
职称材料
14
基于混合统计模型的中文基本名词短语识别
谭魏璇
孔芳
倪吉
周国栋
《计算机应用与软件》
CSCD
2011
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部