-
题名基于最大熵方法的中英文基本名词短语识别
被引量:63
- 1
-
-
作者
周雅倩
郭以昆
黄萱菁
吴立德
-
机构
复旦大学计算机科学与工程系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2003年第3期440-446,共7页
-
基金
国家自然科学基金 ( 69873 0 11)
Intel中国研究中心基金
-
文摘
使用了基于最大熵的方法识别中文基本名词短语 在开放语料ChineseTreeBank上 ,只使用词性标注 ,达到了平均 87 4 3% / 88 0 9%的查全率 /准确率 由于 ,关于中文的基本名词短语识别的结果没有很好的可比性 ,又使用相同的算法 ,尝试了英文的基本名词短语识别 在英文标准语料TREEBANKⅡ上 ,开放测试达到了 93 31% / 93 0 4 %的查全率/准确率 ,极为接近国际最优水平 这既证明了此算法的行之有效 。
-
关键词
最大熵
基本名词短语
自然语言处理
-
Keywords
maximum entropy
basenp
natural language processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语基本名词短语结构分析模型
被引量:28
- 2
-
-
作者
赵军
黄昌宁
-
机构
清华大学计算机科学与技术系
清华大学智能技术与系统国家重点实验室
-
出处
《计算机学报》
EI
CSCD
北大核心
1999年第2期141-146,共6页
-
基金
国家自然科学基金
-
文摘
本文提出了用词语潜在依存关系分析汉语baseNP结构的模型,它有以下的特点:①将依存语法知识融入概率模型中,使得baseNP结构分析在依存语法知识的指导下进行,其性能优于纯粹的概率模型——相邻模型;②词语潜在依存强度的获取算法是基于MDL原则的,在模型建造时既考虑数据拟合性,又考虑模型归纳性,其性能优于基于极大似然原则的词语潜在依存强度获取算法;③词语潜在依存强度获取算法在复杂特征集上进行,可以有效地解决参数估计中的数据稀疏问题.实验结果显示,这个模型对于汉语baseNP结构分析是有效的.
-
关键词
自然语言处理
语料库
名词短语
结构分析
-
Keywords
natural language processing, corpus, basenp.
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名结合句法组成模板识别汉语基本名词短语的概率模型
被引量:11
- 3
-
-
作者
赵军
黄昌宁
-
机构
清华大学计算机科学与技术系
清华大学智能技术与系统国家实验室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
1999年第11期1384-1390,共7页
-
基金
国家自然科学基金
-
文摘
文中首先给出了汉语基本名词短语(baseNP)的形式化定义,并通过抽取baseNP句法组成模板,显示了这个定义的可操作性.文中指出,句法组成模板只是识别baseNP的必要条件,而非充要条件,仅靠句法组成模板并不能解决baseNP识别中的边界模糊歧义和短语类型歧义问题.据此,把体现baseNP内部组成的句法组成模板与体现上下文约束条件的N 元模型结合起来,形成了汉语baseNP识别的新模型.实验证明,该模型的性能优于单纯基于词性标记的N
-
关键词
自然语言处理
语料库
模板识别
汉语名词短语
-
Keywords
natural language processing, corpus, basenp
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于知识图的汉语基本名词短语分析模型
被引量:8
- 4
-
-
作者
张瑞霞
张蕾
-
机构
西北大学计算机系
-
出处
《中文信息学报》
CSCD
北大核心
2004年第3期47-53,共7页
-
基金
陕西省教育厅专项科研基金资助项目 (HD0 130 2 )
-
文摘
本文提出了一种基于知识图的汉语baseNP分析模型。它以知识图为知识表示方法 ,利用《知网》为语义知识资源 ,采用以语义为主、语法为辅的策略 ,先为短语中的每一个实词构造“词图” ,然后合并“词图”而组成“短语图” ,最后得到一个关于汉语baseNP结构信息和语义信息的知识图。因此它不仅分析了汉语ba seNP结构的内部句法关系 ,而且分析了汉语baseNP结构成分间的语义关系并以知识图的形式表示出了这种语义关系。实验结果表明这个模型对于汉语baseNP的分析是有效的。
-
关键词
人工智能
自然语言处理
知识图
知网
基本名词短语
-
Keywords
artificial intelligence
natural language processing
knowledge graphs
HowNet
basenp
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-