-
题名基于神经网络的语义选择限制知识自动获取
被引量:3
- 1
-
-
作者
贾玉祥
许鸿飞
昝红英
-
机构
郑州大学信息工程学院
-
出处
《中文信息学报》
CSCD
北大核心
2017年第1期155-161,共7页
-
基金
国家自然科学基金(61402419)
国家社会科学基金(14BYY096)
+1 种基金
国家高技术研究发展计划863课题(2012AA011101)
国家重点基础研究发展计划973课题(2014CB340504)
-
文摘
语义选择限制刻画谓语对论元的语义选择倾向,对自然语言的句法语义分析有重要作用,语义选择限制知识的自动获取也成为一个重要的研究课题。鉴于神经网络模型在自然语言处理的很多任务中都有出色的表现,该文提出基于神经网络的语义选择限制知识获取模型,设计了引入预训练词向量的单隐层前馈网络和两层maxout网络。在汉语和英语的伪消歧实验中神经网络模型取得了较好的效果,优于基于隐含狄利克雷分配的模型。
-
关键词
语义选择限制
词汇知识获取
神经网络
伪消歧
-
Keywords
selectional preference
lexical acquisition
neural network
pseudo-disambiguation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名词汇化句法分析与子语类框架获取的互动方法
被引量:3
- 2
-
-
作者
冀铁亮
穗志方
-
机构
北京大学计算语言研究所
-
出处
《中文信息学报》
CSCD
北大核心
2007年第1期120-126,共7页
-
基金
国家自然科学基金资助项目(60503071
60372016)
北京市自然科学基金资助项目(4052019)
-
文摘
概率句法分析器(PCFG Parser)是基于概率规则集的上下文无关文法的句法分析器。规则集主要是针对词类和短语类。然而事实上,词性相同而词汇不同,其所常用的句法规则也通常不同。目前NLP研究的一个趋势和热点就是词汇化的句法分析。针对概率句法分析独立性假设中缺乏词汇化的缺陷,本文将谓语动词的子语类信息与概率句法分析结合起来,提出一种基于动词子语类信息的词汇化概率句法分析方法。论文建立了基于汉语动词子语类框架的统计句法分析模型,并且针对动词子语类框架难以获取的问题,提出一种词汇化概率句法分析与动词子语类框架获取的互动方法。实验利用这种互动的方法获取了汉语中十个常用高频动词的概率化子语类信息,并结合原有的概率句法分析器PCFG实现了一个基于动词子语类信息的概率句法分析器原型系统S-PCFG。实验证明了基于动词子语类信息的概率句法分析对自然语言句法分析的准确率和速度均有所提高。同时分析了新的概率句法分析器的不足之处,为进一步的改进提供条件。
-
关键词
计算机应用
中文信息处理
词汇化概率句法分析
子语类框架
词汇知识自动获取
-
Keywords
computer application
Chinese information processing
lexicalized probabilistic parsing
subcategorization frame acquisition
lexical knowledge acquisition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于MDL的汉语语义选择限制自动获取
被引量:3
- 3
-
-
作者
贾玉祥
李育光
昝红英
-
机构
郑州大学信息工程学院
-
出处
《郑州大学学报(理学版)》
CAS
北大核心
2018年第1期66-71,共6页
-
基金
国家自然科学基金项目(61402419)
国家社会科学基金项目(14BYY096)
+1 种基金
国家高技术研究发展计划863课题(2012AA011101)
国家重点基础研究发展计划973课题(2014CB340504)
-
文摘
语义选择限制是一种重要的词汇语义知识,有助于自然语言的句法语义分析,也有助于解决自然语言处理中的数据稀疏问题.提出了基于语义分类体系和最小描述长度原则的汉语语义选择限制知识自动获取方法,对现有的名词语义分类体系进行改造,实现了一个知识获取的高效算法.基于大规模语料进行知识获取,对获取的优选语义类进行了分析,并进行了伪消歧实验,与基于KL距离的方法进行了对比,体现了所用方法的有效性.
-
关键词
语义选择限制
词汇知识获取
最小描述长度
语义分类体系
-
Keywords
selectional preferences
lexical acquisition
minimum description length(MDL)
semantic taxonomy
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语基本块描述体系
被引量:25
- 4
-
-
作者
周强
-
机构
清华信息科学与技术国家实验室计算机科学与人工智能研究部
-
出处
《中文信息学报》
CSCD
北大核心
2007年第3期21-27,共7页
-
基金
国家自然科学基金资助项目(60573185
60520130299)
-
文摘
块分析是自然语言处理研究中的重要技术,其处理基础是设计一套合理有效的块描述体系。本文在吸收和总结前人研究成果和经验的基础上,提出了一套基于拓扑结构的汉语基本块描述体系。它通过引入词汇关联信息确定基本拓扑结构,形成了很好的基本块内聚性判定准则,建立了句法形式与语义内容的有机联系桥梁。这套描述体系大大简化了从现有的句法树库TCT中自动提取基本块标注语料库和相关词汇关联知识库的处理过程,为进一步进行汉语基本块自动分析和词汇关联知识获取互动进化研究打下了很好的基础。
-
关键词
计算机应用
中文信息处理
基本块
部分分析
语料库标注
词汇知识获取
-
Keywords
computer application
Chinese information processing
base chunk
partial parsing
corpus annotation lexical knowledge acquisition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-