期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于扩张矩阵理论的汉语韵律短语分析 被引量:2
1
作者 谌卫军 林福宗 +1 位作者 李建民 张钹 《计算机学报》 EI CSCD 北大核心 2003年第1期26-31,共6页
提出了一种新的、基于扩张矩阵理论的归纳学习算法 :分组覆盖算法 ,并将其应用于汉语文语转换系统中的韵律短语分析问题 .算法以扩张矩阵为基础 ,在反例样本集背景下 ,将正例样本集划分为若干个一致的组 ,每一组对应于一个一致的规则 ,... 提出了一种新的、基于扩张矩阵理论的归纳学习算法 :分组覆盖算法 ,并将其应用于汉语文语转换系统中的韵律短语分析问题 .算法以扩张矩阵为基础 ,在反例样本集背景下 ,将正例样本集划分为若干个一致的组 ,每一组对应于一个一致的规则 ,它覆盖了这组正例而且不覆盖任何的反例 ;建造了一个用于韵律短语分析的语料库 ,并提出了一组与韵律有关的特征 ;将数据分为训练集和测试集对算法进行了验证 .实验结果表明 ,新算法在正确率、规则个数和可懂性等各方面均优于传统的决策树方法 ,并接近于手工制定的规则 . 展开更多
关键词 扩张矩阵理论 汉语韵律短语分析 汉字信息处理 归纳学习算法 汉语文语转换系统
在线阅读 下载PDF
基于最大熵方法汉语基本短语分析 被引量:2
2
作者 朱冲 王大为 张向利 《计算机工程与应用》 CSCD 北大核心 2008年第32期137-139,共3页
提出了一个汉语基本短语分析模型,将汉语短语的边界划分和短语标识分开,假定这两个过程相互独立,采用最大熵方法分别建立模型解决。最大熵模型的关键是如何选取有效的特征,文中给出了两个步骤相关的特征空间以及特征选择过程和算法。实... 提出了一个汉语基本短语分析模型,将汉语短语的边界划分和短语标识分开,假定这两个过程相互独立,采用最大熵方法分别建立模型解决。最大熵模型的关键是如何选取有效的特征,文中给出了两个步骤相关的特征空间以及特征选择过程和算法。实验表明,模型的短语定界精确率达到95.27%,标注精确率达到96.2%。 展开更多
关键词 短语分析 潜层句法 最大熵原理
在线阅读 下载PDF
哈萨克语动词短语自动识别研究与实现 被引量:3
3
作者 古丽扎达·海沙 古丽拉·阿东别克 《计算机工程与应用》 CSCD 北大核心 2015年第2期218-223,240,共7页
由于哈萨克语基本动词短语Kz Base VP的组成结构比较复杂,并且存在歧义情况和训练语料规模不够大等问题,所以既不能直接使用基于规则的方法,又不能直接使用基于统计的方法来进行处理。所以提出了一种规则与最大熵相结合的方法对哈萨克... 由于哈萨克语基本动词短语Kz Base VP的组成结构比较复杂,并且存在歧义情况和训练语料规模不够大等问题,所以既不能直接使用基于规则的方法,又不能直接使用基于统计的方法来进行处理。所以提出了一种规则与最大熵相结合的方法对哈萨克语基本动词短语(Kz Base VP)进行识别。在该混合策略系统中,根据专属Kz Base VP的特点构建了Kz Base VP搭配规则集,通过规则集对无歧义的Kz Base VP进行标注,其正确率为85.43%;运用基于统计的最大熵模型对存在歧义的Kz Base VP进行识别,根据哈萨克语的单词、词性、词缀和上下文信息等来设计最大熵模型的特征模板,并对模型进行了改进,在解码中选取概率最大的前n个上下文信息分别加入到下一个VP的特征向量中,以此类推直至文本结束,最终选出一条概率最优的VP标注。实验证明,在封闭和开发测试条件下对基本动词短语的识别准确率分别为97.23%和93.22%。 展开更多
关键词 哈萨克语基本动词短语 短语分析 歧义 最大熵模型 规则集
在线阅读 下载PDF
齐普夫定律在中文短语知识中的呈现 被引量:5
4
作者 谢靖 陈静 王东波 《情报学报》 CSSCI 北大核心 2014年第1期11-22,共12页
本文对大规模汉语短语树库中的短语直接成分进行了抽取,在统计各短语结构直接成分频次的基础上排序,并进行短语成分的齐普夫定律验证。实验由局部及整体两部分组成:在局部实验中,对单一短语直接成分进行齐普夫定律验证;在整体实验... 本文对大规模汉语短语树库中的短语直接成分进行了抽取,在统计各短语结构直接成分频次的基础上排序,并进行短语成分的齐普夫定律验证。实验由局部及整体两部分组成:在局部实验中,对单一短语直接成分进行齐普夫定律验证;在整体实验中,对全部短语直接成分进行齐普夫定律验证。实验结果表明,在汉语短语树库中,短语的直接成分分布符合齐普夫定律。这个现象表明,从计量角度而言,汉语短语具有其内核知识,并以内核为基础在最省力原则下对不同语境进行派生,这种派生首先要围绕语法内核知识进行构建,同时又要根据不同语境进行拓展。本研究一方面实现了面向短语层次的语法知识抽取,从计量角度揭示了汉语短语构成的分布规律;另一方面对于中文信息处理中的短语识别、自动句法分析等研究提供短语基础知识支持,这些知识最终可应用于术语短语识别、自动标引、知识抽取、语义分析等研究。 展开更多
关键词 齐普夫定律 汉语短语构建 直接成分分析汉语短语知识汉语树库 最省力法则
在线阅读 下载PDF
基于论文题名的知识驱动关系分析方法研究——以信息与知识传播研究领域为例 被引量:1
5
作者 张运良 《情报杂志》 CSSCI 北大核心 2022年第1期170-176,共7页
[研究目的]基于论文题名快速梳理特定研究领域中的概念,并确定概念所代表的知识之间驱动关系,有助于科学了解研究领域状况,为进一步寻找研究方向提供可能。[研究方法]以信息与知识传播研究领域为例,收集整理题名中包含“知识”研究论文... [研究目的]基于论文题名快速梳理特定研究领域中的概念,并确定概念所代表的知识之间驱动关系,有助于科学了解研究领域状况,为进一步寻找研究方向提供可能。[研究方法]以信息与知识传播研究领域为例,收集整理题名中包含“知识”研究论文元数据,在Stanford Parser的短语结构分析结果基础上,对驱动关系进行人工审定,并做边界调整、拆分和规范化,得到概念间的真实驱动关系数据,定义若干分析指标,以上述数据为基础构建加权有向图,并基于复杂网络分析和可视化技术分析展示在知识驱动方面具有不同特点的概念及驱动路径。[研究结论]该研究借鉴和发展共词分析方法,提出并实现了一种能够揭示研究领域概念之间有方向的知识驱动关系的方法,利用本方法可以发现不同概念在某一领域的驱动强度大小、特定的驱动路径和若干稳定或脆弱的概念团组。 展开更多
关键词 知识驱动关系 论文题名 短语结构分析 复杂网络分析
在线阅读 下载PDF
算符优先文法最左素短语的一种判断算法
6
作者 韩太鲁 《山东矿业学院学报》 CAS 1994年第1期88-91,共4页
算符优先分析法是分析算术表达式的有力工具,这种分析方法主要是寻找句型的最左素短语,本文给出算符优先文法最左素短语的一种判断算法。
关键词 运算优先文法 算符 短语分析算法
在线阅读 下载PDF
基于短语成分表示的中文关系抽取 被引量:1
7
作者 刘娜娜 程婧 +3 位作者 闵可锐 康昱 王新 周扬帆 《数据采集与处理》 CSCD 北大核心 2020年第3期449-457,共9页
关系抽取是自然语言处理的重要研究内容,短语成分结构则是学界普遍认为能对关系抽取有重要影响的特征信息。然而目前短语成分应用于关系抽取任务时没有明显效果。这主要有两个原因:短语成分分析模型的泛化能力较差,会在关系抽取上造成... 关系抽取是自然语言处理的重要研究内容,短语成分结构则是学界普遍认为能对关系抽取有重要影响的特征信息。然而目前短语成分应用于关系抽取任务时没有明显效果。这主要有两个原因:短语成分分析模型的泛化能力较差,会在关系抽取上造成错误传播,从而影响了它对关系抽取的有效性;关系抽取任务上使用短语成分特征的方式存在缺陷,即丧失短语成分分析学习到的句子结构信息,或者加大其对关系抽取的错误影响。本文在提升短语成分分析效果的基础上,提出了基于短语成分表示的中文关系抽取方法。该方法将短语成分分析模型学习到的文本表示嵌入到关系抽取模型中,从而提升关系抽取的性能。本文在公开的中文关系抽取数据集上验证了该方法的有效性。 展开更多
关键词 短语成分表示 中文关系抽取 特征融合 短语成分分析
在线阅读 下载PDF
结合短语结构句法的语义角色标注 被引量:4
8
作者 杨凤玲 周俏丽 +1 位作者 蔡东风 季铎 《中文信息学报》 CSCD 北大核心 2018年第6期1-11,共11页
该文提出一种结合短语结构句法的语义角色标注方法。结合短语结构句法对句子进行剪枝、子句抽取处理,然后,对处理过的句子进行语义角色分析并还原。最后,结合短语树对还原后的论元边界进行修正。其中,剪枝包括并列结构、插入语的剪枝,... 该文提出一种结合短语结构句法的语义角色标注方法。结合短语结构句法对句子进行剪枝、子句抽取处理,然后,对处理过的句子进行语义角色分析并还原。最后,结合短语树对还原后的论元边界进行修正。其中,剪枝包括并列结构、插入语的剪枝,子句抽取针对不同形式的子句有不同的处理方式。边界修正主要是针对某些类型论元进行修正。该文分别在CoNLL2004与CoNLL2005评测语料中做了实验,在CoNLL2005Shared Task的test_wsj数据集上F值为88.25%,在CoNLL2004Shared Task的test数据集上F值为85.66%。实验结果表明,引入短语结构句法能有效地提升语义角色的识别效果。 展开更多
关键词 语义角色标注 短语结构句法分析 剪枝 子句抽取 边界修正
在线阅读 下载PDF
基于两种句法分析的语义角色标注比较研究 被引量:2
9
作者 张育 王红玲 周国栋 《计算机应用与软件》 CSCD 2010年第8期13-16,共4页
首先介绍了短语结构句法树和依存树,比较了两者的差别。然后通过构建基于短语结构句法分析和基于依存句法分析的两个不同的语义角色标注系统,在实验数据的基础上,重点分析短语结构句法分析和依存句法分析的差别以及两者对语义角色标注... 首先介绍了短语结构句法树和依存树,比较了两者的差别。然后通过构建基于短语结构句法分析和基于依存句法分析的两个不同的语义角色标注系统,在实验数据的基础上,重点分析短语结构句法分析和依存句法分析的差别以及两者对语义角色标注的影响。实验结果表明,基于依存句法分析的语义角色标注系统的性能略好于基于短语结构句法分析的语义角色标注系统。 展开更多
关键词 语义角色标注 依存句法分析 短语结构句法分析
在线阅读 下载PDF
现代汉语“V+N”序列关系的平行处理 被引量:2
10
作者 冯敏萱 《计算机工程与应用》 CSCD 北大核心 2010年第30期8-10,共3页
目前,在英汉平行语料中,对汉语文本的深加工多局限于只利用单语分析的成果,没有充分利用双语资源。以现代汉语v+n序列的结构关系为研究对象,设计出在英汉平行语料中识别v+n结构关系的平行处理算法:首先利用各种单语资源,提取出构成不同... 目前,在英汉平行语料中,对汉语文本的深加工多局限于只利用单语分析的成果,没有充分利用双语资源。以现代汉语v+n序列的结构关系为研究对象,设计出在英汉平行语料中识别v+n结构关系的平行处理算法:首先利用各种单语资源,提取出构成不同结构关系的动词和名词相互间的制约规则,再分别依据v+n中汉语名词、动词的语义在英语译文中的具体形式及上下文模板来判断v+n的结构关系类型。实验证明,在自动分词和词性标注的PCCE1000文本中,v+n单语处理的F值为72.14%,而进一步利用汉英词典和英语译文信息,F值到达了88.81%,提高了16.67个百分点。 展开更多
关键词 平行语料 词语搭配 短语分析 自动识别 中文信息处理
在线阅读 下载PDF
结合注意力机制的多策略汉语语义角色标注 被引量:1
11
作者 朱傲 万福成 +1 位作者 马宁 车郭怡 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第6期1019-1023,共5页
语义角色标注旨在标注出句子中所有与谓语相关的语义成分,是进行语义分析的基础和关键技术.使用传统的机器学习方法进行语义角色标注,需要人工设定特征,特征稀疏且工作繁琐沉重,同时传统方法对句法解析精度有较高要求,所以语义角色标注... 语义角色标注旨在标注出句子中所有与谓语相关的语义成分,是进行语义分析的基础和关键技术.使用传统的机器学习方法进行语义角色标注,需要人工设定特征,特征稀疏且工作繁琐沉重,同时传统方法对句法解析精度有较高要求,所以语义角色标注发展缓慢.针对上述情况,采取基于双向长短时记忆(BiLSTM)网络-注意力机制(attention)-条件随机场(CRF)模型进行汉语语义角色标注,同时尝试针对性引入其他资源优化模型性能.在训练阶段,将词性、依存句法特征以及短语结构句法特征组成的多线索特征组共同送入模型.经过多组对照实验论证,相比于BiLSTM-CRF模型,融合注意力机制的模型性能显著提升,并且引入的多线索特征组可以进一步提升模型性能. 展开更多
关键词 汉语语义角色标注 双向长短时记忆 条件随机场 注意力机制 依存句法分析 短语结构句法分析
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部