期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于藏文音节结合BiLSTM-CRF的藏语语义组块分类标注 被引量:1
1
作者 旦正吉 华却才让 +1 位作者 完么措 白颖 《高原科学研究》 CSCD 2024年第2期118-125,共8页
针对藏语句子语义分析中语义种类繁多且广泛存在歧义的难点,提出了基于藏文音节向量和BiL-STM-CRF混合模型相结合的藏语语义组块识别方法。首先制定了13种语义组块标注规范,其次构建了13211句语义组块标注语料库,在此基础上采用TS-BiLST... 针对藏语句子语义分析中语义种类繁多且广泛存在歧义的难点,提出了基于藏文音节向量和BiL-STM-CRF混合模型相结合的藏语语义组块识别方法。首先制定了13种语义组块标注规范,其次构建了13211句语义组块标注语料库,在此基础上采用TS-BiLSTM-CRF方法训练了藏语语义组块识别和分类模型。综合测试实验结果表明,该模型精确率为75.03%,召回率为76.52%,F1值为75.77%。各类语义组块识别中,指示类(INS)识别的测评结果远高于其他几类语义组块,精确率为90.87%;组织类(ORG)的测评结果偏低于其他类型,精确率为66.67%。文章研究证实了TS-BiLSTM-CRF模型在藏语语义组块识别分析任务中具有较好的性能。 展开更多
关键词 藏语 语义组块识别 TS-BiLSTM-CRF模型 标注规范
在线阅读 下载PDF
基于语义组块分析的汉语语义角色标注 被引量:24
2
作者 丁伟伟 常宝宝 《中文信息学报》 CSCD 北大核心 2009年第5期53-61,74,共10页
近些年来,中文语义角色标注得到了大家的关注,不过大多是传统的基于句法树的系统,即对句法树上的节点进行语义角色识别和分类。该文提出了一种与传统方法不同的处理策略,我们称之为基于语义组块分析的语义角色标注。在新的方法中,语义... 近些年来,中文语义角色标注得到了大家的关注,不过大多是传统的基于句法树的系统,即对句法树上的节点进行语义角色识别和分类。该文提出了一种与传统方法不同的处理策略,我们称之为基于语义组块分析的语义角色标注。在新的方法中,语义角色标注的流程不再是传统的"句法分析——语义角色识别——语义角色分类",而是一种简化的"语义组块识别——语义组块分类"流程。这一方法将汉语语义角色标注从一个节点的分类问题转化为序列标注问题,我们使用了条件随机域这一模型,取得了较好的结果。同时由于避开了句法分析这个阶段,使得语义角色标注摆脱了对句法分析的依赖,从而突破了汉语语法分析器的时间和性能限制。通过实验我们可以看出,新的方法可以取得较高的准确率,并且大大节省了分析的时间。通过对比,我们可以发现在自动切分和词性标注上的结果与在完全正确的切分和词性标注上的结果相比,还有较大差距。 展开更多
关键词 计算机应用 中文信息处理 语义角色标注 语义组块分析 条件随机域 序列标注
在线阅读 下载PDF
基于混合内容线索特征的语义组块标注研究 被引量:3
3
作者 白如江 冷伏海 廖君华 《情报学报》 CSSCI CSCD 北大核心 2017年第4期382-391,共10页
大数据时代背景下,实现科技文献深层语义理解逐渐成为情报学研究的热点话题,本文利用词频统计和共词分析方法分析了科技文献内容浅层语法特征、上下文特征和核心线索词特征,构建了混合内容线索特征集合,采用条件随机场模型,对NSF碳纳米... 大数据时代背景下,实现科技文献深层语义理解逐渐成为情报学研究的热点话题,本文利用词频统计和共词分析方法分析了科技文献内容浅层语法特征、上下文特征和核心线索词特征,构建了混合内容线索特征集合,采用条件随机场模型,对NSF碳纳米管研究领域项目数据进行了语义组块标注实验。实验结果表明,在B-SUB、I-SUB、B-ACT、I-ACT、B-GOL、I-GOL、B-IMP7种标签标注中,增加混合内容线索特征后的精度值分别达到84.43%、89.09%、84.38%、89.87%、51.33%、50.37%、37.83%,与没有增加的标注结果相比精度值有了明显提升。特别是B-SUB、I-SUB、B-ACT、I-ACT四种标签,在增加了内容线索特征后精度值提升了10%以上。 展开更多
关键词 内容线索特征 条件随机场 语义组块标注
在线阅读 下载PDF
中文语义组块自动抽取方法 被引量:2
4
作者 钟茂生 荆佳琦 《计算机应用研究》 CSCD 北大核心 2018年第2期396-399,共4页
句子语义表述是当前自然语言处理领域亟待解决的重要问题,是制约自然语言能否取得深度应用的重要因素。根据中文文本的特点,摈弃以前自然语言处理语义与句法相分离的观点,提出语义组块概念,并利用深度信念网络的深度学习方法构建对中文... 句子语义表述是当前自然语言处理领域亟待解决的重要问题,是制约自然语言能否取得深度应用的重要因素。根据中文文本的特点,摈弃以前自然语言处理语义与句法相分离的观点,提出语义组块概念,并利用深度信念网络的深度学习方法构建对中文语义组块进行自动抽取的模型,模型以句子中名词为核心,将名词与其前后词语进行组合后构成中文语义组块,之后分别使用神经网络、支持向量机和深度信念网络三种抽取方法构建抽取模型,进行了三组实验,最终结果显示在高维大数据背景下,深度信念网络的方法与支持向量机和神经网络相比较具有更好的抽取效果。 展开更多
关键词 语义表述 深度信念网络 深度学习 中文语义组块
在线阅读 下载PDF
融合事件信息的中文问答系统问题语义表征 被引量:2
5
作者 魏楚元 湛强 +2 位作者 樊孝忠 毛煜 张大奎 《中文信息学报》 CSCD 北大核心 2015年第1期146-154,共9页
复杂类问题理解是中文问答系统研究的难点,基于组块的问句分析方法将整个问句转化为若干组块,降低了问句分析的难度和复杂性。针对以含有事件(动作)信息的复杂类问题,提出基于语义组块的中文问答系统问题语义表征模型,采用语义组块的思... 复杂类问题理解是中文问答系统研究的难点,基于组块的问句分析方法将整个问句转化为若干组块,降低了问句分析的难度和复杂性。针对以含有事件(动作)信息的复杂类问题,提出基于语义组块的中文问答系统问题语义表征模型,采用语义组块的思想将问题的语义成分定义为疑问焦点块、问题主题块和问题事件块三个语义组块,对问句中的事件语义信息,建立了问题事件语义结构,将一个问句表征为一个基于语义组块的问题语义表征结构,用于问答系统的问题理解。通过序列标注学习方法实现问题语义表征中语义组块自动标注。实验结果表明:问题语义组块标注效果较好,问题语义表征模型获取了问题的关键语义信息,为语义层面上的问题理解提供基础。 展开更多
关键词 复杂类问题 事件 问题语义表征 语义组块 问题理解
在线阅读 下载PDF
基于问题语义表征的中文问答系统相似度计算方法
6
作者 魏楚元 湛强 +2 位作者 张大奎 毛煜 樊孝忠 《情报学报》 CSSCI 北大核心 2014年第10期1099-1107,共9页
问答系统特别是近年来流行的社区问答系统是信息检索与自然语言领域研究的热点。问题与答案句匹配及相似问题检索是中文问答系统研究的关键问题之一,其本质是基于相似度计算方法,从已解决的历史问答对中找出与查询问题相关的问题。本... 问答系统特别是近年来流行的社区问答系统是信息检索与自然语言领域研究的热点。问题与答案句匹配及相似问题检索是中文问答系统研究的关键问题之一,其本质是基于相似度计算方法,从已解决的历史问答对中找出与查询问题相关的问题。本文以含有事件(动作)信息的复杂类问句为研究对象,提出了一种基于问题语义表征的问题相似度计算方法,问题语义表征结构由疑问焦点块、问题主题块和问题事件块组成,将一个查询问题与历史问题之间的相似度分解为三个主要语义组块之间相似度。实验结果表明,该方法具有一定的有效性。 展开更多
关键词 问题语义表征 相似度计算 语义组块 相似问题检索
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部