期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
汉语短语的自动划分和标注 被引量:21
1
作者 周强 《中文信息学报》 CSCD 北大核心 1997年第1期1-10,共10页
考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成等三个... 考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成等三个处理阶段,其间利用了从人工标注的树库中统计得到的各种数据进行自动句法排歧,最终得到一棵最佳句法分析树,从而可以自顶向下地完成对一句句子的短语自动划分和标注,对一千多句句子的封闭测试结果表明,短语划分的正确率约为86%,短语标注的正确率约为92%,处理效果还是比较令人满意的。 展开更多
关键词 自动划分 标注 语料库加工 汉语分析器 汉语短语
在线阅读 下载PDF
《面向中文信息处理的现代汉语短语结构规则研究》序 被引量:4
2
作者 陆俭明 《汉语学习》 2000年第5期70-72,共3页
关键词 《面向中文信息处理的现代汉语短语结构规则研究》 中文信息处理 机器翻译系统 句处理 汉语学习
在线阅读 下载PDF
论聚合短语的性质及汉语短语的分类
3
作者 季永兴 熊文华 《湖北大学学报(哲学社会科学版)》 1993年第3期85-90,共6页
本文拟将现代汉语短语划分为聚合短语、组合短语和粘附短语三大类。为了说明这种分类的合理性和可行性,我们将从不同角度来着重探讨聚合短语的性质及与其它短语的区别性特征。 1.1 根据乔姆斯基的转换生成语法的理论进行考察,聚合短语... 本文拟将现代汉语短语划分为聚合短语、组合短语和粘附短语三大类。为了说明这种分类的合理性和可行性,我们将从不同角度来着重探讨聚合短语的性质及与其它短语的区别性特征。 1.1 根据乔姆斯基的转换生成语法的理论进行考察,聚合短语大多是语句重合而形成的。请看语例: (1)李明和郭进回来了又走了。 象这样一个表层句,逆推到深层句,它实质上是由四个语句重合而成的。 展开更多
关键词 汉语短语 向心结构 整体功能 离心结构 语句 直接成分 聚合关系 组合关系 李明 布龙菲尔德
在线阅读 下载PDF
基于神经元网络的汉语短语边界识别 被引量:6
4
作者 奚晨海 孙茂松 《中文信息学报》 CSCD 北大核心 2002年第2期20-26,共7页
短语边界的识别是浅层句法分析或组块分析的基础 ,对真实文本的处理具有重要意义。在一个含有 6 442 6词的汉语树库的支持下 ,本文设计并实现了基于神经元网络的汉语短语边界自动识别模型。初步实验结果显示 ,该模型的界定准确率为 93 2... 短语边界的识别是浅层句法分析或组块分析的基础 ,对真实文本的处理具有重要意义。在一个含有 6 442 6词的汉语树库的支持下 ,本文设计并实现了基于神经元网络的汉语短语边界自动识别模型。初步实验结果显示 ,该模型的界定准确率为 93 2 4 % (封闭测试 )和 92 5 6 % (开放测试 )。 展开更多
关键词 汉语短语边界自动识别 神经元网络 中文信息处理 浅层句法分析 组块分析 文字识别
在线阅读 下载PDF
一个汉语短语自动界定模型 被引量:9
5
作者 周强 《软件学报》 EI CSCD 北大核心 1996年第A00期315-322,共8页
本文提出了一个汉语短语自动界定模型,它通过基于统计的自动界定处理,利用通过错误驱动自动学习而得到的调整规则界定情况局部调整,利用人工总结的全局调整规则进行精调整等3个处理阶段,可以较邹地确定一句经过正确切分和词性注处... 本文提出了一个汉语短语自动界定模型,它通过基于统计的自动界定处理,利用通过错误驱动自动学习而得到的调整规则界定情况局部调整,利用人工总结的全局调整规则进行精调整等3个处理阶段,可以较邹地确定一句经过正确切分和词性注处理的汉语句子中不同短语的边界位置,从而为时一步的汉语短语自动划分和标注处理打下了良好的基础,对1000多句句子的实验结果表明,模型的界定正确率达到了96.33%(封闭测试)、94. 展开更多
关键词 汉语短语 界定模型 短语划分 语料库 汉语处理
在线阅读 下载PDF
基于动词的汉语复合名词短语释义研究 被引量:9
6
作者 王萌 黄居仁 +1 位作者 俞士汶 李斌 《中文信息学报》 CSCD 北大核心 2010年第6期3-9,共7页
复合名词短语的语义解释的主要目的是恢复修饰语和中心词之间隐含的语义关系。该文针对汉语复合名词短语的语义解释,首次采用动态的策略,提出了"基于动词的短语释义"的方法,利用语料库及Web数据,自动获取复合名词短语的释义短... 复合名词短语的语义解释的主要目的是恢复修饰语和中心词之间隐含的语义关系。该文针对汉语复合名词短语的语义解释,首次采用动态的策略,提出了"基于动词的短语释义"的方法,利用语料库及Web数据,自动获取复合名词短语的释义短语,实验结果表明,该方法不仅可以为复合名词短语提供多种可能的语义解释,而且能够反应相似的复合名词短语之间细微的语义差别。此外,该文的研究结果可以服务于问答系统、信息检索、词典编纂等多个应用领域。 展开更多
关键词 汉语复合名词短语 语义解释 释义短语 释义动词
在线阅读 下载PDF
基于HMM的汉语介词短语自动识别研究 被引量:9
7
作者 奚建清 罗强 《计算机工程》 CAS CSCD 北大核心 2007年第3期172-173,182,共3页
提出了一种基于隐马尔可夫模型(HMM)的介词短语界定模型,通过HMM的介词短语边界自动识别和依存语法错误校正2个处理阶段,较好地完成了对一个经过分词和词性标注的句子进行介词短语界定任务,为更进一步的句法分析工作打下良好的基础。试... 提出了一种基于隐马尔可夫模型(HMM)的介词短语界定模型,通过HMM的介词短语边界自动识别和依存语法错误校正2个处理阶段,较好地完成了对一个经过分词和词性标注的句子进行介词短语界定任务,为更进一步的句法分析工作打下良好的基础。试验结果显示:该模型的识别正确率达到了86.5%(封闭测试)和77.7%(开放测试),取得了令人满意的结果。 展开更多
关键词 汉语介词短语 自动识别 依存语法
在线阅读 下载PDF
结合句法组成模板识别汉语基本名词短语的概率模型 被引量:11
8
作者 赵军 黄昌宁 《计算机研究与发展》 EI CSCD 北大核心 1999年第11期1384-1390,共7页
文中首先给出了汉语基本名词短语(baseNP)的形式化定义,并通过抽取baseNP句法组成模板,显示了这个定义的可操作性.文中指出,句法组成模板只是识别baseNP的必要条件,而非充要条件,仅靠句法组成模板并不能解决... 文中首先给出了汉语基本名词短语(baseNP)的形式化定义,并通过抽取baseNP句法组成模板,显示了这个定义的可操作性.文中指出,句法组成模板只是识别baseNP的必要条件,而非充要条件,仅靠句法组成模板并不能解决baseNP识别中的边界模糊歧义和短语类型歧义问题.据此,把体现baseNP内部组成的句法组成模板与体现上下文约束条件的N 元模型结合起来,形成了汉语baseNP识别的新模型.实验证明,该模型的性能优于单纯基于词性标记的N 展开更多
关键词 自然语言处理 语料库 模板识别 汉语名词短语
在线阅读 下载PDF
基于区分词的汉语隐喻短语识别 被引量:2
9
作者 符建辉 曹存根 王石 《计算机科学》 CSCD 北大核心 2010年第10期193-196,232,共5页
隐喻识别是自然语言处理的一个重要研究分支。目前人们越来越清楚地认识到隐喻在思维及语言中所处的中心地位。从计算语言学和自然语言处理的角度来考虑,隐喻问题若不能得到很好的处理,语言理解和机器翻译的效果都会受到影响。通过观察... 隐喻识别是自然语言处理的一个重要研究分支。目前人们越来越清楚地认识到隐喻在思维及语言中所处的中心地位。从计算语言学和自然语言处理的角度来考虑,隐喻问题若不能得到很好的处理,语言理解和机器翻译的效果都会受到影响。通过观察隐喻短语和非隐喻短语在汉语中的上下文发现,有一批词可用于有效地识别隐喻短语,称之为区分词。首先从Web中自动抽取了一部分区分词,进而提出了一种基于区分词的隐喻短语识别方法。实验表明基于区分词的识别方法是有效的。 展开更多
关键词 隐喻识别 汉语隐喻短语 自然语言理解
在线阅读 下载PDF
基于扩张矩阵理论的汉语韵律短语分析 被引量:2
10
作者 谌卫军 林福宗 +1 位作者 李建民 张钹 《计算机学报》 EI CSCD 北大核心 2003年第1期26-31,共6页
提出了一种新的、基于扩张矩阵理论的归纳学习算法 :分组覆盖算法 ,并将其应用于汉语文语转换系统中的韵律短语分析问题 .算法以扩张矩阵为基础 ,在反例样本集背景下 ,将正例样本集划分为若干个一致的组 ,每一组对应于一个一致的规则 ,... 提出了一种新的、基于扩张矩阵理论的归纳学习算法 :分组覆盖算法 ,并将其应用于汉语文语转换系统中的韵律短语分析问题 .算法以扩张矩阵为基础 ,在反例样本集背景下 ,将正例样本集划分为若干个一致的组 ,每一组对应于一个一致的规则 ,它覆盖了这组正例而且不覆盖任何的反例 ;建造了一个用于韵律短语分析的语料库 ,并提出了一组与韵律有关的特征 ;将数据分为训练集和测试集对算法进行了验证 .实验结果表明 ,新算法在正确率、规则个数和可懂性等各方面均优于传统的决策树方法 ,并接近于手工制定的规则 . 展开更多
关键词 扩张矩阵理论 汉语韵律短语分析 汉字信息处理 归纳学习算法 汉语文语转换系统
在线阅读 下载PDF
齐普夫定律在中文短语知识中的呈现 被引量:5
11
作者 谢靖 陈静 王东波 《情报学报》 CSSCI 北大核心 2014年第1期11-22,共12页
本文对大规模汉语短语树库中的短语直接成分进行了抽取,在统计各短语结构直接成分频次的基础上排序,并进行短语成分的齐普夫定律验证。实验由局部及整体两部分组成:在局部实验中,对单一短语直接成分进行齐普夫定律验证;在整体实验... 本文对大规模汉语短语树库中的短语直接成分进行了抽取,在统计各短语结构直接成分频次的基础上排序,并进行短语成分的齐普夫定律验证。实验由局部及整体两部分组成:在局部实验中,对单一短语直接成分进行齐普夫定律验证;在整体实验中,对全部短语直接成分进行齐普夫定律验证。实验结果表明,在汉语短语树库中,短语的直接成分分布符合齐普夫定律。这个现象表明,从计量角度而言,汉语短语具有其内核知识,并以内核为基础在最省力原则下对不同语境进行派生,这种派生首先要围绕语法内核知识进行构建,同时又要根据不同语境进行拓展。本研究一方面实现了面向短语层次的语法知识抽取,从计量角度揭示了汉语短语构成的分布规律;另一方面对于中文信息处理中的短语识别、自动句法分析等研究提供短语基础知识支持,这些知识最终可应用于术语短语识别、自动标引、知识抽取、语义分析等研究。 展开更多
关键词 齐普夫定律 汉语短语构建 直接成分分析汉语短语知识汉语树库 最省力法则
在线阅读 下载PDF
汉语基本复合名词短语语义关系知识库构建与识别 被引量:2
12
作者 张文敏 李华勇 邵艳秋 《中文信息学报》 CSCD 北大核心 2019年第12期28-36,共9页
汉语复合名词短语因其使用范围广泛、结构独特、内部语义复杂的特点,一直是语言学分析和中文信息处理领域的重要研究对象。国内关于复合名词短语的语言资源极其匮乏,且现有知识库只研究名名复合形式的短语,包含动词的复合名词短语的知... 汉语复合名词短语因其使用范围广泛、结构独特、内部语义复杂的特点,一直是语言学分析和中文信息处理领域的重要研究对象。国内关于复合名词短语的语言资源极其匮乏,且现有知识库只研究名名复合形式的短语,包含动词的复合名词短语的知识库构建仍处于空白阶段,同时现有的复合名词短语知识库大部分脱离了语境,没有句子级别的信息。针对这一现状,该文从多个领域搜集语料,建立了一套新的语义关系体系,标注构建了一个具有相当规模的带有句子信息的基本复合名词语义关系知识库。该库的标注重点是标注句子中基本复合名词短语的边界以及短语内部成分之间的语义关系,总共收录27007条句子。该文对标注后的知识库做了详细的计量统计分析。最后基于标注得到的知识库,使用基线模型对基本复合名词短语进行了自动定界和语义分类实验,并对实验结果和未来可能的改进方向做了总结分析。 展开更多
关键词 汉语基本复合名词短语 语义关系体系 定界识别
在线阅读 下载PDF
基于HMM和Monte-Carlo方法的生成基频曲线的新方法
13
作者 黄荣青 朱东来 王仁华 《计算机工程与应用》 CSCD 北大核心 2002年第21期103-105,共3页
提出了一种基于隐马尔科夫模型(HMM)的汉语韵律短语的统计基频模型,并尝试使用蒙特卡罗方法(Monte-Carlo)从模型生成基频曲线。该模型使用HMM作为基本框架,具有HMM理论体系所能支配的各种优点。并将韵律词作为模型单元,使得模型能够反... 提出了一种基于隐马尔科夫模型(HMM)的汉语韵律短语的统计基频模型,并尝试使用蒙特卡罗方法(Monte-Carlo)从模型生成基频曲线。该模型使用HMM作为基本框架,具有HMM理论体系所能支配的各种优点。并将韵律词作为模型单元,使得模型能够反映韵律层次级的连续变调。Monte-Carlo方法能生成相对模型最优的基频曲线,并保证生成的基频曲线具有足够的精确度。该文最后给出了实验结果并对模型的应用前景进行了展望。 展开更多
关键词 HMM MONTE-CARLO方法 语音合成 隐马尔科夫模型 蒙特卡罗方法 汉语韵律短语基频模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部