期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
13
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
汉语短语的自动划分和标注
被引量:
21
1
作者
周强
《中文信息学报》
CSCD
北大核心
1997年第1期1-10,共10页
考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成等三个...
考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成等三个处理阶段,其间利用了从人工标注的树库中统计得到的各种数据进行自动句法排歧,最终得到一棵最佳句法分析树,从而可以自顶向下地完成对一句句子的短语自动划分和标注,对一千多句句子的封闭测试结果表明,短语划分的正确率约为86%,短语标注的正确率约为92%,处理效果还是比较令人满意的。
展开更多
关键词
自动划分
标注
语料库加工
汉语
分析器
汉语短语
在线阅读
下载PDF
职称材料
《面向中文信息处理的现代汉语短语结构规则研究》序
被引量:
4
2
作者
陆俭明
《汉语学习》
2000年第5期70-72,共3页
关键词
《面向中文信息处理的现代
汉语短语
结构规则研究》
中文信息处理
机器翻译系统
句处理
汉语
学习
在线阅读
下载PDF
职称材料
论聚合短语的性质及汉语短语的分类
3
作者
季永兴
熊文华
《湖北大学学报(哲学社会科学版)》
1993年第3期85-90,共6页
本文拟将现代汉语短语划分为聚合短语、组合短语和粘附短语三大类。为了说明这种分类的合理性和可行性,我们将从不同角度来着重探讨聚合短语的性质及与其它短语的区别性特征。 1.1 根据乔姆斯基的转换生成语法的理论进行考察,聚合短语...
本文拟将现代汉语短语划分为聚合短语、组合短语和粘附短语三大类。为了说明这种分类的合理性和可行性,我们将从不同角度来着重探讨聚合短语的性质及与其它短语的区别性特征。 1.1 根据乔姆斯基的转换生成语法的理论进行考察,聚合短语大多是语句重合而形成的。请看语例: (1)李明和郭进回来了又走了。 象这样一个表层句,逆推到深层句,它实质上是由四个语句重合而成的。
展开更多
关键词
汉语短语
向心结构
整体功能
离心结构
语句
直接成分
聚合关系
组合关系
李明
布龙菲尔德
在线阅读
下载PDF
职称材料
基于神经元网络的汉语短语边界识别
被引量:
6
4
作者
奚晨海
孙茂松
《中文信息学报》
CSCD
北大核心
2002年第2期20-26,共7页
短语边界的识别是浅层句法分析或组块分析的基础 ,对真实文本的处理具有重要意义。在一个含有 6 442 6词的汉语树库的支持下 ,本文设计并实现了基于神经元网络的汉语短语边界自动识别模型。初步实验结果显示 ,该模型的界定准确率为 93 2...
短语边界的识别是浅层句法分析或组块分析的基础 ,对真实文本的处理具有重要意义。在一个含有 6 442 6词的汉语树库的支持下 ,本文设计并实现了基于神经元网络的汉语短语边界自动识别模型。初步实验结果显示 ,该模型的界定准确率为 93 2 4 % (封闭测试 )和 92 5 6 % (开放测试 )。
展开更多
关键词
汉语短语
边界自动识别
神经元网络
中文信息处理
浅层句法分析
组块分析
文字识别
在线阅读
下载PDF
职称材料
一个汉语短语自动界定模型
被引量:
9
5
作者
周强
《软件学报》
EI
CSCD
北大核心
1996年第A00期315-322,共8页
本文提出了一个汉语短语自动界定模型,它通过基于统计的自动界定处理,利用通过错误驱动自动学习而得到的调整规则界定情况局部调整,利用人工总结的全局调整规则进行精调整等3个处理阶段,可以较邹地确定一句经过正确切分和词性注处...
本文提出了一个汉语短语自动界定模型,它通过基于统计的自动界定处理,利用通过错误驱动自动学习而得到的调整规则界定情况局部调整,利用人工总结的全局调整规则进行精调整等3个处理阶段,可以较邹地确定一句经过正确切分和词性注处理的汉语句子中不同短语的边界位置,从而为时一步的汉语短语自动划分和标注处理打下了良好的基础,对1000多句句子的实验结果表明,模型的界定正确率达到了96.33%(封闭测试)、94.
展开更多
关键词
汉语短语
界定模型
短语
划分
语料库
汉语
处理
在线阅读
下载PDF
职称材料
基于动词的汉语复合名词短语释义研究
被引量:
9
6
作者
王萌
黄居仁
+1 位作者
俞士汶
李斌
《中文信息学报》
CSCD
北大核心
2010年第6期3-9,共7页
复合名词短语的语义解释的主要目的是恢复修饰语和中心词之间隐含的语义关系。该文针对汉语复合名词短语的语义解释,首次采用动态的策略,提出了"基于动词的短语释义"的方法,利用语料库及Web数据,自动获取复合名词短语的释义短...
复合名词短语的语义解释的主要目的是恢复修饰语和中心词之间隐含的语义关系。该文针对汉语复合名词短语的语义解释,首次采用动态的策略,提出了"基于动词的短语释义"的方法,利用语料库及Web数据,自动获取复合名词短语的释义短语,实验结果表明,该方法不仅可以为复合名词短语提供多种可能的语义解释,而且能够反应相似的复合名词短语之间细微的语义差别。此外,该文的研究结果可以服务于问答系统、信息检索、词典编纂等多个应用领域。
展开更多
关键词
汉语
复合名词
短语
语义解释
释义
短语
释义动词
在线阅读
下载PDF
职称材料
基于HMM的汉语介词短语自动识别研究
被引量:
9
7
作者
奚建清
罗强
《计算机工程》
CAS
CSCD
北大核心
2007年第3期172-173,182,共3页
提出了一种基于隐马尔可夫模型(HMM)的介词短语界定模型,通过HMM的介词短语边界自动识别和依存语法错误校正2个处理阶段,较好地完成了对一个经过分词和词性标注的句子进行介词短语界定任务,为更进一步的句法分析工作打下良好的基础。试...
提出了一种基于隐马尔可夫模型(HMM)的介词短语界定模型,通过HMM的介词短语边界自动识别和依存语法错误校正2个处理阶段,较好地完成了对一个经过分词和词性标注的句子进行介词短语界定任务,为更进一步的句法分析工作打下良好的基础。试验结果显示:该模型的识别正确率达到了86.5%(封闭测试)和77.7%(开放测试),取得了令人满意的结果。
展开更多
关键词
汉语
介词
短语
自动识别
依存语法
在线阅读
下载PDF
职称材料
结合句法组成模板识别汉语基本名词短语的概率模型
被引量:
11
8
作者
赵军
黄昌宁
《计算机研究与发展》
EI
CSCD
北大核心
1999年第11期1384-1390,共7页
文中首先给出了汉语基本名词短语(baseNP)的形式化定义,并通过抽取baseNP句法组成模板,显示了这个定义的可操作性.文中指出,句法组成模板只是识别baseNP的必要条件,而非充要条件,仅靠句法组成模板并不能解决...
文中首先给出了汉语基本名词短语(baseNP)的形式化定义,并通过抽取baseNP句法组成模板,显示了这个定义的可操作性.文中指出,句法组成模板只是识别baseNP的必要条件,而非充要条件,仅靠句法组成模板并不能解决baseNP识别中的边界模糊歧义和短语类型歧义问题.据此,把体现baseNP内部组成的句法组成模板与体现上下文约束条件的N 元模型结合起来,形成了汉语baseNP识别的新模型.实验证明,该模型的性能优于单纯基于词性标记的N
展开更多
关键词
自然语言处理
语料库
模板识别
汉语
名词
短语
在线阅读
下载PDF
职称材料
基于区分词的汉语隐喻短语识别
被引量:
2
9
作者
符建辉
曹存根
王石
《计算机科学》
CSCD
北大核心
2010年第10期193-196,232,共5页
隐喻识别是自然语言处理的一个重要研究分支。目前人们越来越清楚地认识到隐喻在思维及语言中所处的中心地位。从计算语言学和自然语言处理的角度来考虑,隐喻问题若不能得到很好的处理,语言理解和机器翻译的效果都会受到影响。通过观察...
隐喻识别是自然语言处理的一个重要研究分支。目前人们越来越清楚地认识到隐喻在思维及语言中所处的中心地位。从计算语言学和自然语言处理的角度来考虑,隐喻问题若不能得到很好的处理,语言理解和机器翻译的效果都会受到影响。通过观察隐喻短语和非隐喻短语在汉语中的上下文发现,有一批词可用于有效地识别隐喻短语,称之为区分词。首先从Web中自动抽取了一部分区分词,进而提出了一种基于区分词的隐喻短语识别方法。实验表明基于区分词的识别方法是有效的。
展开更多
关键词
隐喻识别
汉语
隐喻
短语
自然语言理解
在线阅读
下载PDF
职称材料
基于扩张矩阵理论的汉语韵律短语分析
被引量:
2
10
作者
谌卫军
林福宗
+1 位作者
李建民
张钹
《计算机学报》
EI
CSCD
北大核心
2003年第1期26-31,共6页
提出了一种新的、基于扩张矩阵理论的归纳学习算法 :分组覆盖算法 ,并将其应用于汉语文语转换系统中的韵律短语分析问题 .算法以扩张矩阵为基础 ,在反例样本集背景下 ,将正例样本集划分为若干个一致的组 ,每一组对应于一个一致的规则 ,...
提出了一种新的、基于扩张矩阵理论的归纳学习算法 :分组覆盖算法 ,并将其应用于汉语文语转换系统中的韵律短语分析问题 .算法以扩张矩阵为基础 ,在反例样本集背景下 ,将正例样本集划分为若干个一致的组 ,每一组对应于一个一致的规则 ,它覆盖了这组正例而且不覆盖任何的反例 ;建造了一个用于韵律短语分析的语料库 ,并提出了一组与韵律有关的特征 ;将数据分为训练集和测试集对算法进行了验证 .实验结果表明 ,新算法在正确率、规则个数和可懂性等各方面均优于传统的决策树方法 ,并接近于手工制定的规则 .
展开更多
关键词
扩张矩阵理论
汉语
韵律
短语
分析
汉字信息处理
归纳学习算法
汉语
文语转换系统
在线阅读
下载PDF
职称材料
齐普夫定律在中文短语知识中的呈现
被引量:
5
11
作者
谢靖
陈静
王东波
《情报学报》
CSSCI
北大核心
2014年第1期11-22,共12页
本文对大规模汉语短语树库中的短语直接成分进行了抽取,在统计各短语结构直接成分频次的基础上排序,并进行短语成分的齐普夫定律验证。实验由局部及整体两部分组成:在局部实验中,对单一短语直接成分进行齐普夫定律验证;在整体实验...
本文对大规模汉语短语树库中的短语直接成分进行了抽取,在统计各短语结构直接成分频次的基础上排序,并进行短语成分的齐普夫定律验证。实验由局部及整体两部分组成:在局部实验中,对单一短语直接成分进行齐普夫定律验证;在整体实验中,对全部短语直接成分进行齐普夫定律验证。实验结果表明,在汉语短语树库中,短语的直接成分分布符合齐普夫定律。这个现象表明,从计量角度而言,汉语短语具有其内核知识,并以内核为基础在最省力原则下对不同语境进行派生,这种派生首先要围绕语法内核知识进行构建,同时又要根据不同语境进行拓展。本研究一方面实现了面向短语层次的语法知识抽取,从计量角度揭示了汉语短语构成的分布规律;另一方面对于中文信息处理中的短语识别、自动句法分析等研究提供短语基础知识支持,这些知识最终可应用于术语短语识别、自动标引、知识抽取、语义分析等研究。
展开更多
关键词
齐普夫定律
汉语短语
构建
直接成分分析
汉语短语
知识
汉语
树库
最省力法则
在线阅读
下载PDF
职称材料
汉语基本复合名词短语语义关系知识库构建与识别
被引量:
2
12
作者
张文敏
李华勇
邵艳秋
《中文信息学报》
CSCD
北大核心
2019年第12期28-36,共9页
汉语复合名词短语因其使用范围广泛、结构独特、内部语义复杂的特点,一直是语言学分析和中文信息处理领域的重要研究对象。国内关于复合名词短语的语言资源极其匮乏,且现有知识库只研究名名复合形式的短语,包含动词的复合名词短语的知...
汉语复合名词短语因其使用范围广泛、结构独特、内部语义复杂的特点,一直是语言学分析和中文信息处理领域的重要研究对象。国内关于复合名词短语的语言资源极其匮乏,且现有知识库只研究名名复合形式的短语,包含动词的复合名词短语的知识库构建仍处于空白阶段,同时现有的复合名词短语知识库大部分脱离了语境,没有句子级别的信息。针对这一现状,该文从多个领域搜集语料,建立了一套新的语义关系体系,标注构建了一个具有相当规模的带有句子信息的基本复合名词语义关系知识库。该库的标注重点是标注句子中基本复合名词短语的边界以及短语内部成分之间的语义关系,总共收录27007条句子。该文对标注后的知识库做了详细的计量统计分析。最后基于标注得到的知识库,使用基线模型对基本复合名词短语进行了自动定界和语义分类实验,并对实验结果和未来可能的改进方向做了总结分析。
展开更多
关键词
汉语
基本复合名词
短语
语义关系体系
定界识别
在线阅读
下载PDF
职称材料
基于HMM和Monte-Carlo方法的生成基频曲线的新方法
13
作者
黄荣青
朱东来
王仁华
《计算机工程与应用》
CSCD
北大核心
2002年第21期103-105,共3页
提出了一种基于隐马尔科夫模型(HMM)的汉语韵律短语的统计基频模型,并尝试使用蒙特卡罗方法(Monte-Carlo)从模型生成基频曲线。该模型使用HMM作为基本框架,具有HMM理论体系所能支配的各种优点。并将韵律词作为模型单元,使得模型能够反...
提出了一种基于隐马尔科夫模型(HMM)的汉语韵律短语的统计基频模型,并尝试使用蒙特卡罗方法(Monte-Carlo)从模型生成基频曲线。该模型使用HMM作为基本框架,具有HMM理论体系所能支配的各种优点。并将韵律词作为模型单元,使得模型能够反映韵律层次级的连续变调。Monte-Carlo方法能生成相对模型最优的基频曲线,并保证生成的基频曲线具有足够的精确度。该文最后给出了实验结果并对模型的应用前景进行了展望。
展开更多
关键词
HMM
MONTE-CARLO方法
语音合成
隐马尔科夫模型
蒙特卡罗方法
汉语
韵律
短语
基频模型
在线阅读
下载PDF
职称材料
题名
汉语短语的自动划分和标注
被引量:
21
1
作者
周强
机构
北京大学计算语言学研究所
出处
《中文信息学报》
CSCD
北大核心
1997年第1期1-10,共10页
基金
国家自然科学基金
文摘
考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成等三个处理阶段,其间利用了从人工标注的树库中统计得到的各种数据进行自动句法排歧,最终得到一棵最佳句法分析树,从而可以自顶向下地完成对一句句子的短语自动划分和标注,对一千多句句子的封闭测试结果表明,短语划分的正确率约为86%,短语标注的正确率约为92%,处理效果还是比较令人满意的。
关键词
自动划分
标注
语料库加工
汉语
分析器
汉语短语
Keywords
:phrase bracketing and tagging tagging,corpus annotion.
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
《面向中文信息处理的现代汉语短语结构规则研究》序
被引量:
4
2
作者
陆俭明
机构
北京大学中文系
出处
《汉语学习》
2000年第5期70-72,共3页
关键词
《面向中文信息处理的现代
汉语短语
结构规则研究》
中文信息处理
机器翻译系统
句处理
汉语
学习
分类号
G256.4 [文化科学—图书馆学]
H085 [语言文字—语言学]
在线阅读
下载PDF
职称材料
题名
论聚合短语的性质及汉语短语的分类
3
作者
季永兴
熊文华
机构
广西师范大学中文系
出处
《湖北大学学报(哲学社会科学版)》
1993年第3期85-90,共6页
文摘
本文拟将现代汉语短语划分为聚合短语、组合短语和粘附短语三大类。为了说明这种分类的合理性和可行性,我们将从不同角度来着重探讨聚合短语的性质及与其它短语的区别性特征。 1.1 根据乔姆斯基的转换生成语法的理论进行考察,聚合短语大多是语句重合而形成的。请看语例: (1)李明和郭进回来了又走了。 象这样一个表层句,逆推到深层句,它实质上是由四个语句重合而成的。
关键词
汉语短语
向心结构
整体功能
离心结构
语句
直接成分
聚合关系
组合关系
李明
布龙菲尔德
分类号
C55 [社会学]
在线阅读
下载PDF
职称材料
题名
基于神经元网络的汉语短语边界识别
被引量:
6
4
作者
奚晨海
孙茂松
机构
清华大学智能技术与系统国家重点实验室
出处
《中文信息学报》
CSCD
北大核心
2002年第2期20-26,共7页
基金
国家重点基础研究发展规划项目的支持 (编号 :G19980 30 5 0 7)
文摘
短语边界的识别是浅层句法分析或组块分析的基础 ,对真实文本的处理具有重要意义。在一个含有 6 442 6词的汉语树库的支持下 ,本文设计并实现了基于神经元网络的汉语短语边界自动识别模型。初步实验结果显示 ,该模型的界定准确率为 93 2 4 % (封闭测试 )和 92 5 6 % (开放测试 )。
关键词
汉语短语
边界自动识别
神经元网络
中文信息处理
浅层句法分析
组块分析
文字识别
Keywords
automatic prediction of Chinese phrase boundary location
neural network
Chinese information processing
分类号
TP391.43 [自动化与计算机技术—计算机应用技术]
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
一个汉语短语自动界定模型
被引量:
9
5
作者
周强
出处
《软件学报》
EI
CSCD
北大核心
1996年第A00期315-322,共8页
文摘
本文提出了一个汉语短语自动界定模型,它通过基于统计的自动界定处理,利用通过错误驱动自动学习而得到的调整规则界定情况局部调整,利用人工总结的全局调整规则进行精调整等3个处理阶段,可以较邹地确定一句经过正确切分和词性注处理的汉语句子中不同短语的边界位置,从而为时一步的汉语短语自动划分和标注处理打下了良好的基础,对1000多句句子的实验结果表明,模型的界定正确率达到了96.33%(封闭测试)、94.
关键词
汉语短语
界定模型
短语
划分
语料库
汉语
处理
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于动词的汉语复合名词短语释义研究
被引量:
9
6
作者
王萌
黄居仁
俞士汶
李斌
机构
北京大学计算语言学教育部重点实验室
香港理工大学中文及双语学系
南京师范大学文学院
出处
《中文信息学报》
CSCD
北大核心
2010年第6期3-9,共7页
基金
国家973计划资助项目(2004CB318102)
国家社科基金资助项目(07BYY050)
文摘
复合名词短语的语义解释的主要目的是恢复修饰语和中心词之间隐含的语义关系。该文针对汉语复合名词短语的语义解释,首次采用动态的策略,提出了"基于动词的短语释义"的方法,利用语料库及Web数据,自动获取复合名词短语的释义短语,实验结果表明,该方法不仅可以为复合名词短语提供多种可能的语义解释,而且能够反应相似的复合名词短语之间细微的语义差别。此外,该文的研究结果可以服务于问答系统、信息检索、词典编纂等多个应用领域。
关键词
汉语
复合名词
短语
语义解释
释义
短语
释义动词
Keywords
Chinese noun compounds
interpretation
paraphrase
paraphrasing verbs
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于HMM的汉语介词短语自动识别研究
被引量:
9
7
作者
奚建清
罗强
机构
华南理工大学计算机学院
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第3期172-173,182,共3页
基金
国家"十五"科技攻关计划基金资助重点项目(A3480266)
广东省自然科学基金资助项目(B6480598)
文摘
提出了一种基于隐马尔可夫模型(HMM)的介词短语界定模型,通过HMM的介词短语边界自动识别和依存语法错误校正2个处理阶段,较好地完成了对一个经过分词和词性标注的句子进行介词短语界定任务,为更进一步的句法分析工作打下良好的基础。试验结果显示:该模型的识别正确率达到了86.5%(封闭测试)和77.7%(开放测试),取得了令人满意的结果。
关键词
汉语
介词
短语
自动识别
依存语法
Keywords
Chinese prepositional phrase
Automatic identification
Dependence grammar
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
结合句法组成模板识别汉语基本名词短语的概率模型
被引量:
11
8
作者
赵军
黄昌宁
机构
清华大学计算机科学与技术系
清华大学智能技术与系统国家实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
1999年第11期1384-1390,共7页
基金
国家自然科学基金
文摘
文中首先给出了汉语基本名词短语(baseNP)的形式化定义,并通过抽取baseNP句法组成模板,显示了这个定义的可操作性.文中指出,句法组成模板只是识别baseNP的必要条件,而非充要条件,仅靠句法组成模板并不能解决baseNP识别中的边界模糊歧义和短语类型歧义问题.据此,把体现baseNP内部组成的句法组成模板与体现上下文约束条件的N 元模型结合起来,形成了汉语baseNP识别的新模型.实验证明,该模型的性能优于单纯基于词性标记的N
关键词
自然语言处理
语料库
模板识别
汉语
名词
短语
Keywords
natural language processing, corpus, baseNP
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于区分词的汉语隐喻短语识别
被引量:
2
9
作者
符建辉
曹存根
王石
机构
首都师范大学计算机科学联合研究院
中国科学院计算技术研究所智能信息处理重点实验室
中国科学院研究生院
出处
《计算机科学》
CSCD
北大核心
2010年第10期193-196,232,共5页
文摘
隐喻识别是自然语言处理的一个重要研究分支。目前人们越来越清楚地认识到隐喻在思维及语言中所处的中心地位。从计算语言学和自然语言处理的角度来考虑,隐喻问题若不能得到很好的处理,语言理解和机器翻译的效果都会受到影响。通过观察隐喻短语和非隐喻短语在汉语中的上下文发现,有一批词可用于有效地识别隐喻短语,称之为区分词。首先从Web中自动抽取了一部分区分词,进而提出了一种基于区分词的隐喻短语识别方法。实验表明基于区分词的识别方法是有效的。
关键词
隐喻识别
汉语
隐喻
短语
自然语言理解
Keywords
Metaphor recognition
Chinese metaphorical phrase
Natural language understanding
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于扩张矩阵理论的汉语韵律短语分析
被引量:
2
10
作者
谌卫军
林福宗
李建民
张钹
机构
清华大学计算机科学与技术系
清华大学智能技术与系统国家重点实验室
出处
《计算机学报》
EI
CSCD
北大核心
2003年第1期26-31,共6页
基金
国家自然科学基金重点项目 ( 60 13 5 0 10 )
国家"九七三"重点基础研究发展规划项目 (G19980 3 0 5 0 9)资助
文摘
提出了一种新的、基于扩张矩阵理论的归纳学习算法 :分组覆盖算法 ,并将其应用于汉语文语转换系统中的韵律短语分析问题 .算法以扩张矩阵为基础 ,在反例样本集背景下 ,将正例样本集划分为若干个一致的组 ,每一组对应于一个一致的规则 ,它覆盖了这组正例而且不覆盖任何的反例 ;建造了一个用于韵律短语分析的语料库 ,并提出了一组与韵律有关的特征 ;将数据分为训练集和测试集对算法进行了验证 .实验结果表明 ,新算法在正确率、规则个数和可懂性等各方面均优于传统的决策树方法 ,并接近于手工制定的规则 .
关键词
扩张矩阵理论
汉语
韵律
短语
分析
汉字信息处理
归纳学习算法
汉语
文语转换系统
Keywords
Knowledge based systems
Learning algorithms
Learning systems
Linguistics
Matrix algebra
Speech processing
Text processing
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
齐普夫定律在中文短语知识中的呈现
被引量:
5
11
作者
谢靖
陈静
王东波
机构
南京中医药大学经贸管理学院信息管理系
南京大学信息管理学院
南京医科大学图书馆
南京农业大学信息科学技术学院
出处
《情报学报》
CSSCI
北大核心
2014年第1期11-22,共12页
基金
国家自然基金项目“面向知识服务的知识组织模式与应用研究”(项目编号:71273126)
高技术研究发展计划(863计划)“以科技文献服务为主的搜索引擎研制”(项目编号:2011AA01A206)
南京医科大学科技发展基金“基于知识图谱的2002~2012年南京医科大学论文分析”(项目编号:2012NJMU036)
文摘
本文对大规模汉语短语树库中的短语直接成分进行了抽取,在统计各短语结构直接成分频次的基础上排序,并进行短语成分的齐普夫定律验证。实验由局部及整体两部分组成:在局部实验中,对单一短语直接成分进行齐普夫定律验证;在整体实验中,对全部短语直接成分进行齐普夫定律验证。实验结果表明,在汉语短语树库中,短语的直接成分分布符合齐普夫定律。这个现象表明,从计量角度而言,汉语短语具有其内核知识,并以内核为基础在最省力原则下对不同语境进行派生,这种派生首先要围绕语法内核知识进行构建,同时又要根据不同语境进行拓展。本研究一方面实现了面向短语层次的语法知识抽取,从计量角度揭示了汉语短语构成的分布规律;另一方面对于中文信息处理中的短语识别、自动句法分析等研究提供短语基础知识支持,这些知识最终可应用于术语短语识别、自动标引、知识抽取、语义分析等研究。
关键词
齐普夫定律
汉语短语
构建
直接成分分析
汉语短语
知识
汉语
树库
最省力法则
Keywords
zipf's Law, Chinese phrase's construction,immediate constituents analysis,knowledge of Chinese phrases,Chinese treebanks, least effort
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
H146 [语言文字—汉语]
在线阅读
下载PDF
职称材料
题名
汉语基本复合名词短语语义关系知识库构建与识别
被引量:
2
12
作者
张文敏
李华勇
邵艳秋
机构
北京语言大学信息科学学院
出处
《中文信息学报》
CSCD
北大核心
2019年第12期28-36,共9页
基金
国家自然科学基金(61872402)
教育部人文社科规划基金(17YJAZH068)
北京语言大学校级项目(中央高校基本科研业务费专项资金)(18ZDJ03)
文摘
汉语复合名词短语因其使用范围广泛、结构独特、内部语义复杂的特点,一直是语言学分析和中文信息处理领域的重要研究对象。国内关于复合名词短语的语言资源极其匮乏,且现有知识库只研究名名复合形式的短语,包含动词的复合名词短语的知识库构建仍处于空白阶段,同时现有的复合名词短语知识库大部分脱离了语境,没有句子级别的信息。针对这一现状,该文从多个领域搜集语料,建立了一套新的语义关系体系,标注构建了一个具有相当规模的带有句子信息的基本复合名词语义关系知识库。该库的标注重点是标注句子中基本复合名词短语的边界以及短语内部成分之间的语义关系,总共收录27007条句子。该文对标注后的知识库做了详细的计量统计分析。最后基于标注得到的知识库,使用基线模型对基本复合名词短语进行了自动定界和语义分类实验,并对实验结果和未来可能的改进方向做了总结分析。
关键词
汉语
基本复合名词
短语
语义关系体系
定界识别
Keywords
Chinese basic compound noun phrases
semantic relational system
delimitation recognition
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于HMM和Monte-Carlo方法的生成基频曲线的新方法
13
作者
黄荣青
朱东来
王仁华
机构
中国科技大学电子工程与信息科学系
出处
《计算机工程与应用》
CSCD
北大核心
2002年第21期103-105,共3页
文摘
提出了一种基于隐马尔科夫模型(HMM)的汉语韵律短语的统计基频模型,并尝试使用蒙特卡罗方法(Monte-Carlo)从模型生成基频曲线。该模型使用HMM作为基本框架,具有HMM理论体系所能支配的各种优点。并将韵律词作为模型单元,使得模型能够反映韵律层次级的连续变调。Monte-Carlo方法能生成相对模型最优的基频曲线,并保证生成的基频曲线具有足够的精确度。该文最后给出了实验结果并对模型的应用前景进行了展望。
关键词
HMM
MONTE-CARLO方法
语音合成
隐马尔科夫模型
蒙特卡罗方法
汉语
韵律
短语
基频模型
Keywords
HMM,Monte-Carlo method,Mandarin-prosodic-word pitch model,Pitch contour
分类号
TN912.33 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
汉语短语的自动划分和标注
周强
《中文信息学报》
CSCD
北大核心
1997
21
在线阅读
下载PDF
职称材料
2
《面向中文信息处理的现代汉语短语结构规则研究》序
陆俭明
《汉语学习》
2000
4
在线阅读
下载PDF
职称材料
3
论聚合短语的性质及汉语短语的分类
季永兴
熊文华
《湖北大学学报(哲学社会科学版)》
1993
0
在线阅读
下载PDF
职称材料
4
基于神经元网络的汉语短语边界识别
奚晨海
孙茂松
《中文信息学报》
CSCD
北大核心
2002
6
在线阅读
下载PDF
职称材料
5
一个汉语短语自动界定模型
周强
《软件学报》
EI
CSCD
北大核心
1996
9
在线阅读
下载PDF
职称材料
6
基于动词的汉语复合名词短语释义研究
王萌
黄居仁
俞士汶
李斌
《中文信息学报》
CSCD
北大核心
2010
9
在线阅读
下载PDF
职称材料
7
基于HMM的汉语介词短语自动识别研究
奚建清
罗强
《计算机工程》
CAS
CSCD
北大核心
2007
9
在线阅读
下载PDF
职称材料
8
结合句法组成模板识别汉语基本名词短语的概率模型
赵军
黄昌宁
《计算机研究与发展》
EI
CSCD
北大核心
1999
11
在线阅读
下载PDF
职称材料
9
基于区分词的汉语隐喻短语识别
符建辉
曹存根
王石
《计算机科学》
CSCD
北大核心
2010
2
在线阅读
下载PDF
职称材料
10
基于扩张矩阵理论的汉语韵律短语分析
谌卫军
林福宗
李建民
张钹
《计算机学报》
EI
CSCD
北大核心
2003
2
在线阅读
下载PDF
职称材料
11
齐普夫定律在中文短语知识中的呈现
谢靖
陈静
王东波
《情报学报》
CSSCI
北大核心
2014
5
在线阅读
下载PDF
职称材料
12
汉语基本复合名词短语语义关系知识库构建与识别
张文敏
李华勇
邵艳秋
《中文信息学报》
CSCD
北大核心
2019
2
在线阅读
下载PDF
职称材料
13
基于HMM和Monte-Carlo方法的生成基频曲线的新方法
黄荣青
朱东来
王仁华
《计算机工程与应用》
CSCD
北大核心
2002
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部