-
题名汉语最长名词短语的自动识别
被引量:37
- 1
-
-
作者
周强
孙茂松
黄昌宁
-
机构
智能技术与系统国家重点实验室
清华大学计算机科学与技术系
-
出处
《软件学报》
EI
CSCD
北大核心
2000年第2期195-201,共7页
-
基金
国家自然科学基金! (No.6 970 5 0 0 5 )
中国博士后科学基金! (No.970 0 5 )资助
-
文摘
通过对包含 5573个汉语句子的语料文本中的最长名词短语的分布特点的统计分析 ,提出了两种有效的汉语最长名词短语自动识别算法 :基于边界分布概率的识别算法和基于内部结构组合的识别算法 .实验结果显示 ,后者的识别正确率和召回率分别达到了 85.4 %和 82 .3% ,取得了较好的自动识别效果 .关键词 最长名词短语 ,边界识别 ,句法分析 .
-
关键词
最长名词短语
自然语言处理
汉语
自动识别
-
Keywords
Maximal noun phrase, boundary identification, syntax parsing.
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于HMM的汉语介词短语自动识别研究
被引量:9
- 2
-
-
作者
奚建清
罗强
-
机构
华南理工大学计算机学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第3期172-173,182,共3页
-
基金
国家"十五"科技攻关计划基金资助重点项目(A3480266)
广东省自然科学基金资助项目(B6480598)
-
文摘
提出了一种基于隐马尔可夫模型(HMM)的介词短语界定模型,通过HMM的介词短语边界自动识别和依存语法错误校正2个处理阶段,较好地完成了对一个经过分词和词性标注的句子进行介词短语界定任务,为更进一步的句法分析工作打下良好的基础。试验结果显示:该模型的识别正确率达到了86.5%(封闭测试)和77.7%(开放测试),取得了令人满意的结果。
-
关键词
汉语介词短语
自动识别
依存语法
-
Keywords
Chinese prepositional phrase
Automatic identification
Dependence grammar
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于神经元网络的汉语短语边界识别
被引量:6
- 3
-
-
作者
奚晨海
孙茂松
-
机构
清华大学智能技术与系统国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2002年第2期20-26,共7页
-
基金
国家重点基础研究发展规划项目的支持 (编号 :G19980 30 5 0 7)
-
文摘
短语边界的识别是浅层句法分析或组块分析的基础 ,对真实文本的处理具有重要意义。在一个含有 6 442 6词的汉语树库的支持下 ,本文设计并实现了基于神经元网络的汉语短语边界自动识别模型。初步实验结果显示 ,该模型的界定准确率为 93 2 4 % (封闭测试 )和 92 5 6 % (开放测试 )。
-
关键词
汉语短语边界自动识别
神经元网络
中文信息处理
浅层句法分析
组块分析
文字识别
-
Keywords
automatic prediction of Chinese phrase boundary location
neural network
Chinese information processing
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-