汉语基本名词短语结构分析模型被引量：28

THE MODEL FOR CHINESE BASENP STRUCTURE ANALYSIS

在线阅读下载PDF

导出

摘要本文提出了用词语潜在依存关系分析汉语ｂａｓｅＮＰ结构的模型，它有以下的特点：①将依存语法知识融入概率模型中，使得ｂａｓｅＮＰ结构分析在依存语法知识的指导下进行，其性能优于纯粹的概率模型——相邻模型；②词语潜在依存强度的获取算法是基于ＭＤＬ原则的，在模型建造时既考虑数据拟合性，又考虑模型归纳性，其性能优于基于极大似然原则的词语潜在依存强度获取算法；③词语潜在依存强度获取算法在复杂特征集上进行，可以有效地解决参数估计中的数据稀疏问题．实验结果显示，这个模型对于汉语ｂａｓｅＮＰ结构分析是有效的． The paper puts forward a potential dependency relation based model for Chinese baseNP structure analysis, which has the following characteristics: The dependency grammar is integrated into the statistical model so that the baseNP structure can be analyzed under the supervision of dependency grammar. The performance of the model is superior to that of pure statistical model, adjacency model; The proposed acquisition algorithm of potential dependency strength is based on MDL principle, in which both the data fitness and the generality of the model are considered. The performance of the algorithm is superior to that of the traditional ML based algorithm; The acquisition algorithm is implemented on the basis of complex feature set, so that the data sparseness problem is solved successfully. The experiment shows that the proposed model is suitable for Chinese baseNP structure analysis.

作者赵军黄昌宁

机构地区清华大学计算机科学与技术系清华大学智能技术与系统国家重点实验室

出处《计算机学报》 EI CSCD 北大核心 1999年第2期141-146,共6页 Chinese Journal of Computers

基金国家自然科学基金

关键词自然语言处理语料库名词短语结构分析 Natural language processing, corpus, BaseNP.

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1赵　军，博士学位论文，1998年

同被引文献279

1沈家煊.句式和配价[J].中国语文,2000(4):291-297. 被引量：222
2孙茂松.谈谈汉语分词语料库的一致性问题[J].语言文字应用,1999(2):90-93. 被引量：20
3俞士汶.语法知识在语言信息处理研究中的作用[J].语言文字应用,1997(4):82-88. 被引量：17
4黄昌宁.中文信息处理中的分词问题[J].语言文字应用,1997(1):74-80. 被引量：84
5刘开瑛.现代汉语自动分词评测技术研究[J].语言文字应用,1997(1):103-108. 被引量：15
6刘海涛.依存语法和机器翻译[J].语言文字应用,1997(3):91-95. 被引量：44
7孙茂松,邹嘉彦.汉语自动分词研究中的苦干理论问题[J].语言文字应用,1995(4):40-46. 被引量：45
8胡明扬.动名兼类的计量考察[J].语言研究,1995,15(2):91-99. 被引量：26
9林杏光.短语结构语法──“信息处理用语言理论讲话”第一讲[J].语言文字应用,1994(2):58-64. 被引量：2
10朱德熙.句子和主语——印欧语影响现代书面汉语和汉语句法分析的一个实例[J].世界汉语教学,1987,1(3):31-34. 被引量：39

引证文献28

1刘云,俞士汶.“句管控”与中文信息处理[J].汉语学报,2004(2):56-62. 被引量：5
2张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
3奚建清,罗强.基于HMM的汉语介词短语自动识别研究[J].计算机工程,2007,33(3):172-173. 被引量：9
4徐艳华.基于语料库的基本名词短语研究[J].语言文字应用,2008(1):120-125. 被引量：5
5何亮,戴新宇,周俊生,陈家骏.中心词驱动的汉语统计句法分析模型的改进[J].中文信息学报,2008,22(4):3-9. 被引量：3
6袁里驰.基于依存关系的句法分析统计模型[J].中南大学学报（自然科学版）,2009,40(6):1630-1635. 被引量：13
7李双红,李茹,钟立军,郭伟昱.基于多词块的框架元素语义核心词自动识别研究[J].中文信息学报,2010,24(1):30-36. 被引量：4
8袁里驰.基于词聚类的依存句法分析[J].中南大学学报（自然科学版）,2011,42(7):2023-2027. 被引量：10
9袁里驰.基于配价结构的词汇化句法分析模型[J].中南大学学报（自然科学版）,2012,43(5):1808-1813. 被引量：2
10袁里驰.融合语言知识的统计句法分析[J].中南大学学报（自然科学版）,2012,43(3):986-991. 被引量：5

二级引证文献173

1李雯雯.基于依存树库的英汉语主语句法计量特征的对比研究[J].语言研究集刊,2020(1):173-191. 被引量：1
2李永红,汪盈,李腊全,赵志强.一种改进的特征选择算法在邮件过滤中的应用[J].计算机科学,2022,49(S02):740-744. 被引量：5
3徐杰.词组与小句之间的差异及其蕴含的理论意义[J].汉语学报,2005(3):51-64. 被引量：23
4姚双云.小句中枢理论的应用与复句信息工程[J].汉语学报,2005(4):71-79. 被引量：17
5扎西加.上下文无关文法与藏语句法分析[J].西藏大学学报（社会科学版）,2013,28(5):37-42. 被引量：8
6于清,阿里甫.库尔班.微博语料分词及标注方法初探[J].新疆大学学报（自然科学版）,2013,30(1):81-86. 被引量：1
7崔岩.脚本测试技术在列控中心开发测试中的运用[J].铁路通信信号工程技术,2013,10(S1):149-153. 被引量：2
8梁华蓉.英汉、汉英机器翻译探析[J].福建农林大学学报（哲学社会科学版）,2004,7(4):78-81. 被引量：2
9尹一瓴,陈群秀.现代汉语语义知识库用于句法分析的研究[J].计算机应用,2004,24(B12):264-267. 被引量：1
10赵志靖,周静,冯锐,齐丙辰.智能人机交互中自动分词技术的实现[J].扬州大学学报（自然科学版）,2005,8(3):58-61. 被引量：3

1张瑞霞,张蕾.基于知识图的汉语基本名词短语分析模型[J].中文信息学报,2004,18(3):47-53. 被引量：8
2胡乃全,朱巧明,周国栋.混合的汉语基本名词短语识别方法[J].计算机工程,2009,35(20):199-201. 被引量：7
3邱奎宁,刘峰.IFC4结构分析模型应用技术[J].土木建筑工程信息技术,2013,5(3):68-71. 被引量：2
4谷清范,吴介一,张飒兵,李海峰.基于遗传算法的多性能目标网格服务调度算法[J].信息与控制,2005,34(3):279-285. 被引量：4
5雷铁安,吴作伟,杨周妮.径向基网络在结构设计与分析中的应用[J].钢结构,2005,20(2):57-59. 被引量：5
6赵军,黄昌宁.结合句法组成模板识别汉语基本名词短语的概率模型[J].计算机研究与发展,1999,36(11):1384-1390. 被引量：11
7许满英,张永奎.基于HMM的中文BaseNp的识别[J].电脑开发与应用,2008,21(12):39-41.
8赵军,黄昌宁.基于转换的汉语基本名词短语识别模型[J].中文信息学报,1999,13(2):1-7. 被引量：41
9孙瑞娜,刘茜.基于互信息的汉语基本名词短语自动识别[J].信息与电脑（理论版）,2012(11):71-72.
10胡俊贤.浅谈3D Stuido MAX在站库模型建造中的应用[J].中文科技期刊数据库(全文版)工程技术,2016(7):00219-00219.

计算机学报

1999年第2期

浏览历史

内容加载中请稍等...

汉语基本名词短语结构分析模型被引量：28

参考文献1

同被引文献279

引证文献28

二级引证文献173

相关作者

相关机构

相关主题

浏览历史

汉语基本名词短语结构分析模型 被引量：28

参考文献1

同被引文献279

引证文献28

二级引证文献173

相关作者

相关机构

相关主题

浏览历史

汉语基本名词短语结构分析模型被引量：28