期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
融合语言知识的统计句法分析 被引量:5
1
作者 袁里驰 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第3期986-991,共6页
利用语义、语法等语言知识,建立一种分层句法分析统计模型,并进行句法分析实验。研究结果表明:该模型具有规则和统计相结合的特点,且在层次分析的不同阶段,根据不同的语法、语义、语用特性采用不同的方法和不同的统计模型;该模型结合分... 利用语义、语法等语言知识,建立一种分层句法分析统计模型,并进行句法分析实验。研究结果表明:该模型具有规则和统计相结合的特点,且在层次分析的不同阶段,根据不同的语法、语义、语用特性采用不同的方法和不同的统计模型;该模型结合分词、词性标注进行句法分析,是一个词汇化的句法分析模型,可同时考虑多个语义依存关系;采用该模型,精确率和召回率分别为87.23%和86.15%,其综合指标F与头驱动句法分析模型的相比提高了5.25%。 展开更多
关键词 自然语言处理 词聚类 中心词驱动 句法分析统计模型
在线阅读 下载PDF
基于依存关系的句法分析统计模型 被引量:13
2
作者 袁里驰 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第6期1630-1635,共6页
利用语义、语法等语言知识,建立一种基于依存关系的句法分析统计模型,并利用改进的句法分析模型进行句法分析实验。研究结果表明:利用依存关系、互信息对词聚类,能解决模型数据稀疏问题;模型可同时考虑几种语义依存关系;该模型是一个词... 利用语义、语法等语言知识,建立一种基于依存关系的句法分析统计模型,并利用改进的句法分析模型进行句法分析实验。研究结果表明:利用依存关系、互信息对词聚类,能解决模型数据稀疏问题;模型可同时考虑几种语义依存关系;该模型是一个词汇化的句法分析模型,能结合分词、词性标注进行句法分析;概率上下文无关语法中由概率的上下文无关性假设和祖先结点无关性假设引起的问题在该模型中得到有效解决;精确率和召回率分别为86.96%和85.25%,其综合指标F与Collins的头驱动句法分析模型的F相比提高4.75%。 展开更多
关键词 自然语言处理 词聚类 中心词驱动 句法分析统计模型
在线阅读 下载PDF
基于改进的隐马尔科夫模型的词性标注方法 被引量:16
3
作者 袁里驰 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第8期3053-3057,共5页
针对隐马尔可夫(HMM)词性标注模型状态输出独立同分布等与语言实际特性不够协调的假设,对隐马尔可夫模型进行改进,引入马尔可夫族模型。,该模型用条件独立性假设取代HMM模型的独立性假设。将马尔可夫族模型应用于词性标注,并结合句法分... 针对隐马尔可夫(HMM)词性标注模型状态输出独立同分布等与语言实际特性不够协调的假设,对隐马尔可夫模型进行改进,引入马尔可夫族模型。,该模型用条件独立性假设取代HMM模型的独立性假设。将马尔可夫族模型应用于词性标注,并结合句法分析进行词性标注。用改进的隐马尔可夫模型进行词性标注实验。实验结果表明:与条件独立性假设相比,独立性假设是过强假设,因而基于马尔可夫族模型的语言模型更符合语言等实际物理过程;在相同的测试条件下,马尔可夫族模型明显好于隐马尔可夫模型,词性标注准确率从94.642%提高到97.126%。 展开更多
关键词 隐马尔可夫模型 马尔可夫族模型 词性标注 VITERBI算法
在线阅读 下载PDF
基于相似度的词聚类算法和可变长语言模型 被引量:7
4
作者 袁里驰 《小型微型计算机系统》 CSCD 北大核心 2009年第5期912-915,共4页
基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法.传统的统计聚类方法基于含婪原则,常以语料的似然函数或困惑度(perplexity)作为评价标准.这种传统的聚类方法的主要缺点是聚类速度慢,初值对结果影响大,易陷入局部最优.本文... 基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法.传统的统计聚类方法基于含婪原则,常以语料的似然函数或困惑度(perplexity)作为评价标准.这种传统的聚类方法的主要缺点是聚类速度慢,初值对结果影响大,易陷入局部最优.本文利用互信息定义一种词相似度,基于相似度,提出一种自下而上的分层聚类算法.实验证明,该算法在计算复杂度和聚类效果上比传统的基于贪婪原则的统计聚类算法都有明显的改进.在提高预测能力方面,提出一种新的基于类的可变长语言模型(Vari-gram)的生成方法. 展开更多
关键词 互信息 词相似度 聚类算法 可变长语言模型
在线阅读 下载PDF
中心词驱动句法分析中的平滑技术 被引量:1
5
作者 袁里驰 《电子学报》 EI CAS CSCD 北大核心 2013年第7期1337-1342,共6页
解决数据稀疏问题是中心词驱动句法分析中的一个重要问题,基于词类的统计语言模型是解决统计模型数据稀疏问题的重要方法.本文在分析经典平滑算法的基础上,提出一种基于语义依存信息和互信息的词聚类算法,并利用绝对权重差分方法构造了... 解决数据稀疏问题是中心词驱动句法分析中的一个重要问题,基于词类的统计语言模型是解决统计模型数据稀疏问题的重要方法.本文在分析经典平滑算法的基础上,提出一种基于语义依存信息和互信息的词聚类算法,并利用绝对权重差分方法构造了一种可变长语言模型,即根据历史词对当前词预测所作的贡献不同,n值的大小也随之变化.进而提出了一种基于语义类和可变长模型的中心词驱动句法分析改进模型,既增强了句法分析模型的消歧能力,又解决了严重的数据稀疏问题.改进模型性能有了明显的提高,精确率和召回率分别为84.53%和82.41%,综合指标F值比Collins的中心词驱动句法分析模型提高了2.02个百分点. 展开更多
关键词 句法分析模型 平滑算法 中心词驱动句法分析 聚类算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部