期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于依存分析改进贝叶斯模型的词义消歧 被引量:12
1
作者 卢志茂 刘挺 +1 位作者 张刚 李生 《高技术通讯》 EI CAS CSCD 2003年第5期1-7,共7页
词义消歧一直是自然语言处理领域的关键问题和难点之一。目前进行的很多词义消歧研究多采用几个多义词作为实验测试对象,在实际应用方面存在着局限性。本文对大规模真实文本进行了词义消歧研究,采用了基于依存分析改进贝叶斯分类模型的... 词义消歧一直是自然语言处理领域的关键问题和难点之一。目前进行的很多词义消歧研究多采用几个多义词作为实验测试对象,在实际应用方面存在着局限性。本文对大规模真实文本进行了词义消歧研究,采用了基于依存分析改进贝叶斯分类模型的有指导词义消歧方法。该模型充分利用依存句法分析,从句子的内部结构,寻找词语之间支配与被支配的关系,借以确定能够对词语语义构成内在限制的上下文,有效地克服了单纯贝叶斯分类器中无关上下文造成的噪声影响。本实验的开放测试正确率可以达到91.89%,封闭实验正确率可达99.4%,验证了改进模型的有效性。 展开更多
关键词 依存分析 贝叶斯模型 词义消歧 自然语言处理 语料库 统计分析 信息检索 贝叶斯分类器
在线阅读 下载PDF
统计词义消歧的研究进展 被引量:28
2
作者 卢志茂 刘挺 李生 《电子学报》 EI CAS CSCD 北大核心 2006年第2期333-343,共11页
本文参考大量的文献资料,分析了当前国内外统计词义消歧研究中采用的多种方法和技术,指出了统计词义消歧研究的关键问题,并围绕关键问题阐述了统计词义消歧的研究进展,探讨了研究中存在的问题和未来研究的重点.
关键词 统计词义消歧 自然语言处理 综述
在线阅读 下载PDF
神经网络和贝叶斯网络在汉语词义消歧上的对比研究 被引量:9
3
作者 卢志茂 刘挺 +1 位作者 郎君 李生 《高技术通讯》 EI CAS CSCD 2004年第8期15-19,共5页
神经网络和贝叶斯网络是两种经典的机器学习方法。本文通过实验考察了这两种网络模型在汉语词义消歧上的应用效果。实验对象是通过特定规则构造的6个伪词。使用伪词可以避免有指导的词义消歧方法中的数据稀疏问题,充分验证词义分类器... 神经网络和贝叶斯网络是两种经典的机器学习方法。本文通过实验考察了这两种网络模型在汉语词义消歧上的应用效果。实验对象是通过特定规则构造的6个伪词。使用伪词可以避免有指导的词义消歧方法中的数据稀疏问题,充分验证词义分类器的实验效果。贝叶斯网络用于词义分类简单高效,模型容易构造,而神经网络的结构则相对复杂,用于词义消歧需要先解决输入问题。实验中采用词间互信息成功构造了神经网络的输入模型,实验效果较为理想。实验数据表明贝叶斯网络比神经网络更适合解决汉语词义消歧问题。但贝叶斯网络的抗噪声能力却明显逊色于神经网络。 展开更多
关键词 神经网络 贝叶斯网络 汉语 互信息 词义消歧 机器学习
在线阅读 下载PDF
基于依存分析和贝叶斯网络的无指导汉语词义消歧 被引量:3
4
作者 卢志茂 刘挺 +1 位作者 丁江伟 李生 《高技术通讯》 EI CAS CSCD 2004年第2期7-11,共5页
采用基于依存分析改进贝叶斯网络的无指导的机器学习方法对汉语大规模真实文本进行词义消歧实验。该学习算法充分利用依存文法分析确定能够对词语词义构成内在限制的上下文,有效地克服了简单贝叶斯分类器中无关上下文造成的噪声影响。... 采用基于依存分析改进贝叶斯网络的无指导的机器学习方法对汉语大规模真实文本进行词义消歧实验。该学习算法充分利用依存文法分析确定能够对词语词义构成内在限制的上下文,有效地克服了简单贝叶斯分类器中无关上下文造成的噪声影响。实验结果证明基于依存改进的贝叶斯模型在汉语词义消歧上表现良好,开放测试正确率可达86.27%。 展开更多
关键词 词义消歧 自然语言处理 无指导学习算法 依存文法分析 简单贝叶斯网络 汉语
在线阅读 下载PDF
基于可拓学理论的汉语词义消歧 被引量:1
5
作者 卢志茂 刘挺 李生 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2006年第12期2026-2029,2035,共5页
应用可拓学原理,对歧义词进行可拓分解、可拓置换等可拓变换,为歧义词的各个词义建立相应的可拓集合,利用可拓集合中义原词语从大规模语料中自动获取歧义词的语言信息,建立无指导的词义消歧模型.该方法克服了从无词义标注语料中获取词... 应用可拓学原理,对歧义词进行可拓分解、可拓置换等可拓变换,为歧义词的各个词义建立相应的可拓集合,利用可拓集合中义原词语从大规模语料中自动获取歧义词的语言信息,建立无指导的词义消歧模型.该方法克服了从无词义标注语料中获取词义消歧知识的难题.实验证明,该方法用于汉语的词义消歧切实可行,平均正确率达到90.16%. 展开更多
关键词 词义消歧 可拓学 可拓变换 可拓集合 义原词语
在线阅读 下载PDF
一个全文词义自动标注系统的实现 被引量:3
6
作者 刘挺 卢志茂 李生 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2005年第12期1603-1605,1649,共4页
为研究在给定上下文中如何确定多义词的词义,介绍了一种无指导的词义消歧技术和一个汉语全文词义标注系统的设计实现过程.该系统基于贝叶斯模型,使用大规模语料进行训练,较好地解决了知识获取中数据稀疏的问题.该系统具有标注正确率高... 为研究在给定上下文中如何确定多义词的词义,介绍了一种无指导的词义消歧技术和一个汉语全文词义标注系统的设计实现过程.该系统基于贝叶斯模型,使用大规模语料进行训练,较好地解决了知识获取中数据稀疏的问题.该系统具有标注正确率高和运行速度快等特点,适合大规模文本的词义标注工作. 展开更多
关键词 词义 梢歧 自然语言处理 无指导学习算法 贝叶斯模型 依存文法
在线阅读 下载PDF
无线认知自组网报文多播问题:随机网络编码方法 被引量:2
7
作者 陈炳才 高振国 +2 位作者 余超 卢志茂 丁男 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2018年第4期193-198,共6页
基于随机网络编码技术研究了无线认知自组网的报文多播传输技术.首先提出报文多播传输的核心问题,称作多信道单跳报文多播问题(multi-channel single-hop wireless multicast problem,MCSHWMP),并且给出多信道单跳报文多播问题的定义,... 基于随机网络编码技术研究了无线认知自组网的报文多播传输技术.首先提出报文多播传输的核心问题,称作多信道单跳报文多播问题(multi-channel single-hop wireless multicast problem,MCSHWMP),并且给出多信道单跳报文多播问题的定义,基于此提出其四元模型;然后提出基于网络编码技术的无线认知自组网报文多播传输算法框架,并根据该框架提出几种候选算法.所提算法通过网络编码技术充分利用无线通信的广播性质,显著节省了无线认知自组网报文多播传输报文传输数量;综合考虑无线认知自组网传输网络节点间不同信道的访问权限及报文的传输质量,使上游网络节点的每次报文传输都能使后续节点的报文收益得到最大化;从而有效节省多播传输组合报文中用于解码的附加信息,同时降低无线认知自组网传输报文的长度.仿真测试与分析结果表明,针对多信道单跳报文多播问题基于网络编码技术的算法相对于非网络编码算法明显节省报文传输数量,且在链路报文传输成功率较高但小于1时优势较大,节省报文数量可达50%. 展开更多
关键词 随机网络编码 无线认知自组网 多播 广播 链路可靠性
在线阅读 下载PDF
六维分数阶Lorenz-duffing系统仿真 被引量:1
8
作者 田野 卢志茂 高雪瑶 《现代电子技术》 北大核心 2017年第12期22-27,共6页
设计一个混沌行为复杂且具有物理学特性的整数阶混沌系统很难。为了解决这个问题,在整数阶混沌系统中引入了分数阶微分算子,并设计了一个六维分数阶Lorenz-duffing混沌系统;还重点分析了该分数阶混沌系统的平衡点和稳定性以及系统的吸... 设计一个混沌行为复杂且具有物理学特性的整数阶混沌系统很难。为了解决这个问题,在整数阶混沌系统中引入了分数阶微分算子,并设计了一个六维分数阶Lorenz-duffing混沌系统;还重点分析了该分数阶混沌系统的平衡点和稳定性以及系统的吸引子、分岔图和Lyapunov指数谱;最后,设计该分数阶混沌电路,并利用Multisim软件仿真分析了该电路。仿真结果表明,该分数阶混沌系统能够产生混沌信号。 展开更多
关键词 分数阶系统 Lorenz-duffing系统 LYAPUNOV指数 电路仿真
在线阅读 下载PDF
使用证据累积的文本聚类谱算法
9
作者 徐森 卢志茂 +2 位作者 张春祥 顾国昌 张琦 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2010年第8期1043-1047,共5页
针对谱聚类算法相似度函数设置困难问题,提出了一种使用证据累积的文本聚类谱算法.该算法使用超球K均值算法对文本集进行多次聚类,并将每次得到的划分结果作为判断2个文本是否应该放在一个簇中的证据,由此构建文本的相似度矩阵和正则化... 针对谱聚类算法相似度函数设置困难问题,提出了一种使用证据累积的文本聚类谱算法.该算法使用超球K均值算法对文本集进行多次聚类,并将每次得到的划分结果作为判断2个文本是否应该放在一个簇中的证据,由此构建文本的相似度矩阵和正则化拉普拉斯矩阵.在TREC和Reuters文本集上进行了实验,验证了本文算法的有效性,它比层次聚类算法和CLUTO提供的K均值算法更加优越. 展开更多
关键词 聚类分析 文本聚类 聚类谱 证据累积 超球K均值
在线阅读 下载PDF
基于HHT和OSF的复杂环境语音端点检测 被引量:12
10
作者 卢志茂 金辉 +1 位作者 张春祥 任明溪 《电子与信息学报》 EI CSCD 北大核心 2012年第1期213-217,共5页
希尔伯特-黄变换是一种全数据驱动的自适应非平稳信号时频分析方法,但是在强噪声环境下语音信号的希尔伯特能量谱曲线波动较大,对语音端点检测造成很大的影响,该文提出了一种基于希尔伯特-黄变换和顺序统计滤波的检测方法。该方法将含... 希尔伯特-黄变换是一种全数据驱动的自适应非平稳信号时频分析方法,但是在强噪声环境下语音信号的希尔伯特能量谱曲线波动较大,对语音端点检测造成很大的影响,该文提出了一种基于希尔伯特-黄变换和顺序统计滤波的检测方法。该方法将含噪语音信号进行经验模态分解,通过对固有模态函数进行自适应权重选取获得信号的希尔伯特能量谱,利用顺序统计滤波器对每帧的能量谱进行平滑处理作为语音/非语音的鉴别特征。实验结果表明,该方法适用于复杂噪声环境的端点检测,在低信噪比情况下仍然能够有效地检测出语音信号,降低信号误检率。 展开更多
关键词 语音信号处理 端点检测 希尔伯特-黄变换 顺序统计滤波 经验模态分解
在线阅读 下载PDF
近邻传播的文本聚类集成谱算法 被引量:9
11
作者 卢志茂 李纯 张琦 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2012年第7期899-905,共7页
针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程... 针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法. 展开更多
关键词 近邻传播 聚类集成 文本聚类 谱聚类 矩阵变换
在线阅读 下载PDF
基于信息增益改进贝叶斯模型的汉语词义消歧 被引量:8
12
作者 范冬梅 卢志茂 +1 位作者 张汝波 潘树燊 《电子与信息学报》 EI CSCD 北大核心 2008年第12期2926-2929,共4页
词义消歧一直是自然语言处理领域的关键问题和难点之一。通常把词义消歧作为模式分类问题进行研究,其中特征选择是一个重要的环节。该文根据贝叶斯假设提出基于信息增益的特征选择方法,并以此改进贝叶斯模型。通过信息增益计算,挖掘上... 词义消歧一直是自然语言处理领域的关键问题和难点之一。通常把词义消歧作为模式分类问题进行研究,其中特征选择是一个重要的环节。该文根据贝叶斯假设提出基于信息增益的特征选择方法,并以此改进贝叶斯模型。通过信息增益计算,挖掘上下文中词语的位置信息,提高贝叶斯模型知识获取的效率,从而改善词义分类效果。该文在8个歧义词上进行了实验,结果发现改进后的贝叶斯模型在消歧正确率上比改进前平均提高了3.5个百分点,改进幅度较大,效果突出,证明了该方法的有效性。 展开更多
关键词 词义消歧 自然语言处理 信息增益 贝叶斯模型
在线阅读 下载PDF
使用谱聚类算法解决文本聚类集成问题 被引量:15
13
作者 徐森 卢志茂 顾国昌 《通信学报》 EI CSCD 北大核心 2010年第6期58-66,共9页
采用2个不同的谱聚类算法解决文本聚类集成问题。为使算法可扩展到大规模应用,基于代数变换,通过求解小规模矩阵的特征值分解问题避免了大规模矩阵的特征值分解问题,有效降低了2个谱聚类算法的计算复杂度。分别从矩阵扰动理论和图上的... 采用2个不同的谱聚类算法解决文本聚类集成问题。为使算法可扩展到大规模应用,基于代数变换,通过求解小规模矩阵的特征值分解问题避免了大规模矩阵的特征值分解问题,有效降低了2个谱聚类算法的计算复杂度。分别从矩阵扰动理论和图上的随机游走的角度解释了2个算法的有效性。在真实文本集上的实验结果表明:提出的代数变换方法是有效的,该方法可以有效提高谱聚类算法的运行效率;该聚类集成谱算法比其他常见的聚类集成算法更优越、更高效,可以有效解决文本聚类集成问题。 展开更多
关键词 聚类集成 文本聚类 谱聚类 矩阵扰动理论 图上的随机游动
在线阅读 下载PDF
基于特征帧构建的运动目标检测方法 被引量:2
14
作者 卢志茂 刘明华 刘晨 《红外与激光工程》 EI CSCD 北大核心 2012年第7期1959-1963,共5页
非参数密度估计在样本分析建模方面得到了很大的关注,尤其是核密度估计方法。但由于核密度估计方法计算量大,应用到运动目标检测方面很难达到实时效果。提出了一种特征帧构建的核密度估计方法。因为核密度估计不需要假设背景模型的密度... 非参数密度估计在样本分析建模方面得到了很大的关注,尤其是核密度估计方法。但由于核密度估计方法计算量大,应用到运动目标检测方面很难达到实时效果。提出了一种特征帧构建的核密度估计方法。因为核密度估计不需要假设背景模型的密度分布函数,所有样本值又满足独立同分布的原则,所以可以通过特征帧构建的方法进行背景建模,同时应用此方法进行背景更新。实验结果表明:该方法能够适应环境变化且具有运算速度快、实时性好等特点,可以将其应用到复杂背景下的监控系统中。 展开更多
关键词 核密度估计 运动目标检测 背景建模 特征帧
在线阅读 下载PDF
使用“分裂-合并'策略改进文本聚类集成算法的研究 被引量:1
15
作者 卢志茂 徐森 +1 位作者 刘远超 顾国昌 《高技术通讯》 EI CAS CSCD 北大核心 2010年第7期714-718,共5页
探讨了'分裂-合并'(DM)策略对文本聚类集成算法改进的效果。首先在聚类成员生成阶段运行使用DM策略的超球K均值(SKM)算法r次,每次生成较多的文本子簇,并根据子簇的相似性使用凝聚层次聚类方法合并这些子簇,得到r个聚类成员,随... 探讨了'分裂-合并'(DM)策略对文本聚类集成算法改进的效果。首先在聚类成员生成阶段运行使用DM策略的超球K均值(SKM)算法r次,每次生成较多的文本子簇,并根据子簇的相似性使用凝聚层次聚类方法合并这些子簇,得到r个聚类成员,随后在聚类集成阶段采用两个快速的谱聚类算法进行集成。在6组真实文本集上进行了实验,使用DM策略的两个聚类集成算法获得的平均标准化互信息(NMI)分别比改进前的算法提高了4.6和7.9个百分点,证明了DM策略可以有效提高文本聚类集成算法的聚类质量。 展开更多
关键词 聚类集成 谱聚类 文本聚类 分裂-合并(DM) 标准化互信息(NMI)
在线阅读 下载PDF
基于对等模式的汉-英译文调序
16
作者 张春祥 赵铁军 +1 位作者 卢志茂 高雪瑶 《高技术通讯》 CAS CSCD 北大核心 2013年第1期29-34,共6页
为了提高机器翻译质量,提出了一种基于对等模式的汉-英译文调序方法:从短语翻译对中抽取汉.英语序对应关系,利用语言学特征和错误驱动学习相结合的方式获取对等模式,使用对等模式来改变汉语句法树结构,使其生成的译文符合英语语... 为了提高机器翻译质量,提出了一种基于对等模式的汉-英译文调序方法:从短语翻译对中抽取汉.英语序对应关系,利用语言学特征和错误驱动学习相结合的方式获取对等模式,使用对等模式来改变汉语句法树结构,使其生成的译文符合英语语序要求。使用该方法对500个汉.英双语句对中的汉语句子进行调序的实验结果表明,词链交叉率降低了10.56%。经过调序之后,汉语句子的译文质量有所提高。 展开更多
关键词 对等模式 译文调序 短语翻译对 词链交叉率 译文质量
在线阅读 下载PDF
基于主动学习的短语翻译对获取
17
作者 张春祥 赵铁军 卢志茂 《高技术通讯》 CAS CSCD 北大核心 2011年第4期380-385,共6页
利用汉-英双语句对进行了抽取短语翻译对的研究,提出了一种利用双语评价特征进行译文评价的短语翻译对主动获取方法。该方法通过选择有代表性的短语翻译对来达到减少人工标注数据的目的,以短语译文直译率、短语翻译概率和短语长度差... 利用汉-英双语句对进行了抽取短语翻译对的研究,提出了一种利用双语评价特征进行译文评价的短语翻译对主动获取方法。该方法通过选择有代表性的短语翻译对来达到减少人工标注数据的目的,以短语译文直译率、短语翻译概率和短语长度差异为基础,使用标注后的短语翻译对对支持向量机(SVM)进行训练,并使用优化后的SVM对测试数据进行分类。实验结果表明,使用此方法,在分类器性能基本没有下降的前提下,人工标注数据量减少了80%。 展开更多
关键词 短语翻译对 双语句对 双语评价特征 主动获取 支持向量机(SVM)
在线阅读 下载PDF
用于LTE接收机的MMSE-FDE均衡算法 被引量:3
18
作者 王连友 卢志茂 时代 《现代电子技术》 2010年第1期40-42,共3页
根据LTE上行SIMO接收机特点,对MMSE-RISIC均衡器进行简化修改,得到MMSE-FDE均衡器。该均衡器所有步骤全在频域进行,大大降低了均衡算法的复杂度。将该均衡器进行计算机仿真,其结果表明,该均衡器在3GPP LTE协议最常用的EPA和EVA信道中应... 根据LTE上行SIMO接收机特点,对MMSE-RISIC均衡器进行简化修改,得到MMSE-FDE均衡器。该均衡器所有步骤全在频域进行,大大降低了均衡算法的复杂度。将该均衡器进行计算机仿真,其结果表明,该均衡器在3GPP LTE协议最常用的EPA和EVA信道中应用,能比较有效地消除MMSE均衡残留的码间干扰,使系统性能明显提高。 展开更多
关键词 LTE系统 上行SIMO MMSE—FDE均衡器 码间干扰
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部