期刊文献+
共找到128篇文章
< 1 2 7 >
每页显示 20 50 100
基于WordNet词义消歧的系统融合 被引量:12
1
作者 刘宇鹏 李生 赵铁军 《自动化学报》 EI CSCD 北大核心 2010年第11期1575-1580,共6页
最近混淆网络在融合多个机器翻译结果中展示很好的性能.然而为了克服在不同的翻译系统中不同的词序,假设对齐在混淆网络的构建上仍然是一个重要的问题.但以往的对齐方法都没有考虑到语义信息.本文为了更好地改进系统融合的性能,提出了... 最近混淆网络在融合多个机器翻译结果中展示很好的性能.然而为了克服在不同的翻译系统中不同的词序,假设对齐在混淆网络的构建上仍然是一个重要的问题.但以往的对齐方法都没有考虑到语义信息.本文为了更好地改进系统融合的性能,提出了用词义消歧(Word sense disambiguation,WSD)来指导混淆网络中的对齐.同时骨架翻译的选择也是通过计算句子间的相似度来获得的,句子的相似性计算使用了二分图的最大匹配算法.为了使得基于WordNet词义消歧方法融入到系统中,本文将翻译错误率(Translation error rate,TER)算法进行了改进,实验结果显示本方法的性能好于经典的TER算法的性能. 展开更多
关键词 系统融合 翻译错误率 词义消歧 混淆网络
在线阅读 下载PDF
基于WordNet的无导词义消歧方法 被引量:6
2
作者 王瑞琴 孔繁胜 潘俊 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2010年第4期732-737,共6页
有导词义消歧机器学习方法由于需要大量人力进行词义标注,难以适用于大规模词义消歧任务.提出一种避免人工词义标注的无导消歧方法.该方法综合利用WordNet知识库中的多种知识源(包括:词义定义描述、使用实例、结构化语义关系、领域属性... 有导词义消歧机器学习方法由于需要大量人力进行词义标注,难以适用于大规模词义消歧任务.提出一种避免人工词义标注的无导消歧方法.该方法综合利用WordNet知识库中的多种知识源(包括:词义定义描述、使用实例、结构化语义关系、领域属性等)描述歧义词的词义信息,生成词义的"代表词汇集"和"领域代表词汇集",结合词汇的词频分布信息和所处的上下文环境进行词义判定.利用通用测试集Senseval-3对6个典型的无导词义消歧方法进行开放实验,该方法取得平均正确率为49.93%的消歧结果. 展开更多
关键词 词义消歧 wordNet知识库 结构化语义关系
在线阅读 下载PDF
基于WordNet的本体澄清 被引量:4
3
作者 郭雷 方俊 王晓东 《计算机科学》 CSCD 北大核心 2008年第10期145-147,185,共4页
由于本体能够消除概念的混淆和重用知识,因此它的质量对于语义网技术的应用非常重要。为了提高本体的质量,很多的工作集中在概念建模,但是本体表示这个非常重要的方面一直被忽视。目前本体的表示使用的是词(term),但同一个词可能有很多... 由于本体能够消除概念的混淆和重用知识,因此它的质量对于语义网技术的应用非常重要。为了提高本体的质量,很多的工作集中在概念建模,但是本体表示这个非常重要的方面一直被忽视。目前本体的表示使用的是词(term),但同一个词可能有很多不同的意思,这样在基于本体的应用时将导致不清楚或错误的理解。为了解决这个问题,使用定义在WordNet中的词义(sense)而不是词来作为本体的表示,其原因是词义只有唯一的意思。本体澄清的定义为利用目标词周围的本体元素和被它标注的文档附近的词,对目标词进行自动消歧的过程。通过计算目标词义和它的邻居词的语义相似度,语义相关度最大的词义将选为正确的词义。实验表明,我们的算法有很好的性能。与最好的消歧算法相比,概念(Concept)精度差不多是名词精度的2倍,关系(Property)精度差不多是动词精度的3倍。实验证明了我们的算法在半自动的本体净化过程中也是非常有效的。 展开更多
关键词 本体澄清 语义相关度 消歧
在线阅读 下载PDF
英语语音合成中基于WordNet的多音词消歧算法 被引量:1
4
作者 王永生 李梅 《计算机工程与应用》 CSCD 北大核心 2008年第26期138-140,共3页
英语中的多音词分成两类,一是因词性不同而读音不同,一是因词义不同而读音不同。前者只需经词性标注,根据其词性标记就可判别其正确的读音。而后者则复杂得多,论文采用了一种基于WordNet语义信息的多音词消歧算法,该算法将多音词的语义... 英语中的多音词分成两类,一是因词性不同而读音不同,一是因词义不同而读音不同。前者只需经词性标注,根据其词性标记就可判别其正确的读音。而后者则复杂得多,论文采用了一种基于WordNet语义信息的多音词消歧算法,该算法将多音词的语义信息与上下文中词的语义信息进行匹配,根据匹配结果来判别多音词的读音。 展开更多
关键词 多音词消歧 词义消歧 语音合成
在线阅读 下载PDF
基于WordNet的通用服务分类方法
5
作者 何佳 赵海燕 +2 位作者 陈庆奎 席丽娜 曹健 《计算机工程与科学》 CSCD 北大核心 2013年第9期157-161,共5页
随着服务技术的发展,越来越多的组织将业务功能作为服务通过网络对外发布。服务的增多导致人工对这些服务进行分类的成本越来越高。将文本挖掘、语义技术和机器学习技术相结合,提出了一个基于WordNet的服务自动分类方法。首先,利用文本... 随着服务技术的发展,越来越多的组织将业务功能作为服务通过网络对外发布。服务的增多导致人工对这些服务进行分类的成本越来越高。将文本挖掘、语义技术和机器学习技术相结合,提出了一个基于WordNet的服务自动分类方法。首先,利用文本挖掘技术和语义消歧技术,从服务的描述文档、社会化标注等获得可描述每个服务的一组有确切语义的Sense向量,本文选取的Sense向量是对每个API进行社会化标注的一组Tags。然后,利用K-均值聚类方法完成相应的分类。最后,以Programmable Web上的服务作为测试数据进行了实验,实验表明本方法具有较好的分类效果。 展开更多
关键词 服务 语义消歧 社会化标注 相似度 wordNET
在线阅读 下载PDF
基于节点词全句共现的动态词义消歧研究
6
作者 闫亚亚 邢红兵 《语言科学》 CSSCI 北大核心 2024年第4期354-364,共11页
文章根据词义消歧即将词义回归语境这一特性,提出了一种基于节点词全句共现的动态词义消歧方法。该方法首先以全句为窗口限定节点词的使用语境,其次使用互信息(MI)、卡方检验(χ^(2)检验)和相对词序比(RRWR)等统计方法抽取节点词的语义... 文章根据词义消歧即将词义回归语境这一特性,提出了一种基于节点词全句共现的动态词义消歧方法。该方法首先以全句为窗口限定节点词的使用语境,其次使用互信息(MI)、卡方检验(χ^(2)检验)和相对词序比(RRWR)等统计方法抽取节点词的语义相关词,并参照《同义词词林》构建相关词语义范畴库,最后以共现频数作为加权系数,依靠单义词语义聚类分布率对中低频共现多义词进行消歧。采用该方法对与“美丽”共现的1030个小于7义类的多义词进行消歧的测试试验中取得了85.2%的正确率。 展开更多
关键词 节点词 全句共现 词义消歧 语义聚类 无指导学习
在线阅读 下载PDF
基于向量空间模型的有导词义消歧 被引量:37
7
作者 鲁松 白硕 +1 位作者 黄雄 张健 《计算机研究与发展》 EI CSCD 北大核心 2001年第6期662-667,共6页
词义消歧一直是自然语言理解中的一个关键问题 ,该问题解决的好坏直接关系到自然语言处理中诸多应用问题的效果优劣 .由于自然语言知识表示的困难 ,在手工规则的词义消歧难以达到理想效果的情况下 ,各种有导机器学习方法被应用于词义消... 词义消歧一直是自然语言理解中的一个关键问题 ,该问题解决的好坏直接关系到自然语言处理中诸多应用问题的效果优劣 .由于自然语言知识表示的困难 ,在手工规则的词义消歧难以达到理想效果的情况下 ,各种有导机器学习方法被应用于词义消歧任务中 .借鉴前人的成果引入信息检索领域中向量空间模型文档词语权重计算技术来解决多义词义项的知识表示问题 ,并提出了上下文位置权重的计算方法 ,给出了一种基于向量空间模型的词义消歧有导机器学习方法 .该方法将多义词的义项和上下文分别映射到向量空间中 ,通过计算多义词上下文向量与义项向量的距离 ,采用 k- NN(k=1)方法来确定上下文向量的义项分类 .在 9个汉语高频多义词的开放和封闭测试中均取得了突出的成绩 (封闭测试平均正确率为 96 .31% ,开放测试平均正确率为 92 .98% ) 。 展开更多
关键词 词义消歧 向量空间模型 义项矩阵 自然语言理解 有导机器学习
在线阅读 下载PDF
基于论文和专利的钙钛矿太阳能电池的技术机会分析 被引量:35
8
作者 黄鲁成 王静静 +1 位作者 李欣 王立章 《情报学报》 CSSCI 北大核心 2016年第7期686-695,共10页
针对目前在技术机会识别中存在以下不足,即使用直接引用的时间滞后性和使用向量空间模型存在主观性的问题,本文以科技论文和专利数据为基础,采用文本挖掘方法并在完善SAO结构基础上,分析识别了钙钛矿太阳能电池的技术机会:首先运用文本... 针对目前在技术机会识别中存在以下不足,即使用直接引用的时间滞后性和使用向量空间模型存在主观性的问题,本文以科技论文和专利数据为基础,采用文本挖掘方法并在完善SAO结构基础上,分析识别了钙钛矿太阳能电池的技术机会:首先运用文本挖掘的方式抽取出标题和摘要的Subject-Action—Object(SAO)结构,并对SAO结构进行词义消歧,以便提高SAO结构相似度的计算精度;其次,将SAO结构的相似度转换为论文相似度及专利相似度,通过多维尺度分析总结聚类主题,识别确定技术机会;最后,用钙钛矿太阳能电池作为实例进行了实证研究,发现了四个潜在的技术机会,为该领域的研发工作提供了决策参考,同时也证实了该方法的有效性和科学性。 展开更多
关键词 SAO结构 技术机会 钙钛矿 太阳能电池 词义消歧
在线阅读 下载PDF
基于领域知识的图模型词义消歧方法 被引量:10
9
作者 鹿文鹏 黄河燕 吴昊 《自动化学报》 EI CSCD 北大核心 2014年第12期2836-2850,共15页
对领域知识挖掘利用的充分与否,直接影响到面向特定领域的词义消歧(Word sense disambiguation,WSD)的性能.本文提出一种基于领域知识的图模型词义消歧方法,该方法充分挖掘领域知识,为目标领域收集文本领域关联词作为文本领域知识,为目... 对领域知识挖掘利用的充分与否,直接影响到面向特定领域的词义消歧(Word sense disambiguation,WSD)的性能.本文提出一种基于领域知识的图模型词义消歧方法,该方法充分挖掘领域知识,为目标领域收集文本领域关联词作为文本领域知识,为目标歧义词的各个词义获取词义领域标注作为词义领域知识;利用文本领域关联词和句子上下文词构建消歧图,并根据词义领域知识对消歧图进行调整;使用改进的图评分方法对消歧图的各个词义结点的重要度进行评分,选择正确的词义.该方法能有效地将领域知识整合到图模型中,在Koeling数据集上,取得了同类研究的最佳消歧效果.本文亦对多种图模型评分方法做了改进,进行了详细的对比实验研究. 展开更多
关键词 词义消歧 领域知识 图模型 词义领域 文本领域
在线阅读 下载PDF
基于向量空间模型中义项词语的无导词义消歧 被引量:37
10
作者 鲁松 白硕 黄雄 《软件学报》 EI CSCD 北大核心 2002年第6期1082-1089,共8页
有导词义消歧机器学习方法的引入虽然使词义消歧取得了长足的进步,但由于需要大量人力进行词义标注,使其难以适用于大规模词义消歧任务.针对这一问题,提出了一种避免人工词义标注巨大工作量的无导学习方法.在仅需义项词语知识库的支持下... 有导词义消歧机器学习方法的引入虽然使词义消歧取得了长足的进步,但由于需要大量人力进行词义标注,使其难以适用于大规模词义消歧任务.针对这一问题,提出了一种避免人工词义标注巨大工作量的无导学习方法.在仅需义项词语知识库的支持下,将待消歧多义词与义项词语映射到向量空间中,基于k-NN(k=1)方法,计算二者相似度来实现词义消歧任务.在对10个典型多义词进行词义消歧的测试实验中,采用该方法取得了平均正确率为83.13%的消歧结果. 展开更多
关键词 向量空间模型 义项词语 无导词义消歧 义项词语 自然语言处理
在线阅读 下载PDF
多分类器集成的汉语词义消歧研究 被引量:14
11
作者 吴云芳 王淼 +1 位作者 金澎 俞士汶 《计算机研究与发展》 EI CSCD 北大核心 2008年第8期1354-1361,共8页
词义消歧长期以来一直是自然语言处理中的热点和难题,集成方法被认为是机器学习研究的四大趋势之一.系统研究了9种集成学习方法在汉语词义消歧中的应用.9种集成方法分别是乘法规则、均值、最大值、最小值、多数投票、序列投票、加权投... 词义消歧长期以来一直是自然语言处理中的热点和难题,集成方法被认为是机器学习研究的四大趋势之一.系统研究了9种集成学习方法在汉语词义消歧中的应用.9种集成方法分别是乘法规则、均值、最大值、最小值、多数投票、序列投票、加权投票、概率加权和单分类器融合,其中乘法规则、均值、最大值3种集成方法还未曾应用于词义消歧.选取支持向量机模型、朴素贝叶斯和决策树作为3个单分类器.在两个不同的数据集上进行了实验,其一是选自现代汉语语义标注语料库的18个多义词,其二是国际语义评测SemEval-2007的中英文对译选择词消歧任务.实验结果显示,首次在词义消歧中引入应用的3种集成方法乘法、均值、最大值有良好的性能表现,3种方法的消歧准确率均高于最佳单分类器SVM,而且优于其他6种集成方法. 展开更多
关键词 词义消歧 多分类器集成 均值 最大值
在线阅读 下载PDF
基于语义的关键词提取算法 被引量:39
12
作者 方俊 郭雷 王晓东 《计算机科学》 CSCD 北大核心 2008年第6期148-151,共4页
关键词1提供了文档内容的概要信息,它们被使用在很多数据挖掘的应用中。在目前的关键词提取算法中,我们发现词汇层面(代表意思的词)和概念层面(意思本身)的差别导致了关键字提取的不准确,比如不同语法的词可能有着相同的意思,而相同语... 关键词1提供了文档内容的概要信息,它们被使用在很多数据挖掘的应用中。在目前的关键词提取算法中,我们发现词汇层面(代表意思的词)和概念层面(意思本身)的差别导致了关键字提取的不准确,比如不同语法的词可能有着相同的意思,而相同语法的词在不同的上下文有着不同的意思。为了解决这个问题,这篇文章提出使用词义代替词并且通过考虑关键候选词的语义信息来提高关键词提取算法性能的方法。与现有的关键词提取方法不同,该方法首先通过使用消歧算法,通过上下文得到候选词的词义;然后在后面的词合并、特征提取和评估的步骤中,候选词义之间的语义相关度被用来提高算法的性能。在评估算法时,我们采用一种更为有效的基于语义的评估方法与著名的Kea系统作比较。在不同领域间的实验中可以发现,当考虑语义信息后,关键词提取算法的性能能够得到很大的提高。在同领域的实验中,我们的算法的性能与Kea++算法的相近。我们的算法没有领域的限制性,因此具有更好的应用前景。 展开更多
关键词 关键词提取 语义相关度 消歧
在线阅读 下载PDF
基于对数模型的词义自动消歧 被引量:13
13
作者 朱靖波 李珩 +1 位作者 张跃 姚天顺 《软件学报》 EI CSCD 北大核心 2001年第9期1405-1412,共8页
提出了一种对数模型 (logarithm model,简称 L M) ,构造了一个词义自动消歧系统 LM-WSD(word sensedisambiguation based on logarithm model) .在词义自动消歧实验中 ,构造了 4种计算模型进行词义消歧 ,根据 4个计算模型的消歧结果 ,... 提出了一种对数模型 (logarithm model,简称 L M) ,构造了一个词义自动消歧系统 LM-WSD(word sensedisambiguation based on logarithm model) .在词义自动消歧实验中 ,构造了 4种计算模型进行词义消歧 ,根据 4个计算模型的消歧结果 ,分析了高频率词义、指示词、特定领域、固定搭配和固定用法信息对名词和动词词义消歧的影响 .目前 ,该词义自动消歧系统 L M-WSD已经应用于基于词层的英汉机器翻译系统 (汽车配件专业领域 )中 ,有效地提高了翻译性能 . 展开更多
关键词 词义自动消歧 机器翻译 对数模型 自然语言处理 计算机
在线阅读 下载PDF
统计词义消歧的研究进展 被引量:28
14
作者 卢志茂 刘挺 李生 《电子学报》 EI CAS CSCD 北大核心 2006年第2期333-343,共11页
本文参考大量的文献资料,分析了当前国内外统计词义消歧研究中采用的多种方法和技术,指出了统计词义消歧研究的关键问题,并围绕关键问题阐述了统计词义消歧的研究进展,探讨了研究中存在的问题和未来研究的重点.
关键词 统计词义消歧 自然语言处理 综述
在线阅读 下载PDF
基于依存分析改进贝叶斯模型的词义消歧 被引量:12
15
作者 卢志茂 刘挺 +1 位作者 张刚 李生 《高技术通讯》 EI CAS CSCD 2003年第5期1-7,共7页
词义消歧一直是自然语言处理领域的关键问题和难点之一。目前进行的很多词义消歧研究多采用几个多义词作为实验测试对象,在实际应用方面存在着局限性。本文对大规模真实文本进行了词义消歧研究,采用了基于依存分析改进贝叶斯分类模型的... 词义消歧一直是自然语言处理领域的关键问题和难点之一。目前进行的很多词义消歧研究多采用几个多义词作为实验测试对象,在实际应用方面存在着局限性。本文对大规模真实文本进行了词义消歧研究,采用了基于依存分析改进贝叶斯分类模型的有指导词义消歧方法。该模型充分利用依存句法分析,从句子的内部结构,寻找词语之间支配与被支配的关系,借以确定能够对词语语义构成内在限制的上下文,有效地克服了单纯贝叶斯分类器中无关上下文造成的噪声影响。本实验的开放测试正确率可以达到91.89%,封闭实验正确率可达99.4%,验证了改进模型的有效性。 展开更多
关键词 依存分析 贝叶斯模型 词义消歧 自然语言处理 语料库 统计分析 信息检索 贝叶斯分类器
在线阅读 下载PDF
基于义原同现频率的汉语词义排歧方法 被引量:26
16
作者 杨尔弘 张国清 张永奎 《计算机研究与发展》 EI CSCD 北大核心 2001年第7期833-838,共6页
词义排岐是自然语言处理的重点和难点问题之一 .基于语料库的统计方法已被广泛地应用于词义排岐 .大多数的统计方法都受到数据稀疏的困扰 ,对于词义排岐而言 ,由于有大量同义词的存在 ,数据稀疏问题变得更为严重 .充分利用“知网”这个... 词义排岐是自然语言处理的重点和难点问题之一 .基于语料库的统计方法已被广泛地应用于词义排岐 .大多数的统计方法都受到数据稀疏的困扰 ,对于词义排岐而言 ,由于有大量同义词的存在 ,数据稀疏问题变得更为严重 .充分利用“知网”这个知识源的特性 ,提出了一种基于义原同现频率的词义排岐方法 ,在很大程度上克服了数据稀疏问题 .此外 ,该方法还避免了繁重的人工标注语料的过程 ,通过在一个约 10万字的语料库上获得义原同现频率矩阵 ,并以此作为词义排岐的依据 .实验表明 。 展开更多
关键词 自然语言处理 知网 义原同现频率 汉语词义排歧 语料库
在线阅读 下载PDF
词义标注语料库建设综述 被引量:18
17
作者 金澎 吴云芳 俞士汶 《中文信息学报》 CSCD 北大核心 2008年第3期16-23,共8页
词义消歧的关键问题是缺少大规模、高质量的词义标注语料库。本文分别从语料选取、词典选择、标注规模和标注质量等方面介绍已经建成的较有影响的若干词义标注语料库。在自动构建词义标注语料库的方法中,本文集中介绍bootstrapping策略... 词义消歧的关键问题是缺少大规模、高质量的词义标注语料库。本文分别从语料选取、词典选择、标注规模和标注质量等方面介绍已经建成的较有影响的若干词义标注语料库。在自动构建词义标注语料库的方法中,本文集中介绍bootstrapping策略在语料库建设方面的应用以及利用双语对齐语料库开展的相关研究。最后,针对词义标注语料库建设存在的问题提出自己的分析和思考。 展开更多
关键词 计算机应用 中文信息处理 词义消歧 词义标注语料库 平行语料库 BOOTSTRAPPING
在线阅读 下载PDF
无监督词义消歧研究 被引量:17
18
作者 王瑞琴 孔繁胜 《软件学报》 EI CSCD 北大核心 2009年第8期2138-2152,共15页
研究的目的是对现有的无监督词义消歧技术进行总结,以期为进一步的研究指明方向.首先,介绍了无监督词义消歧研究的意义.然后,重点总结分析了国内外各类无监督词义消歧研究中的各项关键技术,包括使用的数据源、采用的消歧方法、评价体系... 研究的目的是对现有的无监督词义消歧技术进行总结,以期为进一步的研究指明方向.首先,介绍了无监督词义消歧研究的意义.然后,重点总结分析了国内外各类无监督词义消歧研究中的各项关键技术,包括使用的数据源、采用的消歧方法、评价体系以及达到的消歧效果等方面.最后,对14个较有特色的无监督词义消歧方法进行了总结,并指出无监督词义消歧的现有研究成果和可能的发展方向. 展开更多
关键词 词义消歧 无监督词义消歧 自然语言处理 语义理解
在线阅读 下载PDF
基于维基百科的自动词义消歧方法 被引量:12
19
作者 史天艺 李明禄 《计算机工程》 CAS CSCD 北大核心 2009年第18期62-64,66,共4页
针对传统词义消歧仅基于上下文语境而导致准确率低的问题,提出一种多策略的无监督自动词义消歧方法。利用从维基百科在线中提炼出的丰富语义知识,线性融合上下文语境、背景知识和语义信息3大特征,根据逻辑回归算法学习各特征的权重,选... 针对传统词义消歧仅基于上下文语境而导致准确率低的问题,提出一种多策略的无监督自动词义消歧方法。利用从维基百科在线中提炼出的丰富语义知识,线性融合上下文语境、背景知识和语义信息3大特征,根据逻辑回归算法学习各特征的权重,选取最大融合值所对应的候选项作为最优词义。在SENSEVAL数据集上取得了85.50%的平均准确率,验证了该方法的有效性。 展开更多
关键词 词义消歧 维基百科 知识库 无监督学习
在线阅读 下载PDF
词义消歧研究的现状与发展方向 被引量:8
20
作者 李生 张晶 +1 位作者 赵铁军 姚建民 《计算机科学》 CSCD 北大核心 2001年第9期95-98,F004,共5页
This paper outlines the state-of-the-art of word sense disambiguation(WSD)in the following aspects: the application of WSD,representation of disambiguation knowledge ,approaches and their evaluations. The paper analyz... This paper outlines the state-of-the-art of word sense disambiguation(WSD)in the following aspects: the application of WSD,representation of disambiguation knowledge ,approaches and their evaluations. The paper analyzes current widely-applied WSD approaches,compares their merits and shortages. The direction of further researches in WSD field has been explored. 展开更多
关键词 自然语言处理 词义消歧 计算机 语料库
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部