期刊文献+
共找到215篇文章
< 1 2 11 >
每页显示 20 50 100
藏语视角下的HowNet共性知识体系研究 被引量:2
1
作者 姚洲 赵小兵 《中文信息学报》 CSCD 北大核心 2024年第9期73-81,共9页
HowNet是我国知识库研究的奠基性成果。目前HowNet已构建出汉英双语的知识表征模式,并在语义相似度计算、向量表示等技术领域取得了较好的效果,但现有研究对HowNet共性知识体系本身的合理性以及跨语言的适应性仍缺乏有益探索。藏语作为... HowNet是我国知识库研究的奠基性成果。目前HowNet已构建出汉英双语的知识表征模式,并在语义相似度计算、向量表示等技术领域取得了较好的效果,但现有研究对HowNet共性知识体系本身的合理性以及跨语言的适应性仍缺乏有益探索。藏语作为施通格语言,与汉语、英语具有较大差别,有助于检验HowNet共性知识体系的合理性。该文以具体藏文实例为依据,从藏语格助词的表义性、动词能所关系以及语义分类特征等方面指出HowNet共性知识体系的跨语言适应性有待完善;结合原型理论及藏文能所关系,以提升HowNet共性知识体系的科学性,并据此对HowNet知识体系的架构数据进行修正。 展开更多
关键词 藏语 hownet 共性知识体系
在线阅读 下载PDF
基于HowNet概念获取的中文自动文摘系统 被引量:22
2
作者 王萌 何婷婷 +1 位作者 姬东鸿 王晓荣 《中文信息学报》 CSCD 北大核心 2005年第3期87-93,共7页
本文提出了一种中文自动文摘的方法。不同于其它的基于词频统计的一般方法,运用概念(词义)作为特征取代词语。用概念统计代替传统的词形频率统计方法,建立概念向量空间模型,计算出句子重要度,并对句子进行冗余度计算,抽取文摘句。对于... 本文提出了一种中文自动文摘的方法。不同于其它的基于词频统计的一般方法,运用概念(词义)作为特征取代词语。用概念统计代替传统的词形频率统计方法,建立概念向量空间模型,计算出句子重要度,并对句子进行冗余度计算,抽取文摘句。对于文摘测试,采用两种不同的方法进行测试:一是用机器文摘和专家文摘进行比较的内部测试;二是对不同文摘方法进行分类,通过对分类正确率的比较的外部评测方法。 展开更多
关键词 计算机应用 中文信息处理 hownet 自动文摘 概念向量空间模型
在线阅读 下载PDF
基于HowNet的话题跟踪及倾向性分类研究 被引量:21
3
作者 金珠 林鸿飞 赵晶 《情报学报》 CSSCI 北大核心 2005年第5期555-561,共7页
本文研究了如何基于信息检索技术和"知网"实现有效的话题跟踪和话题立场分类.话题跟踪任务就是给出话题相关的训练新闻报道,系统在后续报道中发现与这个话题相关的报道.它属于话题检测与跟踪的一项子任务.本文针对跟踪任务中... 本文研究了如何基于信息检索技术和"知网"实现有效的话题跟踪和话题立场分类.话题跟踪任务就是给出话题相关的训练新闻报道,系统在后续报道中发现与这个话题相关的报道.它属于话题检测与跟踪的一项子任务.本文针对跟踪任务中话题本身的特点,论述了权重调整、事件框架和报道扩充等多种提高跟踪性能的策略,同时基于"知网"中的情感体系和动态角色框架,提出了如何填充框架并结合建立的立场概念库对报道进行话题立场分类.实验证明这些方法是有效的. 展开更多
关键词 hownet 信息检索 话题跟踪 倾向性分类
在线阅读 下载PDF
基于可拓学和HowNet的策略生成系统研究进展 被引量:6
4
作者 杨春燕 李卫华 +2 位作者 汤龙 汪中飞 陶星 《智能系统学报》 CSCD 北大核心 2015年第6期823-830,共8页
在已有可拓策略生成系统框架基础上,利用可拓信息-知识-策略形式化表示体系、HowNet的知识系统描述语言(KDML)和Agent的智能引导,建立了基于可拓学和HowNet的策略生成系统的基本流程和系统框架结构,增强了可拓策略生成系统解决矛盾问题... 在已有可拓策略生成系统框架基础上,利用可拓信息-知识-策略形式化表示体系、HowNet的知识系统描述语言(KDML)和Agent的智能引导,建立了基于可拓学和HowNet的策略生成系统的基本流程和系统框架结构,增强了可拓策略生成系统解决矛盾问题的能力,改善了知识资源缺乏问题,提高了其问题模型建立的准确性和知识处理能力。初步的应用显示了该研究的优越性。把可拓学和HowNet这2个中国原创的理论和应用工具相结合研究策略生成系统,将使这项有别于传统研究思路的基础研究取得重要突破,产生具有完全自主知识产权的成果。这也是为将来能实现矛盾问题的智能化处理作基础性的工作。 展开更多
关键词 可拓学 hownet 策略生成 可拓策略生成系统 矛盾问题
在线阅读 下载PDF
基于HowNet的VSM模型扩展在文本分类中的应用研究 被引量:8
5
作者 孙宏纲 陆余良 +1 位作者 刘金红 龚笔宏 《中文信息学报》 CSCD 北大核心 2007年第6期101-108,共8页
在采用VSM模型进行文本分类时,如果特征向量维数相差悬殊,会给分类结果产生很大负面影响。为了解决这一问题,本文引入了特征向量扩展的思想,同时定义了有效原始信息浓度的概念。特征向量扩展以HowNet语义词典为依据,对高维和低维特征向... 在采用VSM模型进行文本分类时,如果特征向量维数相差悬殊,会给分类结果产生很大负面影响。为了解决这一问题,本文引入了特征向量扩展的思想,同时定义了有效原始信息浓度的概念。特征向量扩展以HowNet语义词典为依据,对高维和低维特征向量采用不同的扩展策略,从而减小了不同类别语料间有效原始信息浓度的差值,进而改善复杂语料的分类结果。实验表明该方法在复杂语料情况下,通过对特征向量进行HowNet语义扩展,可以较好的改善分类结果。 展开更多
关键词 计算机应用 中文信息处理 hownet VSM模型 文本分类
在线阅读 下载PDF
基于HowNet的航空术语语义知识库的构建 被引量:9
6
作者 张桂平 刁丽娜 王裴岩 《中文信息学报》 CSCD 北大核心 2014年第5期92-101,共10页
语义知识库的构建是自然语言处理基础性工作,对于语言信息的处理有重要的作用,但面向特定领域的语义知识库的构建还是一个难点。该文在分析了航空术语的基本特点的基础上,根据HowNet和KDML描述语言构建了面向航空领域的术语语义知识库,... 语义知识库的构建是自然语言处理基础性工作,对于语言信息的处理有重要的作用,但面向特定领域的语义知识库的构建还是一个难点。该文在分析了航空术语的基本特点的基础上,根据HowNet和KDML描述语言构建了面向航空领域的术语语义知识库,并在构建航空术语知识库的过程中总结形成了构建航空术语知识库的基础规则、动态角色/特征的选择规则。在文章最后对所构建的术语进行了相似度的计算,取得了较好的结果。 展开更多
关键词 航空术语 hownet 语义知识库 KDML
在线阅读 下载PDF
借重于人工知识库的词和义项的向量表示:以HowNet为例 被引量:14
7
作者 孙茂松 陈新雄 《中文信息学报》 CSCD 北大核心 2016年第6期1-6,14,共7页
该文旨在以HowNet为例,探讨在表示学习模型中引入人工知识库的必要性和有效性。目前词向量多是通过构造神经网络模型,在大规模语料库上无监督训练得到,但这种框架面临两个问题:一是低频词的词向量质量难以保证;二是多义词的义项向量无... 该文旨在以HowNet为例,探讨在表示学习模型中引入人工知识库的必要性和有效性。目前词向量多是通过构造神经网络模型,在大规模语料库上无监督训练得到,但这种框架面临两个问题:一是低频词的词向量质量难以保证;二是多义词的义项向量无法获得。该文提出了融合HowNet和大规模语料库的义原向量学习神经网络模型,并以义原向量为桥梁,自动得到义项向量及完善词向量。初步的实验结果表明该模型能有效提升在词相似度和词义消歧任务上的性能,有助于低频词和多义词的处理。作者指出,借重于人工知识库的神经网络语言模型应该成为今后一段时期自然语言处理的研究重点之一。 展开更多
关键词 词向量 义项向量 义原向量 hownet 神经网络语言模型
在线阅读 下载PDF
基于HowNet的语义表示学习 被引量:11
8
作者 朱靖雯 杨玉基 +1 位作者 许斌 李涓子 《中文信息学报》 CSCD 北大核心 2019年第3期33-41,共9页
HowNet是一个大规模高质量的跨语言(中英)常识知识库,蕴含着丰富的语义信息。该文利用知识图谱领域的方法将HowNet复杂的结构层层拆解,得到了知识图谱形式的HownetGraph,进而利用网络表示学习以及知识表示学习方法得到了跨语言(中、英)... HowNet是一个大规模高质量的跨语言(中英)常识知识库,蕴含着丰富的语义信息。该文利用知识图谱领域的方法将HowNet复杂的结构层层拆解,得到了知识图谱形式的HownetGraph,进而利用网络表示学习以及知识表示学习方法得到了跨语言(中、英)、跨语义单位(字词、义项①、DEF_CONCEPT②和义原)的向量表示,在词语相似度(word similarity)和词语类比(word analogy)任务上对中英文数据集进行了实验,实验结果显示该文提出的方法在词语语义相似度的任务上取得了最好效果。 展开更多
关键词 hownet 知识图谱 语义表示 表示学习
在线阅读 下载PDF
HowNet义原标注一致性检验方法研究 被引量:9
9
作者 刘阳光 岂凡超 +1 位作者 刘知远 孙茂松 《中文信息学报》 CSCD 北大核心 2021年第4期23-34,共12页
义原(sememe)被定义为人类语言中不可再分的最小语义单位。一个词语的意义可以由多个义原的组合来表示。以往人们已经人工为词语标注义原并构建了知网(HowNet)这一语言知识库,并借此将义原应用到了多种自然语言处理任务。但传统的人工... 义原(sememe)被定义为人类语言中不可再分的最小语义单位。一个词语的意义可以由多个义原的组合来表示。以往人们已经人工为词语标注义原并构建了知网(HowNet)这一语言知识库,并借此将义原应用到了多种自然语言处理任务。但传统的人工标注费时费力,而且不同的专家进行标注难免会引入标注者的主观偏差,导致标注的一致性和准确性难以保证。因此,保证词的义原标注一致性已成为建设高质量语言知识库HowNet、提升义原应用任务效果的首要任务。该文首次提出了一种对HowNet已标注的义原进行一致性检验的方法。实验结果表明,所提方法切实有效,能够很好地应用于HowNet知识库的标注一致性检验以及完善扩充。 展开更多
关键词 义原标注 hownet 一致性检验
在线阅读 下载PDF
一种基于Hownet的词向量表示方法 被引量:11
10
作者 陈洋 罗智勇 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第1期22-28,共7页
针对基于预训练得到的词向量在低频词语表示质量和稳定性等方面存在的缺陷,提出一种基于Hownet的词向量表示方法(H-WRL)。首先,基于义原独立性假设,将Hownet中所有N个义原指定为欧式空间的一个标准正交基,实现Hownet义原向量初始化;然后... 针对基于预训练得到的词向量在低频词语表示质量和稳定性等方面存在的缺陷,提出一种基于Hownet的词向量表示方法(H-WRL)。首先,基于义原独立性假设,将Hownet中所有N个义原指定为欧式空间的一个标准正交基,实现Hownet义原向量初始化;然后,根据Hownet中词语与义原之间的定义关系,将词语向量表示视为相关义原所张成的子空间中的投影,并提出学习词向量表示的深度神经网络模型。实验表明,基于Hownet的词向量表示在词相似度计算和词义消歧两项标准评测任务中均取得很好的效果。 展开更多
关键词 词向量表示 hownet 词语相似性计算 词义消岐
在线阅读 下载PDF
面向航空领域HowNet构建的术语内部动态角色标注 被引量:1
11
作者 赵超丽 王裴岩 蔡东风 《计算机应用与软件》 北大核心 2021年第3期163-168,209,共7页
术语内部动态角色标注是航空领域HowNet构建的关键环节,其直接影响航空领域HowNet的规模与质量。针对动态角色种类多造成标注困难的问题,提出一种基于KNN的术语内部动态角色标注方法。通过对术语内部词语DEF项的分析进行样本预选择,并... 术语内部动态角色标注是航空领域HowNet构建的关键环节,其直接影响航空领域HowNet的规模与质量。针对动态角色种类多造成标注困难的问题,提出一种基于KNN的术语内部动态角色标注方法。通过对术语内部词语DEF项的分析进行样本预选择,并在最近邻样本选择阶段融合基于DEF的语义相似性及基于词向量的语境分布相似性。实验结果表明,1-Best、3-Best和7-Best的准确率分别为67.57%、86.00%和94.17%,平均倒数排名MRR为0.7764,优于现有的研究结果。 展开更多
关键词 航空术语 动态角色 hownet KNN分类算法
在线阅读 下载PDF
基于HowNet的词汇语义倾向计算 被引量:328
12
作者 朱嫣岚 闵锦 +2 位作者 周雅倩 黄萱菁 吴立德 《中文信息学报》 CSCD 北大核心 2006年第1期14-20,共7页
在互联网技术快速发展、网络信息爆炸的今天,通过计算机自动分析大规模文本中的态度倾向信息的技术,在企业商业智能系统、政府舆情分析等诸多领域有着广阔的应用空间和发展前景。同时,语义褒贬倾向研究也为文本分类、自动文摘、文本过... 在互联网技术快速发展、网络信息爆炸的今天,通过计算机自动分析大规模文本中的态度倾向信息的技术,在企业商业智能系统、政府舆情分析等诸多领域有着广阔的应用空间和发展前景。同时,语义褒贬倾向研究也为文本分类、自动文摘、文本过滤等自然语言处理的研究提供了新的思路和手段。篇章语义倾向研究的基础工作是对词汇的褒贬倾向判别。本文基于HowNet,提出了两种词汇语义倾向性计算的方法:基于语义相似度的方法和基于语义相关场的方法。实验表明,本文的方法在汉语常用词中的效果较好,词频加权后的判别准确率可达80%以上,具有一定的实用价值。 展开更多
关键词 计算机应用 中文信息处理 态度分类 语义倾向 知网
在线阅读 下载PDF
基于HowNet和PMI的词语情感极性计算 被引量:32
13
作者 王振宇 吴泽衡 胡方涛 《计算机工程》 CAS CSCD 2012年第15期187-189,193,共4页
基于语料库的点互信息(PMI)计算方法依赖于语料库的完善性,基于HowNet的计算方法则依赖于知网相似度计算的准确性。为克服2种方法的局限性,提出一种HowNet和PMI相融合的词语极性计算方法,利用知网进行同义词扩展,降低情感词在语料库中... 基于语料库的点互信息(PMI)计算方法依赖于语料库的完善性,基于HowNet的计算方法则依赖于知网相似度计算的准确性。为克服2种方法的局限性,提出一种HowNet和PMI相融合的词语极性计算方法,利用知网进行同义词扩展,降低情感词在语料库中出现频率低所带来的问题。实验结果表明,该方法的微平均和宏平均性能比传统方法提升约5%。 展开更多
关键词 情感分析 点互信息 知网 同义词扩展 相似度
在线阅读 下载PDF
融合HowNet和BTM模型的短文本聚类方法 被引量:9
14
作者 阳小兰 杨威 +1 位作者 钱程 朱福喜 《计算机工程与设计》 北大核心 2017年第5期1258-1263,共6页
针对常规技术对短文本聚类时出现的相似度计算准确度较差、聚类结果不稳定等问题,提出一种以HowNet语义词库和BTM主题建模为基础的相似度计算方法,将两者进行线性组合,综合考察短文本的相似性。建立基于聚类质量和聚类差异度的聚类结果... 针对常规技术对短文本聚类时出现的相似度计算准确度较差、聚类结果不稳定等问题,提出一种以HowNet语义词库和BTM主题建模为基础的相似度计算方法,将两者进行线性组合,综合考察短文本的相似性。建立基于聚类质量和聚类差异度的聚类结果评价指标,进行优劣评价,过滤出质量较好的结果,利用CSPA融合算法进行聚类融合。实验结果表明,该方法提高了短文本相似度计算的准确性,改进了融合结果稳定性。 展开更多
关键词 短文本 知网 Biterm主题模型 聚类 融合
在线阅读 下载PDF
融合HowNet和词林信息含量的词语相似度计算 被引量:1
15
作者 陈靖元 周刚 卢记仓 《小型微型计算机系统》 CSCD 北大核心 2022年第6期1303-1308,共6页
目前基于信息含量的中文词语相似度算法普遍使用单一的知识库,存在信息不完备的问题.本文在现有的基于HowNet信息含量的词语相似度算法和基于同义词词林信息含量的词语相似度算法基础上,改进了信息含量的计算方法,并根据词语的不同分布... 目前基于信息含量的中文词语相似度算法普遍使用单一的知识库,存在信息不完备的问题.本文在现有的基于HowNet信息含量的词语相似度算法和基于同义词词林信息含量的词语相似度算法基础上,改进了信息含量的计算方法,并根据词语的不同分布情况将两种算法进行动态融合,充分利用了HowNet和同义词词林中的体系结构信息,改善了现有方法的局限性.经Miller&Charles(MC30)数据集测评,该算法所得到的词语相似度值与人工判定值之间的皮尔森相关系数为0.927,验证了融合多知识库策略的可行性,也证明了本文方法在实用方面可以达到符合人类主观判断的效果. 展开更多
关键词 hownet 同义词词林 信息含量 词语相似度计算
在线阅读 下载PDF
基于HowNet语义相似度的FAQ研究 被引量:10
16
作者 贾可亮 樊孝忠 张禹 《计算机应用》 CSCD 北大核心 2007年第9期2256-2257,共2页
FAQ是网站提供在线帮助的主要手段。利用检索机制根据用户提出的问题建立一个候选问句集,利用知网研究了用户问句和候选问句之间的相似度,从中找出最相似的问句,并将相应答案返回给用户。实验表明,该方法提高了问句匹配的准确率。
关键词 知网 Frequently Asked Question(FAQ) 句子语义相似度
在线阅读 下载PDF
基于句法规则和HowNet的商品评论细粒度观点分析 被引量:8
17
作者 韦婷婷 陈伟生 +2 位作者 胡勇军 骆威 包先雨 《中文信息学报》 CSCD 北大核心 2020年第3期88-98,共11页
该文提出一种基于句法规则和HowNet词典的商品评论细粒度观点分析方法,主要包括三个模块:评价对象抽取、评价对象-评价词对抽取、评价对象总体观点得分计算。具体思路为:首先,结合词性标注和频繁项集方法构建一个初始的评价对象词典,便... 该文提出一种基于句法规则和HowNet词典的商品评论细粒度观点分析方法,主要包括三个模块:评价对象抽取、评价对象-评价词对抽取、评价对象总体观点得分计算。具体思路为:首先,结合词性标注和频繁项集方法构建一个初始的评价对象词典,便于重用和修正商品的总体评价维度;其次,基于爬取的电商评论文本真实数据设计了评价对象-评价词对抽取规则;最后,借助HowNet词典分别计算不同评价维度的观点综合得分,进而对比同一商品不同品牌在各个维度下的总体观点评价,该方法在商品评论语料集上验证了有效性。 展开更多
关键词 商品评论 细粒度观点分析 句法规则 hownet
在线阅读 下载PDF
基于HowNet查询扩展方法的探究 被引量:1
18
作者 张振梅 刘明 +1 位作者 毕利 高玉琢 《计算机应用与软件》 北大核心 2018年第3期27-31,共5页
考虑到查询扩展方法在信息检索中很少考虑词语的顺序、分布和词条概念关系等因素,难以在信息检索中对文本相似性做出全方位的度量。针对这种情况,基于词语概念本体How Net对词序、词距、扩展词权重特征进行概念相关性度量,并将词语相关... 考虑到查询扩展方法在信息检索中很少考虑词语的顺序、分布和词条概念关系等因素,难以在信息检索中对文本相似性做出全方位的度量。针对这种情况,基于词语概念本体How Net对词序、词距、扩展词权重特征进行概念相关性度量,并将词语相关性度量作为特征词权重因子引入文本检索过程中,实现了一种改进的特征量化方法。Top-N检索结果的实验表明,采用的方法使得系统整体性能获得有效提升。 展开更多
关键词 查询扩展 TF-IDF 索引构建 hownet 信息检索
在线阅读 下载PDF
面向中文词汇语义相关性计算的ConceptNet与HowNet对比分析
19
作者 曹静雯 王铁鑫 +1 位作者 杨志斌 李文心 《小型微型计算机系统》 CSCD 北大核心 2020年第8期1641-1648,共8页
作为自然语言处理的关键技术之一,词汇之间的语义相关性计算依赖于语义资源.语义资源可分为知识库和语料库;How Net和ConceptNet是包含中文词汇的两种语义知识库,可为中文词汇语义相关性计算提供依据.本文在分析以上两种语义知识库结构... 作为自然语言处理的关键技术之一,词汇之间的语义相关性计算依赖于语义资源.语义资源可分为知识库和语料库;How Net和ConceptNet是包含中文词汇的两种语义知识库,可为中文词汇语义相关性计算提供依据.本文在分析以上两种语义知识库结构及应用的基础上,提出:面向How Net的基于信息含量的语义相关性计算方法,以及面向ConceptNet的基于路径距离的语义相关性计算方法.通过实验案例分析,得出如下结论:How Net明确定义词汇的概念,适用于检测词对间的语义相似度;ConceptNet定义词对间的多重语义关系,在检测词对语义相似度的基础上,亦能检测词对间的语义相关度.此外,本文探索性地提出结合使用以上两种语义知识库的词对间语义关系计算算法,以期扩大检索词汇的范围并提高效率. 展开更多
关键词 自然语言处理 语义知识库 ConceptNet How Net 语义检测
在线阅读 下载PDF
面向新词义原推荐的相似性判别方法 被引量:1
20
作者 白宇 田雨 +1 位作者 王之光 张桂平 《中文信息学报》 CSCD 北大核心 2024年第1期36-44,共9页
义原(Sememe)是构成《知网》(HowNet)概念描述的核心部件,新词概念描述义原的推荐是HowNet自动或半自动扩展中涉及的关键问题。面向新词义原推荐,该文提出一种融合义原注意力的预训练语言模型优化方法——SaBERT。在判别新词与HowNet词... 义原(Sememe)是构成《知网》(HowNet)概念描述的核心部件,新词概念描述义原的推荐是HowNet自动或半自动扩展中涉及的关键问题。面向新词义原推荐,该文提出一种融合义原注意力的预训练语言模型优化方法——SaBERT。在判别新词与HowNet词表词之间的语义相似性的过程中,该方法利用词表词已知概念描述义原序列的注意力分布,以相似性同构为目标,对基于BERT+CNN的相似性判别模型进行优化,从而为义原推荐任务提供相似概念集合。实验结果表明,采用SaBERT可以有效解决未登录词与词表词的相似性判别问题,准确率、召回率、F1值分别达到0.8314、0.8007和0.8158。在基于协同过滤框架的义原推荐任务上进行的实验表明,相似性同构程度与义原推荐效果正相关,说明该文方法能够有效解决候选义原选择问题。 展开更多
关键词 义原推荐 相似性同构 知网
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部