期刊文献+
共找到397篇文章
< 1 2 20 >
每页显示 20 50 100
新一代人工智能背景下粒计算研究现状与展望
1
作者 张超 丁雨欣 +1 位作者 李文涛 徐伟华 《南京理工大学学报》 北大核心 2025年第3期265-277,共13页
新一代人工智能以大数据驱动为核心,呈现出深度学习、跨界融合、人机协同、群智开放和自主操控等新特征。然而,海量数据处理、多模态语义融合、模型可解释性以及隐私保护等问题亟需坚实的方法论支撑。作为人工智能的重要分支,粒计算从... 新一代人工智能以大数据驱动为核心,呈现出深度学习、跨界融合、人机协同、群智开放和自主操控等新特征。然而,海量数据处理、多模态语义融合、模型可解释性以及隐私保护等问题亟需坚实的方法论支撑。作为人工智能的重要分支,粒计算从多层次与多视角等维度建模。采用粒度粗化与粒度细化策略,粒计算通过以满意近似解替代精确解的方式为新一代人工智能背景下问题的分解与处理提供理论框架。首先,系统梳理粒计算的发展历程与核心概念。其次,对模糊集、粗糙集、三支决策、商空间、概念认知学习以及粒球计算等模型进行总结。然后,通过文献计量法,分析粒计算相关文献的发表数量、研究领域以及关键词共现叠加等。最后,对粒计算在新一代人工智能背景下所面临的机遇进行展望。 展开更多
关键词 粒计算 新一代人工智能 模糊集 粗糙集 三支决策 商空间 概念认知学习 粒球计算
在线阅读 下载PDF
融合高阶组结构信息的节点分类算法
2
作者 郑文萍 韩艺恒 刘美麟 《计算机科学》 北大核心 2025年第2期107-115,共9页
节点的局部邻域内通常存在具有特定局部连接模式且频繁出现的高阶组结构,这些组结构可以更准确地刻画节点拓扑特征,有助于理解网络的结构特征及节点间的交互模式。基于此,利用节点局部邻域内的高阶组结构特征计算节点间的结构相似性,并... 节点的局部邻域内通常存在具有特定局部连接模式且频繁出现的高阶组结构,这些组结构可以更准确地刻画节点拓扑特征,有助于理解网络的结构特征及节点间的交互模式。基于此,利用节点局部邻域内的高阶组结构特征计算节点间的结构相似性,并提出了一种融合高阶组结构信息的节点分类算法NHGS(Node Classification Algorithm Fusing High-order Group Structure Information)。该算法将k元组内形成的不同构的导出子图作为其初始组标签,利用Weisfeiler-Lehman(WL)算法迭代地聚合其邻域k元组的标签信息以更新k元组标签;节点在不同k元组标签中的出现次数构成了节点的特征向量,利用节点间特征向量的相似性表示节点间的结构相似性;结合节点的属性信息,并通过自编码器神经网络得到节点嵌入,进而对网络中的节点进行分类。NHGS将节点局部邻域内的k元节点组结构信息与节点的属性信息相结合,得到了包含高阶结构信息的节点表示。在真实属性网络上的实验表明,所提方法能有效计算出节点间的结构相似性,提升了节点分类任务的性能。 展开更多
关键词 节点分类 高阶结构 结构相似性 网络表示 图神经网络
在线阅读 下载PDF
多尺度信息系统下基于证据理论的三支多属性决策建模
3
作者 李瑞 张超 李德玉 《小型微型计算机系统》 北大核心 2025年第9期2082-2089,共8页
多尺度信息系统为智能决策提供多个粒度层次的数据信息.本文旨在克服单尺度信息系统的局限,改进三支决策的主观性缺陷,并解决D-S证据理论在处理高度冲突证据时的矛盾问题,进而探索三支多属性决策方法.首先,提出基于熵权法的多尺度信息... 多尺度信息系统为智能决策提供多个粒度层次的数据信息.本文旨在克服单尺度信息系统的局限,改进三支决策的主观性缺陷,并解决D-S证据理论在处理高度冲突证据时的矛盾问题,进而探索三支多属性决策方法.首先,提出基于熵权法的多尺度信息系统融合模型,以综合考虑各尺度的重要性.其次,将灰色关联度融入TOPSIS法,获取备选方案的评价值,并作为三支决策的条件概率.然后,利用D-S证据理论和信息散度融合三支决策的多组阈值,以获得最终决策结果.最后,通过高等教育综合评估数据集验证该方法在人才评价中的可行性与有效性.本文模型丰富了多尺度信息系统、三支决策、证据理论和信息散度的理论,并有效降低了多属性决策的风险. 展开更多
关键词 粒计算 多尺度信息系统 三支决策 D-S证据理论 信息散度
在线阅读 下载PDF
从人类智能到机器实现模型——粒计算理论与方法 被引量:71
4
作者 苗夺谦 张清华 +7 位作者 钱宇华 梁吉业 王国胤 吴伟志 高阳 商琳 顾沈明 张红云 《智能系统学报》 CSCD 北大核心 2016年第6期743-757,共15页
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,是对人的意识、思维过程的模拟。粒计算是当前智能信息处理领域中一种新的概念和计算范式,是研究基于多层次粒结构的思维方式、复杂... 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,是对人的意识、思维过程的模拟。粒计算是当前智能信息处理领域中一种新的概念和计算范式,是研究基于多层次粒结构的思维方式、复杂问题求解、信息处理模式及其相关理论、技术和工具的方法论。本文首先分析了人工智能模拟人脑智能的粒计算模式与方法,其次总结了粗糙集、商空间、模糊集、云模型、三支决策等几种典型的粒计算基本构架与数学模型,然后分析知识的多粒度解析表示与不确定性度量的研究现状,最后展望了粒计算求解模式在大数据时代所面临的机遇与挑战。 展开更多
关键词 人工智能 大数据 不确定性 粒计算 多粒度 粗糙集 商空间 模糊集 云模型 三支决策
在线阅读 下载PDF
融入模体信息的多层网络社区发现算法
5
作者 赵兴旺 张超 梁吉业 《南京大学学报(自然科学版)》 CSCD 北大核心 2024年第6期954-969,共16页
多层网络社区发现算法旨在揭示复杂网络中蕴含的社区结构,近年来得到了广泛关注,然而现有算法在度量节点相似度的过程中往往只关注网络中的低阶结构信息,忽略了高阶结构信息,而且,在对不同层网络进行融合的过程中也没有考虑不同层之间... 多层网络社区发现算法旨在揭示复杂网络中蕴含的社区结构,近年来得到了广泛关注,然而现有算法在度量节点相似度的过程中往往只关注网络中的低阶结构信息,忽略了高阶结构信息,而且,在对不同层网络进行融合的过程中也没有考虑不同层之间的差异性.针对以上问题,提出一种融入模体信息的多层网络社区发现算法.首先,各层分别计算融入模体的高阶邻接矩阵,通过与低阶邻接矩阵融合得到重构矩阵,进而基于邻居重要性对重构矩阵进行提升,得到节点相似度矩阵;其次,基于重构矩阵计算各层网络的重要性,再加权融合得到统一的相似度矩阵;最后,基于统一的相似度矩阵得到节点的影响力,通过节点嵌入表示方法,对节点的向量表示进行迭代更新,得到节点的最终嵌入表示.与已有的传统多层网络社区发现算法进行了对比实验,结果表明,提出的算法的多层模块度和标准化互信息等评价指标均优于已有算法. 展开更多
关键词 多层网络 社区发现 高阶信息 节点相似度 嵌入表示
在线阅读 下载PDF
融合二连通模体结构信息的节点分类算法
6
作者 郑文萍 葛慧琳 +1 位作者 刘美麟 杨贵 《计算机应用》 CSCD 北大核心 2024年第5期1464-1470,共7页
节点表示学习将图结构数据信息编码到低维的潜在空间中,在节点分类、聚类、链路预测等机器学习任务中被广泛应用。在复杂网络中,节点与节点之间不仅存在直接相连的低阶结构,也存在以特殊连接模式形成的高阶结构,称为模体。提出一种融合... 节点表示学习将图结构数据信息编码到低维的潜在空间中,在节点分类、聚类、链路预测等机器学习任务中被广泛应用。在复杂网络中,节点与节点之间不仅存在直接相连的低阶结构,也存在以特殊连接模式形成的高阶结构,称为模体。提出一种融合二连通模体结构信息的节点分类算法(FMI),利用节点间高阶二连通模体信息学习节点表示,完成节点分类任务。首先,统计网络中的二连通模体,利用其中信息提出一个节点重要性的度量指标——模体比值。根据模体比值计算采样概率进行邻域采样;构造一个带权辅助图以融合网络节点连接的低阶关系与高阶关系,对节点进行加权邻域聚合以得到节点表示。在5个数据集Cora、Citeseer、Pubmed、Wiki和DBLP上执行节点分类任务,与5种经典基准算法进行对比,所提算法FMI在准确度和F1-分数等指标上表现良好。 展开更多
关键词 节点表示 二连通模体 邻域采样 邻域聚合 节点分类
在线阅读 下载PDF
融合目标词上下文序列与结构信息的框架识别方法 被引量:1
7
作者 闫智超 李茹 +4 位作者 苏雪峰 李欣杰 柴清华 韩孝奇 赵云肖 《中文信息学报》 CSCD 北大核心 2024年第1期86-96,共11页
框架识别是框架语义角色标注的重要前提,该任务是为给定句子中的目标词寻找一个可激活的框架。框架识别通常看作是针对目标词的分类问题,一般采用序列建模的方式学习融合上下文的目标词表示。该方式忽略了目标词所在上下文的结构信息,... 框架识别是框架语义角色标注的重要前提,该任务是为给定句子中的目标词寻找一个可激活的框架。框架识别通常看作是针对目标词的分类问题,一般采用序列建模的方式学习融合上下文的目标词表示。该方式忽略了目标词所在上下文的结构信息,且在建模时未考虑不同词性目标词在句法和语义结构上的差异。针对这些不足,该文提出了一种融合目标词上下文序列与结构信息的框架识别方法,该方法使用BERT和GCN分别对不同词性目标词的上下文信息和融合PropBank语义角色或依存句法结构信息的目标词进行建模,然后得到融合序列和结构信息的目标词表示。另外,该文分析了不同词性目标词依存信息的结构差异,采用一种集成学习方法克服了单一模型在此方面的不足。最后,在FN1.7和CFN数据集上的实验结果表明,融合目标词上下文序列与结构信息的框架识别方法在性能上优于当前最好模型。 展开更多
关键词 框架识别 语义角色 依存句法 BERT GCN
在线阅读 下载PDF
基于彩色图像高频信息引导的深度图超分辨率重建算法研究 被引量:2
8
作者 李嘉莹 梁宇栋 +2 位作者 李少吉 张昆鹏 张超 《计算机科学》 CSCD 北大核心 2024年第7期197-205,共9页
深度图像信息是三维场景信息的重要组成部分,然而,由于采集设备的局限性和成像环境的多样性,深度传感器获取的深度图像往往分辨率较低、高频信息较少,限制了其在各种计算机视觉任务中的进一步应用。深度图超分辨率试图提高深度图的分辨... 深度图像信息是三维场景信息的重要组成部分,然而,由于采集设备的局限性和成像环境的多样性,深度传感器获取的深度图像往往分辨率较低、高频信息较少,限制了其在各种计算机视觉任务中的进一步应用。深度图超分辨率试图提高深度图的分辨率,是一项实用而有价值的任务。同一场景下的RGB图像分辨率高,纹理信息丰富,部分深度图超分辨率算法通过引入来自同一场景下的RGB图像提供指导信息,实现了算法性能的显著提升。然而,由于RGB图像和深度图之间的模态不一致,如何充分、有效地利用RGB信息辅助深度图像进行图像超分辨率重建仍然极具挑战。为此,提出了一种基于彩色图像高频信息引导的深度图超分辨率重建算法。具体地,设计了一个高频特征提取模块来自适应地学习彩色图像中的高频信息,以指导深度图边缘的重建。另外,设计了一个特征自注意力模块来获取特征之间的全局依赖,同时提取更深层次的特征,以帮助深度图细节信息的恢复。经过跨模态融合,重组深度图像特征和彩色图像引导特征,并使用多尺度特征融合模块融合不同尺度特征之间的空间结构信息,获取包含多级感受野的重建信息。最后,通过深度重建模块,恢复相应的高分辨率深度图。公开数据集上的实验结果表明所提方法在定量和定性两方面均优于对比方法,验证了所提方法的有效性。 展开更多
关键词 深度图超分重建 深度学习 跨模态特征融合 高频信息 自注意力机制
在线阅读 下载PDF
基于标签语义信息感知的少样本命名实体识别方法 被引量:1
9
作者 张越 王长征 +4 位作者 苏雪峰 闫智超 张广军 邵文远 李茹 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第3期413-421,共9页
在少样本命名实体识别方法中,目前广泛应用的方法是基于原型网络的两阶段模型。但是,该方法未充分利用实体标签中的语义信息,且在距离计算中过度依赖实体类型原型向量,导致模型泛化能力差。针对这些问题,提出一种基于标签语义信息感知... 在少样本命名实体识别方法中,目前广泛应用的方法是基于原型网络的两阶段模型。但是,该方法未充分利用实体标签中的语义信息,且在距离计算中过度依赖实体类型原型向量,导致模型泛化能力差。针对这些问题,提出一种基于标签语义信息感知的少样本命名实体识别方法。该方法是一种先进行实体跨度检测,再判断实体类型的两阶段方法。在构建实体类型原型向量时,将对应实体类型包含的语义信息考虑在内,通过维度转换层将其与原型向量相融合。在对新样本进行实体识别时,将实体类型的正负样本与实体类型原型向量组成实体类型三元组,依据样本到三元组的距离对其进行分类。在多个数据集上的实验结果证明,该模型的性能比以往的模型有较大的提升。 展开更多
关键词 少样本命名实体识别 标签语义信息感知 实体类型三元组 原型网络
在线阅读 下载PDF
融合描述信息和结构特征的知识图谱链接预测 被引量:1
10
作者 陈加兴 胡志伟 +3 位作者 李茹 韩孝奇 卢江 闫智超 《计算机科学与探索》 CSCD 北大核心 2024年第2期486-495,共10页
知识图谱普遍存在知识不完整的问题,这使得链接预测成为知识图谱的重要研究内容。现有模型仅关注三元组的嵌入表示,一方面,在模型的输入仅对实体和关系的嵌入表示进行随机初始化,并未融入实体及关系的描述信息,会缺失语义信息;另一方面... 知识图谱普遍存在知识不完整的问题,这使得链接预测成为知识图谱的重要研究内容。现有模型仅关注三元组的嵌入表示,一方面,在模型的输入仅对实体和关系的嵌入表示进行随机初始化,并未融入实体及关系的描述信息,会缺失语义信息;另一方面,在解码时忽略三元组自身结构特征对链接预测结果的影响。针对上述问题,提出一种融合描述信息与结构特征的知识图谱链接预测模型BFGAT。BFGAT模型利用BERT预训练模型编码实体和关系的描述信息,并将描述信息融入到实体与关系的嵌入表示中,解决缺失语义信息的问题;在编码过程使用图注意力机制聚合邻接节点的信息,解决目标节点获得更为丰富信息的问题;在解码过程把三元组的嵌入表示拼接成矩阵,采用基于CNN卷积池化的方法,解决三元组结构特征的问题。该模型在公开数据集FB15k-237和WN18RR上进行了详细的实验,实验表明BFGAT模型能有效提高知识图谱链接预测的效果。 展开更多
关键词 知识图谱 链接预测 BERT 卷积神经网络(CNN)
在线阅读 下载PDF
基于框架语义分析的汉语句子相似度计算 被引量:47
11
作者 李茹 王智强 +2 位作者 李双红 梁吉业 Collin Baker 《计算机研究与发展》 EI CSCD 北大核心 2013年第8期1728-1736,共9页
句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语... 句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语义分析、框架的重要度度量、框架的相似匹配、框架间相似度计算等关键步骤来实现句子语义的相似度量.其中多框架语义分析是从框架角度对句子中的所有目标词进行识别、框架选择及框架元素标注,从而达到全面刻画句子语义的目的;在此基础上根据句子中框架的语义覆盖范围对不同框架的重要度进行区分,能够使得相似度结果更准确.在包含多目标词的句子集上的实验结果显示,基于多框架语义分析的句子相似度计算方法相对传统方法获得了更好的测试结果. 展开更多
关键词 汉语框架网 多框架语义分析 句子语义相似度 框架相似度 框架重要度
在线阅读 下载PDF
基于汉语框架网的旅游信息问答系统设计 被引量:14
12
作者 李茹 王文晶 +3 位作者 梁吉业 宋小香 刘海静 由丽萍 《中文信息学报》 CSCD 北大核心 2009年第2期34-40,共7页
该文借助汉语框架网(Chinese Frame Net,简称CFN)在语义表达方面的独特优势,探讨用本体描述语言建立面向特定领域的汉语框架语义知识库,并且以旅游交通领域中问答系统设计为例分析方法的有效性。方法中首先利用TREC分类与本体分类相结... 该文借助汉语框架网(Chinese Frame Net,简称CFN)在语义表达方面的独特优势,探讨用本体描述语言建立面向特定领域的汉语框架语义知识库,并且以旅游交通领域中问答系统设计为例分析方法的有效性。方法中首先利用TREC分类与本体分类相结合的方式为查询问句分类,然后提出基于CFN的问句分析策略,通过CFN语义分析得到问句中三元组:语义谓词、语义主体和语义客体,在问句分析的基础上从旅游本体知识库中对答案进行抽取并对答案处理,同时用本体编辑工具Protégé编码,实验证实方法是有效的。 展开更多
关键词 计算机应用 中文信息处理 汉语框架网 本体 问答系统
在线阅读 下载PDF
基于信息融合的概率矩阵分解链路预测方法 被引量:12
13
作者 王智强 梁吉业 李茹 《计算机研究与发展》 EI CSCD 北大核心 2019年第2期306-318,共13页
作为一种典型的网络大数据,社交信息网络如微博、Tweeter等,不仅包含用户间复杂的网络结构,而且包含大量用户所发表的微博/Tweet信息.现有链路预测算法大多只利用单方面的网络拓扑信息或非拓扑信息,仍然缺乏有效融合社交信息网络中拓扑... 作为一种典型的网络大数据,社交信息网络如微博、Tweeter等,不仅包含用户间复杂的网络结构,而且包含大量用户所发表的微博/Tweet信息.现有链路预测算法大多只利用单方面的网络拓扑信息或非拓扑信息,仍然缺乏有效融合社交信息网络中拓扑与非拓扑信息的链路预测方法.为此,从社交信息网络中用户的主题角度出发,提出一种融合主题相似信息的链路预测方法.首先基于用户文本内容抽取用户的主题表示,并定义用户间的主题相似度;然后基于用户主题相似度,构建了一种用户主题相似稀疏网络;进一步将用户主题相似网络与用户间关注/被关注网络融合在统一的概率矩阵分解框架下,通过学习获得用户的潜在特征表示和网络链路参数;最终在此概率矩阵分解框架下,基于用户的潜在特征表示和链路参数计算得到用户间的链路可能性.所提出的模型提供了一种融合多种网络信息的通用策略和学习方法.实验在包含网络结构与文本信息的4组微博与推特数据集中显示,所提出的融合概率矩阵分解链路方法相比其他链路预测方法更有效. 展开更多
关键词 社交信息网络 链路预测 概率矩阵分解 融合模型 网络数据分析
在线阅读 下载PDF
一种基于信息熵的混合数据属性加权聚类算法 被引量:44
14
作者 赵兴旺 梁吉业 《计算机研究与发展》 EI CSCD 北大核心 2016年第5期1018-1028,共11页
同时兼具数值型和分类型属性的混合数据在实际应用中普通存在,混合数据的聚类分析越来越受到广泛的关注.为解决高维混合数据聚类中属性加权问题,提出了一种基于信息熵的混合数据属性加权聚类算法,以提升模式发现的效果.工作主要包括:首... 同时兼具数值型和分类型属性的混合数据在实际应用中普通存在,混合数据的聚类分析越来越受到广泛的关注.为解决高维混合数据聚类中属性加权问题,提出了一种基于信息熵的混合数据属性加权聚类算法,以提升模式发现的效果.工作主要包括:首先为了更加准确客观地度量对象与类之间的差异性,设计了针对混合数据的扩展欧氏距离;然后,在信息熵框架下利用类内信息熵和类间信息熵给出了聚类结果中类内抱团性及一个类与其余类分离度的统一度量机制,并基于此给出了一种属性重要性度量方法,进而设计了一种基于信息熵的属性加权混合数据聚类算法.在10个UCI数据集上的实验结果表明,提出的算法在4种聚类评价指标下优于传统的属性未加权聚类算法和已有的属性加权聚类算法,并通过统计显著性检验表明本文提出算法的聚类结果与已有算法聚类结果具有显著差异性. 展开更多
关键词 聚类分析 混合数据 属性加权 信息熵 相异性度量
在线阅读 下载PDF
基于极端评分行为的相似度计算 被引量:4
15
作者 冯晨娇 梁吉业 +1 位作者 宋鹏 王智强 《计算机科学》 CSCD 北大核心 2020年第2期31-36,共6页
随着互联网技术的迅猛发展,互联网信息急剧增长,信息过载问题愈发凸显。面对海量的互联网信息,用户往往需要耗费大量的时间来搜索所需的信息或产品,而搜索的解往往受到制约。为解决信息过载问题,推荐系统应运而生。推荐系统根据用户的... 随着互联网技术的迅猛发展,互联网信息急剧增长,信息过载问题愈发凸显。面对海量的互联网信息,用户往往需要耗费大量的时间来搜索所需的信息或产品,而搜索的解往往受到制约。为解决信息过载问题,推荐系统应运而生。推荐系统根据用户的历史行为推测其需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户。作为推荐领域中一类重要的推荐方法,基于记忆的协同过滤方法通常依据用户或产品的近邻信息来构造评分预测函数,其核心在于准确度量用户或产品之间的相似度。传统的相似度量,如皮尔逊、余弦及秩相关系数等,通常只考虑了用户之间的线性关系;而启发式相似度如基于3个特殊因子的PIP相似度及其改进方法,则只刻画了用户之间的非线性关系。事实上,在推荐系统中,就用户之间的相似关系而言,仅用线性或是非线性函数来度量均是不准确的。为了更为精细地刻画用户之间的相似程度,文中提出了基于非线性函数的用户极端评分行为的相似程度度量指数,通过将该指数融入传统的线性相关系数,构造了一个考虑极端评分行为的新的相似度。为验证该方法的有效性,基于Ml(100k)和Ml-latest-small两个数据集,将其与传统相似度以及启发式相似度进行比较,结果显示基于极端评分行为相似度的协同过滤方法在MAE和RMSE指标上能够获得更好的表现。 展开更多
关键词 推荐系统 协同过滤 基于记忆的协同过滤 极端评分行为 相似度
在线阅读 下载PDF
基于混合语言信息的词语搭配倾向判别方法 被引量:8
16
作者 王素格 杨安娜 《中文信息学报》 CSCD 北大核心 2010年第3期69-74,共6页
具有较强褒贬倾向的词语搭配对于文本的情感分析具有重要的价值。该文提出了一种混合语言信息的词语搭配的倾向判别方法。该方法首先根据词语搭配六种模式的特点,确定出各模式的概率潜在语义模型,然后利用这些语义模型判别搭配的情感倾... 具有较强褒贬倾向的词语搭配对于文本的情感分析具有重要的价值。该文提出了一种混合语言信息的词语搭配的倾向判别方法。该方法首先根据词语搭配六种模式的特点,确定出各模式的概率潜在语义模型,然后利用这些语义模型判别搭配的情感倾向。最后对部分包含情感词的搭配再利用规则修正其先前标注的情感倾向。基于汽车语料的实验结果表明,基于混合语言信息的词语搭配情感倾向判别方法优于单纯基于概率潜在语义模型或规则的方法。 展开更多
关键词 计算机应用 中文信息处理 词语搭配 搭配模式 情感倾向判别 概率潜在语义模型
在线阅读 下载PDF
基于非完备信息系统的评价对象情感聚类 被引量:2
17
作者 王素格 尹学倩 +2 位作者 李茹 张杰 吕云云 《中文信息学报》 CSCD 北大核心 2012年第4期98-102,108,共6页
该文利用领域本体对产品评论文本中的评价对象进行抽取和整合,在此基础上,建立产品性能的非完备信息系统,将特征的情感倾向寓于特征的权重计算之中。对非完备信息系统,给出了基于差别矩阵的启发式特征约简方法,通过特征降维处理,达到了... 该文利用领域本体对产品评论文本中的评价对象进行抽取和整合,在此基础上,建立产品性能的非完备信息系统,将特征的情感倾向寓于特征的权重计算之中。对非完备信息系统,给出了基于差别矩阵的启发式特征约简方法,通过特征降维处理,达到了减少特征的冗余度和数据稀疏性的目的。对降维后的非完备信息系统采用K-Means聚类算法,实现了评价对象情感聚类。为了验证该文提出方法的有效性,在真实汽车评论文本数据上进行实验,实验结果表明,在对特征进行一定程度的降维后,仍表现出较好的聚类效果。 展开更多
关键词 非完备信息系统 评价对象 本体 特征降维 聚类
在线阅读 下载PDF
信息系统中的知识距离与知识粗糙熵 被引量:10
18
作者 王宝丽 梁吉业 《计算机科学》 CSCD 北大核心 2007年第3期151-154,共4页
本文基于知识即划分的观点,证明了论域中所有知识构成一个距离空间,研究了知识距离空间中知识距离的一些性质,并应用知识距离度量信息系统中知识的粗糙熵。这些结果有利于更加深刻地分析信息系统中知识间的关系和知识的粗糙性。
关键词 信息系统 知识距离 粗糙熵
在线阅读 下载PDF
以互补条件熵为启发信息的正域属性约简 被引量:2
19
作者 魏巍 陈红星 王锋 《计算机工程与应用》 CSCD 2013年第11期96-100,共5页
属性约简是一种特殊的特征选择方法,是粗糙集理论中的核心内容之一。正域约简是一类常见的启发式的约简方法,它通常采用前向贪婪搜索策略产生候选的属性子集,以相对正域作为启发信息和停止条件。根据互补条件熵的随划分的变化规律,分四... 属性约简是一种特殊的特征选择方法,是粗糙集理论中的核心内容之一。正域约简是一类常见的启发式的约简方法,它通常采用前向贪婪搜索策略产生候选的属性子集,以相对正域作为启发信息和停止条件。根据互补条件熵的随划分的变化规律,分四种情况分析了约简过程中某个属性加入属性子集后,相对正域和互补条件熵的变化,并在此基础上提出了一种以互补熵为启发信息的正域属性约简方法。实验分析表明,新方法与传统的正域约简算法相比,可以得到属性数量更少且决策性能非常接近的约简,同时可以有效地提高约简计算效率。 展开更多
关键词 粗糙集 属性约简 互补熵 正域
在线阅读 下载PDF
一种基于先验信息的混合数据聚类个数确定算法 被引量:3
20
作者 庞天杰 赵兴旺 《计算机科学》 CSCD 北大核心 2016年第2期101-104,共4页
聚类个数的确定是聚类分析中一个富有挑战性的难题。现有的聚类个数确定方法主要采用随机选取初始聚类中心的策略,导致聚类过程中迭代次数的稳定性不强。基于此,在利用含有类标签的先验信息优化初始类中心的基础上,提出了一种基于先验... 聚类个数的确定是聚类分析中一个富有挑战性的难题。现有的聚类个数确定方法主要采用随机选取初始聚类中心的策略,导致聚类过程中迭代次数的稳定性不强。基于此,在利用含有类标签的先验信息优化初始类中心的基础上,提出了一种基于先验信息的混合数据聚类个数确定算法。实验证明,该算法是有效的。 展开更多
关键词 聚类分析 聚类个数 混合数据 先验信息 最大最小距离
在线阅读 下载PDF
上一页 1 2 20 下一页 到第
使用帮助 返回顶部