期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于潜在语义模型的SVM入侵检测研究
1
作者 杨清 李方敏 《计算机工程与应用》 CSCD 北大核心 2007年第5期143-145,152,共4页
论文提出了一种基于潜在语义索引(LSI)和支持向量机(SVM)的异常入侵检测方法。选取PARPA’98BSM数据集作为训练数据和测试数据,通过实验比较和分析表明:基于LSI和SVM方法的入侵检测系统具有较高的检测率和较低的虚警率,且能大大减低计... 论文提出了一种基于潜在语义索引(LSI)和支持向量机(SVM)的异常入侵检测方法。选取PARPA’98BSM数据集作为训练数据和测试数据,通过实验比较和分析表明:基于LSI和SVM方法的入侵检测系统具有较高的检测率和较低的虚警率,且能大大减低计算的复杂性,是一种有效的异常识别和检测方法。 展开更多
关键词 入侵检测 支持向量机 潜在语义模型
在线阅读 下载PDF
基于共现潜在语义向量空间模型的语义核构建 被引量:10
2
作者 牛奉高 张亚宇 《情报学报》 CSSCI CSCD 北大核心 2017年第8期834-842,共9页
实现数字图书馆资源聚合的知识发现离不开对知识的有效表示。作为经典的文本表示模型,向量空间模型(VSM)及其衍生模型在信息检索以及知识发现等研究中都有着重要的地位,但依然存在不足。共现潜在语义向量空间模型(CLSVSM)作为新的文本... 实现数字图书馆资源聚合的知识发现离不开对知识的有效表示。作为经典的文本表示模型,向量空间模型(VSM)及其衍生模型在信息检索以及知识发现等研究中都有着重要的地位,但依然存在不足。共现潜在语义向量空间模型(CLSVSM)作为新的文本表示模型,与VSM相比明显提高了文本聚类的精度。然而,面对文本大数据的应用,共现矩阵维度往往较高,致使模型的计算复杂度也较大。因此,本文在CLSVSM基础上构建了语义核(CLSVSM_K),构建的原理是基于潜在语义分析(LSA)的思想。CLSVSM_K不仅降低了共现矩阵的维度,而且实现了文本特征词之间同义信息的合并。本文将该语义核模型应用于文献的主题聚类中,实验结果表明,该方法的确有效降低了特征词空间的维度和计算的复杂度,提高了聚类算法的性能,且提高了文献主题聚类的精确度。该模型的应用将有助于数字图书馆信息资源组织、知识发现和知识优化。 展开更多
关键词 共现在语义向量空间模型 语义 共现在语义向量空间模型语义 文本聚类
在线阅读 下载PDF
基于概率潜在语义分析的群体情绪演进分析 被引量:4
3
作者 林江豪 周咏梅 +2 位作者 阳爱民 陈昱宏 陈晓帆 《计算机应用》 CSCD 北大核心 2015年第10期2747-2751,2756,共6页
针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句... 针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句法关系和情感本体库,抽取与话题内容相匹配群体情绪单元,计算情绪单元的强度,形成情绪特征向量;最后,对各子话题下的情绪强度进行求和,细粒度分析子话题和事件的整体群体情绪,深入挖掘群体情绪演进规律,并将群体情绪量化和可视化。在话题情绪单元抽取过程中,引入了句法规则和情感本体库,更细粒度地抽取情绪单元,并提高了话题内容与情绪单元匹配的准确性。实验结果表明,该模型能够实现话题内容及其群体情绪按时序特征的演进分析,验证了所提方法的有效性。 展开更多
关键词 群体情绪 概率在语义分析模型 话题挖掘 情绪演进 情绪分析
在线阅读 下载PDF
一种基于上下文语义信息的图像块视觉单词生成算法 被引量:41
4
作者 刘硕研 须德 +2 位作者 冯松鹤 刘镝 裘正定 《电子学报》 EI CAS CSCD 北大核心 2010年第5期1156-1161,共6页
基于视觉单词的词包模型表示(Bag-of-Words)算法是目前场景分类中的主流方法.传统的视觉单词是通过无监督聚类图像块的特征向量得到的.针对传统视觉单词生成算法中没有考虑任何语义信息的缺点,本论文提出一种基于上下文语义信息的图像... 基于视觉单词的词包模型表示(Bag-of-Words)算法是目前场景分类中的主流方法.传统的视觉单词是通过无监督聚类图像块的特征向量得到的.针对传统视觉单词生成算法中没有考虑任何语义信息的缺点,本论文提出一种基于上下文语义信息的图像块视觉单词生成算法:首先,本文中使用的上下文语义信息是视觉单词之间的语义共生概率,它是由概率潜在语义分析模型(probabilistic Latent Semantic Analysis)自动分析得到,无需任何人工标注.其次,我们引入Markov随机场理论中类别标记的伪似然度近似的策略,将图像块在特征域的相似性同空间域的上下文语义共生关系有机地结合起来,从而更准确地为图像块定义视觉单词.最后统计视觉单词的出现频率作为图像的场景表示,利用支持向量机分类器完成图像的场景分类任务.实验结果表明,本算法能有效地提高视觉单词的语义准确性,并在此基础上改善场景分类的性能. 展开更多
关键词 场景分类 视觉单词 概率在语义分析模型 MARKOV随机场模型 上下文语义信息
在线阅读 下载PDF
一种基于语义聚类的典型日负荷曲线选取方法 被引量:14
5
作者 孟令奎 段红伟 +1 位作者 黄长青 孙琤 《华北电力大学学报(自然科学版)》 CAS 北大核心 2013年第1期43-48,共6页
将典型日负荷曲线的选取问题转化为基于统计学习的多元分类问题,利用概率潜在语义分析模型(PLSA)进行问题求解。方法首先通过K均值聚类和负荷曲线时段划分形成观测特征词和目标文档,通过阈值计算获得特征词-目标共生矩阵;然后基于Davies... 将典型日负荷曲线的选取问题转化为基于统计学习的多元分类问题,利用概率潜在语义分析模型(PLSA)进行问题求解。方法首先通过K均值聚类和负荷曲线时段划分形成观测特征词和目标文档,通过阈值计算获得特征词-目标共生矩阵;然后基于Davies-Bouldin指标计算PLSA模型的最佳主题数目,并对模型参数求解获得每个目标文档中特征词的潜在主题;最后依据电力负荷曲线与特征词的对应关系形成新的聚类,并采用选取策略获得各聚类的典型日。实验表明,方法能够较好的反映节假日、气候等因素的影响,典型日选取合理可行。 展开更多
关键词 概率在语义分析模型 典型日负荷曲线 Davies—Bouldin指标
在线阅读 下载PDF
关于信息过滤模型的探讨 被引量:18
6
作者 张晓冬 张书杰 +1 位作者 邢俊丽 李俊玉 《计算机工程与应用》 CSCD 北大核心 2002年第5期99-100,236,共3页
信息过滤技术已是当今信息技术研究的热点。该文主要是针对信息过滤模型的研究,介绍了布尔模型、向量空间模型和潜在语义索引三种信息过滤模型。并就其概念、方法和意义进行了分析和讨论。
关键词 信息过滤模型 布尔模型 向量空间模型 在语义索引模型 奇异值分解 信息处理 计算机
在线阅读 下载PDF
基于近义词自适应软分配和卡方模型的图像目标分类方法 被引量:5
7
作者 赵永威 周苑 +1 位作者 李弼程 柯圣财 《电子学报》 EI CAS CSCD 北大核心 2016年第9期2181-2188,共8页
传统的视觉词典模型(Bag of Visual Words Model,Bo VWM)中广泛存在视觉单词同义性和歧义性问题.且视觉词典中的一些噪声单词—"视觉停用词",也会降低视觉词典的语义分辨能力.针对这些问题,本文提出了基于近义词自适应软分配... 传统的视觉词典模型(Bag of Visual Words Model,Bo VWM)中广泛存在视觉单词同义性和歧义性问题.且视觉词典中的一些噪声单词—"视觉停用词",也会降低视觉词典的语义分辨能力.针对这些问题,本文提出了基于近义词自适应软分配和卡方模型的图像目标分类方法.首先,该方法利用概率潜在语义分析模型(Probabilistic Latent Semantic Analysis,PLSA)分析图像中视觉单词的语义共生概率,挖掘图像隐藏的语义主题,进而得到语义主题在某一视觉单词上的概率分布;其次,引入K-L散度度量视觉单词间的语义相关性,获取语义相关的近义词;然后,结合自适应软分配策略实现SIFT特征点与若干语义相关的近义词之间的软映射;最后,利用卡方模型滤除"视觉停用词",重构视觉词汇分布直方图,并采用SVM分类器完成目标分类.实验结果表明,新方法能够有效克服视觉单词同义性和歧义性问题带来的不利影响,增强视觉词典的语义分辨能力,较好地改善了目标分类性能. 展开更多
关键词 视觉词典模型 概率在语义分析模型 K-L散度 卡方模型 目标分类
在线阅读 下载PDF
基于Stacking集成学习的水稻表型组学实体分类研究 被引量:24
8
作者 袁培森 杨承林 +2 位作者 宋玉红 翟肇裕 徐焕良 《农业机械学报》 EI CAS CSCD 北大核心 2019年第11期144-152,共9页
为研究整合水稻表型组学相关知识,系统地建立水稻表型组学知识图谱,通过分布式爬虫框架从国家水稻数据中心网站获取水稻表型组学数据集,并以互动百科为辅助数据源获取水稻表型组学数据。对水稻表型组学数据采用TF-IDF技术结合潜在语义... 为研究整合水稻表型组学相关知识,系统地建立水稻表型组学知识图谱,通过分布式爬虫框架从国家水稻数据中心网站获取水稻表型组学数据集,并以互动百科为辅助数据源获取水稻表型组学数据。对水稻表型组学数据采用TF-IDF技术结合潜在语义模型进行预处理,并对水稻表型组学实体进行人工分类和标注。为实现水稻表型组学实体分类,研究了基于堆叠式两阶段集成学习的分类器组合模型,结合K-近邻算法、支持向量机、随机森林、梯度提升决策树机器学习方法,提升水稻表型组学实体数据分类的性能。研究表明,基于堆叠式两阶段集成学习的分类器组合模型对不同类别的水稻表型组学数据都具有较好的多分类能力,对于不平衡的水稻表型组学数据集,本文方法的分类器组合模型对水稻表型组学数据分类效果最佳,Gene类别的F1为90.47%,总体准确率达80.55%,比支持向量机、K-近邻、随机森林和梯度提升决策树4种基分类器的分类准确率平均高6.78个百分点。 展开更多
关键词 水稻表型组学 实体分类 堆叠式集成学习 知识图谱 潜在语义模型
在线阅读 下载PDF
基于混合语言信息的词语搭配倾向判别方法 被引量:8
9
作者 王素格 杨安娜 《中文信息学报》 CSCD 北大核心 2010年第3期69-74,共6页
具有较强褒贬倾向的词语搭配对于文本的情感分析具有重要的价值。该文提出了一种混合语言信息的词语搭配的倾向判别方法。该方法首先根据词语搭配六种模式的特点,确定出各模式的概率潜在语义模型,然后利用这些语义模型判别搭配的情感倾... 具有较强褒贬倾向的词语搭配对于文本的情感分析具有重要的价值。该文提出了一种混合语言信息的词语搭配的倾向判别方法。该方法首先根据词语搭配六种模式的特点,确定出各模式的概率潜在语义模型,然后利用这些语义模型判别搭配的情感倾向。最后对部分包含情感词的搭配再利用规则修正其先前标注的情感倾向。基于汽车语料的实验结果表明,基于混合语言信息的词语搭配情感倾向判别方法优于单纯基于概率潜在语义模型或规则的方法。 展开更多
关键词 计算机应用 中文信息处理 词语搭配 搭配模式 情感倾向判别 概率潜在语义模型
在线阅读 下载PDF
基于兴趣的社交网络用户聚类及可视化 被引量:3
10
作者 汤颖 钟南江 +2 位作者 孙康高 秦大康 周伟华 《计算机科学》 CSCD 北大核心 2017年第B11期385-390,427,共7页
随着社交网络的流行,从各种各样的社交网络数据中提取出有效信息并进行清晰直观的可视化分析,从而为用户提供有价值的潜在知识,显得尤为重要。聚类分析是数据挖掘中的重要分析手段,传统的面向社交网络数据的用户聚类分析大都仅考虑网络... 随着社交网络的流行,从各种各样的社交网络数据中提取出有效信息并进行清晰直观的可视化分析,从而为用户提供有价值的潜在知识,显得尤为重要。聚类分析是数据挖掘中的重要分析手段,传统的面向社交网络数据的用户聚类分析大都仅考虑网络的拓扑链接结构,未考虑用户的兴趣相似度。文中基于贝叶斯概率模型来计算用户兴趣相似度并进行聚类,进一步设计交互可视化方式来展示上述聚类结果。具体地,针对社交网络中的用户评分数据建立潜在语义模型来提取表示每个用户兴趣特点的特征向量;基于用户的特征向量对用户进行聚类,得到具有不同特征的人群,并通过实验和热度图选择合适的人群聚类数;最后提出了基于层次气泡图的可视化展现和分析方案,将用户、电影类型、电影等多维信息在图形中交互展示,支持用户从全局概览到局部细节的推进式探索,从多角度可视化人群特征。对豆瓣网用户和电影评分数据进行了实验和分析,结果验证了所提方法的有效性。 展开更多
关键词 社交网络 聚类 数据可视化 潜在语义模型
在线阅读 下载PDF
基于注意力机制的改进CLSM检索式匹配问答方法 被引量:2
11
作者 于重重 曹帅 +2 位作者 潘博 张青川 徐世璇 《计算机应用》 CSCD 北大核心 2019年第4期972-976,共5页
针对检索式匹配问答模型对中文语料适应性弱和句子语义信息被忽略的问题,提出一种基于卷积神经网络潜在语义模型(CLSM)的中文文本语义匹配模型。首先,在传统CLSM基础上进行改进,去掉单词和字母的N元模型层,以增强模型对中文语料的适应性... 针对检索式匹配问答模型对中文语料适应性弱和句子语义信息被忽略的问题,提出一种基于卷积神经网络潜在语义模型(CLSM)的中文文本语义匹配模型。首先,在传统CLSM基础上进行改进,去掉单词和字母的N元模型层,以增强模型对中文语料的适应性;其次,采用注意力机制算法,针对输入的中文词向量信息建立实体关注层模型,以加强句中核心词的权重信息;最后,通过卷积神经网络(CNN)有效地捕获输入句子上下文结构方面信息,并通过池化层对获取的语义信息进行降维。基于医疗问答对数据集,将改进模型与传统语义模型、传统翻译模型、深度神经网络模型进行对比,实验结果显示所提模型在归一化折现累积增益(NDCG)方面有4~10个百分点的提升,优于对比模型。 展开更多
关键词 潜在语义模型 注意力机制 检索式匹配问答
在线阅读 下载PDF
企业智能化Web商务数据挖掘引擎算法设计与实现 被引量:6
12
作者 闫建红 《计算机工程与设计》 CSCD 北大核心 2007年第4期926-928,932,共4页
针对现有的数据挖掘引擎难以满足企业不断增长的需求的问题,在传统搜索引擎的基础上提出了一种企业专用的智能化Web商务数据挖掘引擎。从总体上给出了模型框架,得出企业智能化Web商务数据挖掘引擎是一个基于多模型的系统的结论。接着分... 针对现有的数据挖掘引擎难以满足企业不断增长的需求的问题,在传统搜索引擎的基础上提出了一种企业专用的智能化Web商务数据挖掘引擎。从总体上给出了模型框架,得出企业智能化Web商务数据挖掘引擎是一个基于多模型的系统的结论。接着分别详细研究了该引擎的:Web内容挖掘、Web信息获取、客户行为挖掘3个核心模块。 展开更多
关键词 WEB数据挖掘 客户行为挖掘 潜在语义模型 HITS算法 遗传算法 聚类分析
在线阅读 下载PDF
三种主题分割方法的对比研究 被引量:2
13
作者 石晶 李万龙 《计算机工程与应用》 CSCD 北大核心 2009年第18期135-138,151,共5页
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用。基于PLSA及LDA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系,而基于小世界模型的分割则依据小世界模型的短路径、高... 文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用。基于PLSA及LDA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系,而基于小世界模型的分割则依据小世界模型的短路径、高聚集性的特点实现片段边界的识别。从模型的特点、分割策略以及实验结果等角度对基于三种模型的分割进行对比。分析表明,基于LDA模型的分割比基于PLSA模型的分割具有更大的稳定性,且分割效果更好。基于小世界模型的分割策略更适合小世界模型特性明显的文本。 展开更多
关键词 文本分割 概率在语义分析模型 LDA模型 小世界模型
在线阅读 下载PDF
基于EICS-LBP与统计边缘主色对的场景分类算法
14
作者 胡正平 戎怡 《系统工程与电子技术》 EI CSCD 北大核心 2011年第4期919-924,共6页
针对场景分类问题,提出一种基于图像局部边缘区域的边缘改进中心对称二值模式(edge improvedcenter symmetric local binary pattern,EICS-LBP)与统计边缘主色对特征结合扩展潜在语义分析(probabilistic latent semantic analysis,PLSA... 针对场景分类问题,提出一种基于图像局部边缘区域的边缘改进中心对称二值模式(edge improvedcenter symmetric local binary pattern,EICS-LBP)与统计边缘主色对特征结合扩展潜在语义分析(probabilistic latent semantic analysis,PLSA)模型的场景分类算法。该方法首先提取图像局部边缘稠密采样区域的EICS-LBP与统计边缘主色对特征;然后对两类特征分别聚类形成视觉词汇表,进而用词袋模型描述图像;之后利用扩展PLSA模型对图像词袋模型进行潜在语义挖掘;最后利用K最近领域(K-nearest neighbors,KNN)分类器进行场景分类,得到测试图像集的混淆矩阵。多类场景图像的实验表明,该方法不需要对场景内容进行人工标注,具有较高的分类准确率,且对具有边缘轮廓的彩色图像分类精度较高。 展开更多
关键词 场景分类 局部二值模式 边缘特征 主色特征 视觉单词 扩展在语义分析模型
在线阅读 下载PDF
基于颜色属性的车辆阴影去除方法 被引量:4
15
作者 徐少飞 刘政怡 《计算机应用与软件》 CSCD 2016年第9期203-207,共5页
颜色属性,即语言颜色标签,可以表示世界中的所有颜色。视频帧图像中的阴影的颜色属性为黑色,因此提出一种基于颜色属性的车辆阴影去除方法。利用概率潜在语义模型学习颜色属性,建立颜色名概率字典,并实现对视频帧图像的颜色名映射,将表... 颜色属性,即语言颜色标签,可以表示世界中的所有颜色。视频帧图像中的阴影的颜色属性为黑色,因此提出一种基于颜色属性的车辆阴影去除方法。利用概率潜在语义模型学习颜色属性,建立颜色名概率字典,并实现对视频帧图像的颜色名映射,将表征阴影的黑色区域二值化为背景,而非阴影区域二值化为前景。同时,将二值化图与背景差分图进行"与"操作,去除阴影,再去除阴影外边缘的噪声。最后,对其进行先膨胀再连通域填充处理,以得到去除阴影后的车辆目标。实验证明,该方法在一定场景下可以很好地去除阴影,获得相对完整的运动车辆目标。 展开更多
关键词 颜色属性 概率在语义分析模型 阴影 颜色名映射
在线阅读 下载PDF
VSM与LSI中的正交假设 被引量:1
16
作者 李孟臣 《现代情报》 北大核心 2005年第8期223-224,F0003,共3页
向量空间模型(VSM)长期以来被用于文本检索,然而潜伏在其中的正交假设却迟迟未能得到解决。国内有些学者认为潜在语义索引模型(LSI)解决了这个问题。然而,本文作者通过对LSI的分析,认为正交假设在LSI中仍然存在。
关键词 向量空间模型 在语义索引模型 正交假设
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部