期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
Nave Bayes分类器制导的专业网页爬取算法 被引量:3
1
作者 韩国辉 陈黎 +3 位作者 梁时木 唐小棚 王亚强 于中华 《中文信息学报》 CSCD 北大核心 2010年第4期32-38,62,共8页
从Web中快速、准确地检索出所需信息的迫切需求催生了专业搜索引擎技术。在专业搜索引擎中,网络爬虫(Crawler)负责在Web上搜集特定专业领域的信息,是专业搜索引擎的重要核心部件。该文对中文专业网页的爬取问题进行了研究,基于KL距离验... 从Web中快速、准确地检索出所需信息的迫切需求催生了专业搜索引擎技术。在专业搜索引擎中,网络爬虫(Crawler)负责在Web上搜集特定专业领域的信息,是专业搜索引擎的重要核心部件。该文对中文专业网页的爬取问题进行了研究,基于KL距离验证了网页内容与链接前后文在分布上的差异,在此基础上提出了以链接锚文本及其前后文为特征、Nave Bayes分类器制导的中文专业网页爬取算法,设计了自动获取带链接类标的训练数据的算法。以金融专业网页的爬取为例,分别对所提出的算法进行了离线和在线测试,结果表明,Nave Bayes分类器制导的网络爬虫可以达到近90%的专业网页收割率。 展开更多
关键词 计算机应用 中文信息处理 搜索引擎 专业爬虫 nave bayesian classifier 链接前后文
在线阅读 下载PDF
文本分类系统SECTCS中若干技术问题的探讨 被引量:5
2
作者 唐焕玲 付克明 鲁明羽 《计算机工程与应用》 CSCD 北大核心 2003年第11期80-83,共4页
SECTCS是笔者在深入研究各种文本分类方法的基础上实现的一个中英文文本分类系统。它集成了质心分类、K近邻分类和朴素贝叶斯分类器等多种文本分类方法,在大规模文本分类实验中表现出良好的性能。该文结合以该系统作为测试平台所得到的... SECTCS是笔者在深入研究各种文本分类方法的基础上实现的一个中英文文本分类系统。它集成了质心分类、K近邻分类和朴素贝叶斯分类器等多种文本分类方法,在大规模文本分类实验中表现出良好的性能。该文结合以该系统作为测试平台所得到的各种实验结果,对系统中涉及的若干重要技术问题进行探讨和分析,力图得到一些有价值的结论,希望能够对相关研究工作提供可借鉴的依据。 展开更多
关键词 文本分类 VSM KNN naieve BAYES分类器
在线阅读 下载PDF
基于KL距离的非平衡数据半监督学习算法 被引量:11
3
作者 许震 沙朝锋 +1 位作者 王晓玲 周傲英 《计算机研究与发展》 EI CSCD 北大核心 2010年第1期81-87,共7页
在实际应用中,由于各种原因时常无法直接获得已标识反例,导致传统分类方法暂时失灵,因此,基于正例和未标识集的半监督学习顿时成了理论界研究的热点.研究者们提出了不同的解决方法,然而,这些方法都不能有效处理非平衡的分类问题,尤其当... 在实际应用中,由于各种原因时常无法直接获得已标识反例,导致传统分类方法暂时失灵,因此,基于正例和未标识集的半监督学习顿时成了理论界研究的热点.研究者们提出了不同的解决方法,然而,这些方法都不能有效处理非平衡的分类问题,尤其当隐匿反例非常少或训练集中的实例分布不均匀时.因此,提出了一种基于KL距离的半监督分类算法——LiKL:依次挖掘出未标识集中的最可靠正例和反例,接着使用训练好的增强型分类器来分类.与其他方法相比,不仅提高了分类的查准率和查全率,而且具有鲁棒性. 展开更多
关键词 半监督学习 非平衡 KL距离 朴素贝叶斯 LOGISTIC回归
在线阅读 下载PDF
基于高斯混合模型的遥感影像连续型朴素贝叶斯网络分类器 被引量:10
4
作者 陶建斌 舒宁 沈照庆 《遥感信息》 CSCD 2010年第2期18-24,29,共8页
提出了一种新的嵌入高斯混合模型(GMM,Gaussian Mixture Model)遥感影像朴素贝叶斯网络模型GMM-NBC(GMMbased Na ve Bayesian Classifier)。针对连续型朴素贝叶斯网络分类器中假设地物服从单一高斯分布的缺点,该方法将地物在特征空间的... 提出了一种新的嵌入高斯混合模型(GMM,Gaussian Mixture Model)遥感影像朴素贝叶斯网络模型GMM-NBC(GMMbased Na ve Bayesian Classifier)。针对连续型朴素贝叶斯网络分类器中假设地物服从单一高斯分布的缺点,该方法将地物在特征空间的分布用高斯混合模型来模拟,用改进EM算法自动获取高斯混合模型的参数;高斯混合模型整体作为一个子节点嵌入朴素贝叶斯网络中,将其输出作为节点(特征)的中间类后验概率,在朴素贝叶斯网络的框架下进行融合获得最终的类后验概率。对多光谱和高光谱数据的分类实验结果表明,该方法较传统贝叶斯分类器分类效果要好,且有较强的鲁棒性。 展开更多
关键词 朴素贝叶斯分类器 高斯混合模型 EM算法 子高斯 遥感影像 分类
在线阅读 下载PDF
基于朴素贝叶斯分类器的朝鲜语文本分类的研究 被引量:14
5
作者 周国强 崔荣一 《中文信息学报》 CSCD 北大核心 2011年第4期16-19,共4页
该文基于朴素贝叶斯分类器对朝鲜语文本分类进行了研究。首先,利用基于类别选择的特征选择方法对朝鲜语文本进行特征选择,并使用类TF-IDF估算方法计算权重;其次,构造朴素贝叶斯分类器;最后,利用分类器实现对朝鲜语文本的分类。实验表明... 该文基于朴素贝叶斯分类器对朝鲜语文本分类进行了研究。首先,利用基于类别选择的特征选择方法对朝鲜语文本进行特征选择,并使用类TF-IDF估算方法计算权重;其次,构造朴素贝叶斯分类器;最后,利用分类器实现对朝鲜语文本的分类。实验表明,该方法在朝鲜语文本分类中具有较好的效果,为朝汉结合文本分类提供了一定的依据。 展开更多
关键词 朝鲜语 朴素贝叶斯 文本分类 TF-IDF
在线阅读 下载PDF
基于贝叶斯信念网的网络流量分类与识别研究 被引量:3
6
作者 杨彩虹 黄本雄 《计算机应用与软件》 CSCD 2011年第1期216-219,共4页
网络流量分类识别技术是许多网络研究和应用领域的基础,但随着动态端口、端口伪装和信息加密等技术的使用,传统的纯端口识别法已不再有效。提出一种基于贝叶斯信念网的网络流量分类方法,通过使用有向无环图和结点概率表,很好地解决了流... 网络流量分类识别技术是许多网络研究和应用领域的基础,但随着动态端口、端口伪装和信息加密等技术的使用,传统的纯端口识别法已不再有效。提出一种基于贝叶斯信念网的网络流量分类方法,通过使用有向无环图和结点概率表,很好地解决了流属性之间条件独立的问题。对真实网络流量数据的测试结果表明,这种方法具有稳定可靠的分类识别效果。 展开更多
关键词 网络流量分类与识别 机器学习 朴素贝叶斯分类器 贝叶斯信念网
在线阅读 下载PDF
应用直线集合分割的软件缺陷预测模型 被引量:1
7
作者 包祎 王涛 裘国永 《计算机工程与应用》 CSCD 2013年第14期34-38,共5页
缺陷预测能够有效地提升软件测试的效率。基于朴素贝叶斯理论,提出了一个利用平面中点与直线几何关系进行分类的软件缺陷预测模型LGD-NB。LGD-NB有两种工作模式,当其基于最小风险进行决策时,比传统的朴素贝叶斯具有对代价更为精确的描述... 缺陷预测能够有效地提升软件测试的效率。基于朴素贝叶斯理论,提出了一个利用平面中点与直线几何关系进行分类的软件缺陷预测模型LGD-NB。LGD-NB有两种工作模式,当其基于最小风险进行决策时,比传统的朴素贝叶斯具有对代价更为精确的描述;在定义了几何上的高风险决策区域后,LGD-NB可作为元分类器,提供一个可集成其他分类模型进行二次分类的集成框架。实验结果显示:基于最小风险LGD-NB模型的预测性能优于传统的朴素贝叶斯;而集成了SVM算法后的LGD-NB,其预测能力也有较为明显的提升。 展开更多
关键词 软件缺陷预测 朴素贝叶斯 直线集合分割 元分类器 集成框架
在线阅读 下载PDF
面向企业应用的文本自动分类系统的设计和实现 被引量:1
8
作者 黄浩 王英林 《计算机应用与软件》 CSCD 北大核心 2007年第11期111-113,共3页
讲述了为单个企业提供文本自动分类服务的系统的设计和实现方法。对系统中所涉及的关键技术包括向量空间模型、特征提取、机器学习方法进行了讨论,给出了实验结果。
关键词 文本分类 向量空间模型 特征提取 朴素贝叶斯学习模型
在线阅读 下载PDF
基于Foley-Sammon变换的朴素贝叶斯分类器 被引量:1
9
作者 邹丽珊 陈振洲 《华南师范大学学报(自然科学版)》 CAS 北大核心 2011年第4期63-66,共4页
朴素贝叶斯分类器是机器学习领域中一种重要的分类算法,根据该算法的前提,利用Foley-Sammon变换算法进行特征提取,提出了一种基于Foley-Sammon变换的朴素贝叶斯分类器NBFST(Na ve Bayesian Classifier with Foley-Sammon Transform).结... 朴素贝叶斯分类器是机器学习领域中一种重要的分类算法,根据该算法的前提,利用Foley-Sammon变换算法进行特征提取,提出了一种基于Foley-Sammon变换的朴素贝叶斯分类器NBFST(Na ve Bayesian Classifier with Foley-Sammon Transform).结果表明,NBFST能够在大多数数据集上具有较高的分类准确率. 展开更多
关键词 Foley-Sammon变换 朴素贝叶斯 特征提取 条件独立 机器学习
在线阅读 下载PDF
基于减少相似主题分类错误的权重分配新策略
10
作者 唐焕玲 王敬东 陆玉昌 《计算机工程与应用》 CSCD 北大核心 2004年第13期185-188,共4页
文本分类的研究者一直在提高文本的分类精度方面做着不懈的努力,在实验中发现,相似主题的文档的分类错误率比较高,该文尝试着提出了一种二次权重分配的新的特征权值分配策略,构造了一种计算难以区分的主题类别的特征辨别能力的权值函数... 文本分类的研究者一直在提高文本的分类精度方面做着不懈的努力,在实验中发现,相似主题的文档的分类错误率比较高,该文尝试着提出了一种二次权重分配的新的特征权值分配策略,构造了一种计算难以区分的主题类别的特征辨别能力的权值函数,目的是减少相似主题类别的文档的分类错误。 展开更多
关键词 向量空间模型(VSM) 特征选择 权值调整 贝叶斯分类
在线阅读 下载PDF
一种基于粗糙集的特征加权朴素贝叶斯分类器 被引量:7
11
作者 王国才 张聪 《重庆理工大学学报(自然科学)》 CAS 2010年第7期86-90,105,共6页
朴素贝叶斯分类器是一种简单高效的分类算法,但其属性独立性假设影响了分类效果。通过放松朴素贝叶斯假设可以增强朴素贝叶斯的分类效果,但是通常会导致计算代价大幅提高。针对以上问题,提出了一种基于粗糙集的特征加权朴素贝叶斯算法,... 朴素贝叶斯分类器是一种简单高效的分类算法,但其属性独立性假设影响了分类效果。通过放松朴素贝叶斯假设可以增强朴素贝叶斯的分类效果,但是通常会导致计算代价大幅提高。针对以上问题,提出了一种基于粗糙集的特征加权朴素贝叶斯算法,加权参数直接从训练数据中学习得到,可以看作是计算某个后验概率时,某个特征对于该类别的影响程度。将该分类算法与朴素贝叶斯分类器(na ve bayesian classifier,NB)、贝叶斯网(bayes networks)和NBTree分类器进行实验比较。结果表明:在大多数数据集上,FWNB分类器在较小的计算代价下,具有较高的分类正确率。 展开更多
关键词 贝叶斯分类器 朴素贝叶斯分类器 特征加权 粗糙集
在线阅读 下载PDF
一种基于概率粗糙集模型的图像语义检索方法 被引量:4
12
作者 徐久成 李晓艳 孙林 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第4期438-445,共8页
针对目前图像数据信息量大、检索不易和人们对图像检索习惯于对图像概念语义进行检索的难题,本文将概率粗糙集理论和图像的语义标注技术引入图像的信息检索中,提出了一种基于朴素贝叶斯理论和概率粗糙集模型的图像语义信息检索模型.首先... 针对目前图像数据信息量大、检索不易和人们对图像检索习惯于对图像概念语义进行检索的难题,本文将概率粗糙集理论和图像的语义标注技术引入图像的信息检索中,提出了一种基于朴素贝叶斯理论和概率粗糙集模型的图像语义信息检索模型.首先,针对图像库中的图像构造精确标注词空间,并通过朴素贝叶斯理论对图像进行精确标注和模糊加权标注.将概率粗糙集模型和朴素贝叶斯理论的后验概率相结合,计算每对图像标注词的条件概率和模糊条件概率,并求得每个标注词的支持集和被支持集,在此基础上,计算每个标注词的支持集和被支持集的上、下近似,并通过上、下近似构造图像的语义相似度计算方法,之后计算待查询图像的查询特征与图像库中图像之间的语义相似度,并根据相似度的大小给出检索的排序和输出.最后,给出一个简单的仿真实验,实验结果表明该方法是有效可行的. 展开更多
关键词 概率粗糙集 图像语义 自动标注 朴素贝叶斯
在线阅读 下载PDF
一种面向SNP选择的模糊聚类算法 被引量:3
13
作者 张波 周从华 +2 位作者 张付全 张婷 蒋跃明 《计算机工程》 CAS CSCD 北大核心 2019年第8期66-74,共9页
在对高维少样本的遗传数据进行单核苷酸多态性(SNP)选择时,为能使所选SNP子集高度代表所有SNP信息,实现数据降维,在模糊C均值(FCM)算法的基础上提出一种改进方法GN-FCM。通过引入SNP权重因子量化SNP位点重要程度的差异性,同时将重点SNP... 在对高维少样本的遗传数据进行单核苷酸多态性(SNP)选择时,为能使所选SNP子集高度代表所有SNP信息,实现数据降维,在模糊C均值(FCM)算法的基础上提出一种改进方法GN-FCM。通过引入SNP权重因子量化SNP位点重要程度的差异性,同时将重点SNP邻域正则项引入模糊聚类的损失函数中,挖掘高度重要SNP与同邻域内其他SNP的关联性。实验结果表明,GN-FCM具有较好的收敛性,与DW-FCM算法相比,其构造的SNP子集在支持向量机、决策树和朴素贝叶斯分类中准确率分别提升5.73 %、3.40 %和3.79 %,F1值分别提升4.01 %、 3.20 %和 2.22 %。 展开更多
关键词 单核苷酸多态性选择 模糊聚类 特征选择 支持向量机 决策树 朴素贝叶斯分类
在线阅读 下载PDF
动态朴素贝叶斯网络分类器的特征子集选择 被引量:1
14
作者 余民杰 王双成 杜瑞杰 《计算机应用与软件》 CSCD 北大核心 2012年第2期57-59,共3页
分类准确性是分类器最重要的性能指标,特征子集选择是提高分类器分类准确性的一种有效方法。现有的特征子集选择方法主要针对静态分类器,缺少动态分类器特征子集选择方面的研究。首先给出具有连续属性的动态朴素贝叶斯网络分类器和动态... 分类准确性是分类器最重要的性能指标,特征子集选择是提高分类器分类准确性的一种有效方法。现有的特征子集选择方法主要针对静态分类器,缺少动态分类器特征子集选择方面的研究。首先给出具有连续属性的动态朴素贝叶斯网络分类器和动态分类准确性评价标准,在此基础上建立动态朴素贝叶斯网络分类器的特征子集选择方法,并使用真实宏观经济时序数据进行实验与分析。 展开更多
关键词 动态朴素贝叶斯网络 分类器 特征子集选择 高斯核函数
在线阅读 下载PDF
基于终身朴素贝叶斯方法的情感分类 被引量:1
15
作者 王松 买日旦·吾守尔 +1 位作者 古兰拜尔·吐尔洪 段淑敏 《中文信息学报》 CSCD 北大核心 2023年第9期150-160,共11页
面对快速增长和变化的网络信息,现有情感分类模型受灾难遗忘的影响,在训练完成后难以累积和迁移知识。受到人类持续学习过程的启发,尝试用终身学习解决这一问题。该文讨论终身学习概念并为终身学习范式构建多任务情感分类数据集;将终身... 面对快速增长和变化的网络信息,现有情感分类模型受灾难遗忘的影响,在训练完成后难以累积和迁移知识。受到人类持续学习过程的启发,尝试用终身学习解决这一问题。该文讨论终身学习概念并为终身学习范式构建多任务情感分类数据集;将终身朴素贝叶斯方法用于中文情感分类任务:把不同种类的商品评论视为不同的情感分类任务,LNB算法依次学习并为每一个任务构建分类器。利用领域注意力机制改进LNB,提出该文方法LNB-DA。实验表明该文方法具备知识累积与迁移的能力,负类F 1值优于对比方法0.15%~23.41%。 展开更多
关键词 终身学习 持续学习 朴素贝叶斯 情感分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部