期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
电子商务中基于非均衡数据分类和词性分析的意见挖掘研究
被引量:
10
1
作者
王刚
王珏
杨善林
《情报学报》
CSSCI
北大核心
2014年第3期313-325,共13页
随着电子商务的不断普及,网络商品评论作为消费者了解网上销售商品质量的一个重要途径,已受到越来越多的重视,并且已提出很多意见挖掘方法来帮助消费者利用这些数据。但目前研究对网络商品评论的非均衡分布特性还较少关注,为此,本...
随着电子商务的不断普及,网络商品评论作为消费者了解网上销售商品质量的一个重要途径,已受到越来越多的重视,并且已提出很多意见挖掘方法来帮助消费者利用这些数据。但目前研究对网络商品评论的非均衡分布特性还较少关注,为此,本文提出基于非均衡数据分类和词性分析的意见挖掘方法。该方法综合基于情感知识和机器学习两种意见挖掘方法,首先,分析电子商务评论的语言特征,对电子商务评论中词语的词性进行分析,提出“留词性”和“去词性”两种分析方法;其次,根据电子商务意见挖掘数据不均衡分布的特征,提出基于非均衡数据分类的意见挖掘方法。最后,以携程网、京东商城和当当网三个不同电子商务网站的用户评论为语料库,对本文提出的方法进行检验,实验结果验证了本文提出的基于非均衡数据分类和词性分析的意见挖掘方法的有效性,并且采用去词性分析方法时,Random Subspace在所有测试集上均取得了最好的分类结果。
展开更多
关键词
意见挖掘
非均衡数据分类
词性分析
电子商务
在线阅读
下载PDF
职称材料
基于图卷积网络的非均衡数据船舶柴油机故障诊断
被引量:
3
2
作者
王瑞涵
陈辉
+1 位作者
管聪
黄梦卓
《中国舰船研究》
CSCD
北大核心
2022年第5期289-300,共12页
[目的]船舶柴油机状态信息数据普遍存在类别不均衡的问题,非均衡数据集降低了基于数据驱动的故障诊断模型对柴油机健康状况自动识别的准确性。因此,提出基于样本间概率相似性的图卷积网络(GCN)模型,以解决非均衡数据集分类问题。[方法]...
[目的]船舶柴油机状态信息数据普遍存在类别不均衡的问题,非均衡数据集降低了基于数据驱动的故障诊断模型对柴油机健康状况自动识别的准确性。因此,提出基于样本间概率相似性的图卷积网络(GCN)模型,以解决非均衡数据集分类问题。[方法]首先,引入Kullback-Leibler散度来计算样本间的概率相似性,以挖掘样本间的非线性关系,将各个样本间的相似性用构造概率图的拓扑结构体现。然后,利用图学习对样本特征及邻近样本特征进行聚合和提取,为非均衡数据集的分类提供更多的信息。最后,通过构造多层图卷积层,对样本特征信息进行更深层次的挖掘。[结果]仿真及台架实验表明,所提出的图卷积网络能够有效地学习更多样本信息,通过聚合邻近样本信息来提高非均衡数据集分类的准确率。[结论]该模型的召回率和精确率均高于其他分类模型,具有一定的工程应用价值。
展开更多
关键词
图卷积网络
故障诊断
船舶柴油机
非
均衡
数据
集
分类
在线阅读
下载PDF
职称材料
集成层级图注意力网络检测非均衡虚假评论
被引量:
3
3
作者
赵敏
张月琴
+1 位作者
窦英通
张泽华
《计算机科学与探索》
CSCD
北大核心
2023年第2期428-441,共14页
作为机器学习当前一大热点,图神经网络(GNN)模型近年来已逐渐开始结合用户评论应用于欺诈检测领域。但现实中汇总的用户评论涉及多个不同领域,可用信息复杂多样,海量的用户生成内容中欺诈信息通常也只占少数,基于GNN的相关检测方法对虚...
作为机器学习当前一大热点,图神经网络(GNN)模型近年来已逐渐开始结合用户评论应用于欺诈检测领域。但现实中汇总的用户评论涉及多个不同领域,可用信息复杂多样,海量的用户生成内容中欺诈信息通常也只占少数,基于GNN的相关检测方法对虚假评论的识别效果不甚理想。针对这种特征异构和数据分布不均衡的问题,将评论系统进行异构网络建模,提出一种新的集成层次图注意力网络(En-HGAN)识别方法。通过融合层次注意力结构,更加充分地利用异构网络中丰富的用户行为信息,为评论学习更加丰富的语义表征,并在集成学习Bagging框架下集成多个差异化的HGAN子模型,使用随机欠采样策略实现基学习器多样性聚合,从而减少有效信息丢失,增强对欺诈评论的检测能力。在YelpChi与Amazon真实数据集上的实验结果表明,En-HGAN方法具有良好的异常探测性能,和当前一些最新的方法相比,在数据类别倾斜分布的应用中显示En-HGAN方法对欺诈实体具有不错的鲁棒性。
展开更多
关键词
虚假评论检测
层次图注意力网络
网络表征学习
集成学习
非均衡数据分类
在线阅读
下载PDF
职称材料
融合簇边界移动与自适应合成的混合采样算法
被引量:
6
4
作者
高雷阜
张梦瑶
赵世杰
《电子学报》
EI
CAS
CSCD
北大核心
2022年第10期2517-2529,共13页
针对伪负采样算法(Pseudo-Negative Sampling,PNS)存在的类内子聚集和类别重叠问题,提出一种融合簇边界负样本移动策略(Cluster Boundary Negative Movement Strategy,CBNMS)与自适应正样本合成技术(Adaptive Pos⁃itive Synthesis Techn...
针对伪负采样算法(Pseudo-Negative Sampling,PNS)存在的类内子聚集和类别重叠问题,提出一种融合簇边界负样本移动策略(Cluster Boundary Negative Movement Strategy,CBNMS)与自适应正样本合成技术(Adaptive Pos⁃itive Synthesis Technology,ADPST)的改进混合采样算法(Improved Cluster Boundary Negative Movement Strategy,ICB⁃NMS),以提升非均衡数据的整体分类性能和正类识别精度.CBNMS策略采用凝聚层次聚类对正负类样本进行划分,并通过各局部样本间相似关系识别潜在负类中且与正类相关性较大的簇边界负样本,提高采样的局部精确性和时效性.为进一步加强CBNMS策略对正样本重叠区域的识别性能,ICBNMS算法在簇边界负样本移动均衡化基础上,引入ADPST技术,利用稀疏度与距离复合因子组合加权以自适应确定最优样本生成区域,从而有效削弱样本的重叠性且丰富样本的多样性.实验结果表明,相比其他采样算法,ICBNMS算法在10个非均衡数据集的多组实验中G-mean和Fmeasure等指标获得最优值,且时间效率比CDSMOTE和PNS算法分别提升了32.27%和27.88%,凸显出更优越的鲁棒性和泛化性.
展开更多
关键词
非均衡数据分类
凝聚层次聚类
簇边界负样本移动
自适应正样本合成
混合采样
在线阅读
下载PDF
职称材料
题名
电子商务中基于非均衡数据分类和词性分析的意见挖掘研究
被引量:
10
1
作者
王刚
王珏
杨善林
机构
合肥工业大学管理学院
过程优化与智能决策教育部重点实验室
中国科学院数学与系统科学研究院预测科学研究中心
出处
《情报学报》
CSSCI
北大核心
2014年第3期313-325,共13页
基金
国家自然科学基金(71101042,71271202)
高等学校博士学科点专项科研基金(20110111120014)
+1 种基金
中国博士后科学基金(2011M501041,2013T60611)
国家重点基础研究发展计划(973计划)(2013CB329603)
文摘
随着电子商务的不断普及,网络商品评论作为消费者了解网上销售商品质量的一个重要途径,已受到越来越多的重视,并且已提出很多意见挖掘方法来帮助消费者利用这些数据。但目前研究对网络商品评论的非均衡分布特性还较少关注,为此,本文提出基于非均衡数据分类和词性分析的意见挖掘方法。该方法综合基于情感知识和机器学习两种意见挖掘方法,首先,分析电子商务评论的语言特征,对电子商务评论中词语的词性进行分析,提出“留词性”和“去词性”两种分析方法;其次,根据电子商务意见挖掘数据不均衡分布的特征,提出基于非均衡数据分类的意见挖掘方法。最后,以携程网、京东商城和当当网三个不同电子商务网站的用户评论为语料库,对本文提出的方法进行检验,实验结果验证了本文提出的基于非均衡数据分类和词性分析的意见挖掘方法的有效性,并且采用去词性分析方法时,Random Subspace在所有测试集上均取得了最好的分类结果。
关键词
意见挖掘
非均衡数据分类
词性分析
电子商务
Keywords
opinion mining, imbalanced data classification, part of speech analysis, electronic commerce
分类号
H04 [语言文字—语言学]
F724.6 [经济管理—产业经济]
在线阅读
下载PDF
职称材料
题名
基于图卷积网络的非均衡数据船舶柴油机故障诊断
被引量:
3
2
作者
王瑞涵
陈辉
管聪
黄梦卓
机构
武汉理工大学高性能船舶技术教育部重点实验室
武汉理工大学船海与能源动力工程学院
出处
《中国舰船研究》
CSCD
北大核心
2022年第5期289-300,共12页
基金
国家重点研发计划资助项目(2019YFE0104600)
工信部“绿色智能内河船舶创新专项”资助项目。
文摘
[目的]船舶柴油机状态信息数据普遍存在类别不均衡的问题,非均衡数据集降低了基于数据驱动的故障诊断模型对柴油机健康状况自动识别的准确性。因此,提出基于样本间概率相似性的图卷积网络(GCN)模型,以解决非均衡数据集分类问题。[方法]首先,引入Kullback-Leibler散度来计算样本间的概率相似性,以挖掘样本间的非线性关系,将各个样本间的相似性用构造概率图的拓扑结构体现。然后,利用图学习对样本特征及邻近样本特征进行聚合和提取,为非均衡数据集的分类提供更多的信息。最后,通过构造多层图卷积层,对样本特征信息进行更深层次的挖掘。[结果]仿真及台架实验表明,所提出的图卷积网络能够有效地学习更多样本信息,通过聚合邻近样本信息来提高非均衡数据集分类的准确率。[结论]该模型的召回率和精确率均高于其他分类模型,具有一定的工程应用价值。
关键词
图卷积网络
故障诊断
船舶柴油机
非
均衡
数据
集
分类
Keywords
graph convolutional network
fault diagnosis
marine diesel engine
unbalanced dataset classification
分类号
U664.121 [交通运输工程—船舶及航道工程]
U676.42 [交通运输工程—船舶及航道工程]
在线阅读
下载PDF
职称材料
题名
集成层级图注意力网络检测非均衡虚假评论
被引量:
3
3
作者
赵敏
张月琴
窦英通
张泽华
机构
太原理工大学信息与计算机学院
Department of Computer Science
出处
《计算机科学与探索》
CSCD
北大核心
2023年第2期428-441,共14页
基金
国家自然科学基金(61503273,61702356)
教育部产学合作协同育人项目
山西省回国留学人员科研资助项目。
文摘
作为机器学习当前一大热点,图神经网络(GNN)模型近年来已逐渐开始结合用户评论应用于欺诈检测领域。但现实中汇总的用户评论涉及多个不同领域,可用信息复杂多样,海量的用户生成内容中欺诈信息通常也只占少数,基于GNN的相关检测方法对虚假评论的识别效果不甚理想。针对这种特征异构和数据分布不均衡的问题,将评论系统进行异构网络建模,提出一种新的集成层次图注意力网络(En-HGAN)识别方法。通过融合层次注意力结构,更加充分地利用异构网络中丰富的用户行为信息,为评论学习更加丰富的语义表征,并在集成学习Bagging框架下集成多个差异化的HGAN子模型,使用随机欠采样策略实现基学习器多样性聚合,从而减少有效信息丢失,增强对欺诈评论的检测能力。在YelpChi与Amazon真实数据集上的实验结果表明,En-HGAN方法具有良好的异常探测性能,和当前一些最新的方法相比,在数据类别倾斜分布的应用中显示En-HGAN方法对欺诈实体具有不错的鲁棒性。
关键词
虚假评论检测
层次图注意力网络
网络表征学习
集成学习
非均衡数据分类
Keywords
fake review detection
hierarchical graph attention network
network representation learning
ensemble learning
imbalanced data classification
分类号
TP316 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
融合簇边界移动与自适应合成的混合采样算法
被引量:
6
4
作者
高雷阜
张梦瑶
赵世杰
机构
辽宁工程技术大学运筹与优化研究院
辽宁工程技术大学优化与决策研究所
出处
《电子学报》
EI
CAS
CSCD
北大核心
2022年第10期2517-2529,共13页
基金
辽宁省教育厅重点攻关项目(No.LJ2019ZL001)。
文摘
针对伪负采样算法(Pseudo-Negative Sampling,PNS)存在的类内子聚集和类别重叠问题,提出一种融合簇边界负样本移动策略(Cluster Boundary Negative Movement Strategy,CBNMS)与自适应正样本合成技术(Adaptive Pos⁃itive Synthesis Technology,ADPST)的改进混合采样算法(Improved Cluster Boundary Negative Movement Strategy,ICB⁃NMS),以提升非均衡数据的整体分类性能和正类识别精度.CBNMS策略采用凝聚层次聚类对正负类样本进行划分,并通过各局部样本间相似关系识别潜在负类中且与正类相关性较大的簇边界负样本,提高采样的局部精确性和时效性.为进一步加强CBNMS策略对正样本重叠区域的识别性能,ICBNMS算法在簇边界负样本移动均衡化基础上,引入ADPST技术,利用稀疏度与距离复合因子组合加权以自适应确定最优样本生成区域,从而有效削弱样本的重叠性且丰富样本的多样性.实验结果表明,相比其他采样算法,ICBNMS算法在10个非均衡数据集的多组实验中G-mean和Fmeasure等指标获得最优值,且时间效率比CDSMOTE和PNS算法分别提升了32.27%和27.88%,凸显出更优越的鲁棒性和泛化性.
关键词
非均衡数据分类
凝聚层次聚类
簇边界负样本移动
自适应正样本合成
混合采样
Keywords
imbalanced data classification
agglomerative hierarchical cluster
cluster boundary negative sample movement
adaptive positive sample synthesis
mixed-sampling
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
TP39 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
电子商务中基于非均衡数据分类和词性分析的意见挖掘研究
王刚
王珏
杨善林
《情报学报》
CSSCI
北大核心
2014
10
在线阅读
下载PDF
职称材料
2
基于图卷积网络的非均衡数据船舶柴油机故障诊断
王瑞涵
陈辉
管聪
黄梦卓
《中国舰船研究》
CSCD
北大核心
2022
3
在线阅读
下载PDF
职称材料
3
集成层级图注意力网络检测非均衡虚假评论
赵敏
张月琴
窦英通
张泽华
《计算机科学与探索》
CSCD
北大核心
2023
3
在线阅读
下载PDF
职称材料
4
融合簇边界移动与自适应合成的混合采样算法
高雷阜
张梦瑶
赵世杰
《电子学报》
EI
CAS
CSCD
北大核心
2022
6
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部