期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
25
篇文章
<
1
2
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度信念网络的个性化信息推荐
被引量:
5
1
作者
王兆凯
李亚星
+3 位作者
冯旭鹏
刘利军
黄青松
刘晓梅
《计算机工程》
CAS
CSCD
北大核心
2016年第10期201-206,共6页
为在信息推荐过程中挖掘出更多的信息关系,提出一种基于深度信念网络的信息推荐方法。利用模糊聚类进行预处理以达到跨类推荐的目的,根据用户浏览记录通过网络计算高分信息,并结合用户兴趣,使用潜在狄里克雷分配模型对高分信息进行权值...
为在信息推荐过程中挖掘出更多的信息关系,提出一种基于深度信念网络的信息推荐方法。利用模糊聚类进行预处理以达到跨类推荐的目的,根据用户浏览记录通过网络计算高分信息,并结合用户兴趣,使用潜在狄里克雷分配模型对高分信息进行权值调整,从而提高推荐准确率。在整个推荐过程中网络会根据用户行为对推荐信息权值进行相应调整。实验结果表明,该方法的推荐成功率比BP神经网络提高5.7%。
展开更多
关键词
信息推荐
深度学习
深度信念网络
潜在狄利克雷分配模型
模糊聚类
在线阅读
下载PDF
职称材料
基于实时词共现网络的微博话题发现
被引量:
5
2
作者
李亚星
王兆凯
+2 位作者
冯旭鹏
刘利军
黄青松
《计算机应用》
CSCD
北大核心
2016年第5期1302-1306,共5页
针对微博的实时性、稀疏性和海量性特点,提出基于实时词共现网络的话题发现模型。首先,从原始语料中筛选出主题词集合,再利用时间参数计算共现主题词的关系权重以实现词共现网络的构建,通过该网络推算出与话题关联性强的潜在特征词以解...
针对微博的实时性、稀疏性和海量性特点,提出基于实时词共现网络的话题发现模型。首先,从原始语料中筛选出主题词集合,再利用时间参数计算共现主题词的关系权重以实现词共现网络的构建,通过该网络推算出与话题关联性强的潜在特征词以解决微博特征词的稀疏性;其次,采用改进Single-Pass算法实现话题增量聚类;最后,对每个话题的主题词按热度计算进行排序,获得最具代表性的话题主题词。实验结果表明,该模型与经典Single-Pass聚类算法相比,话题发现准确率约提高6%,综合指标提高8%。实验结果证明所提模型的有效性和准确性。
展开更多
关键词
话题发现
实时共现网络
短文本
Single-Pass聚类
热度计算
在线阅读
下载PDF
职称材料
基于特征加权的网络不良内容识别方法
被引量:
5
3
作者
俞浩亮
王秋森
+3 位作者
冯旭鹏
刘利军
傅铁威
黄青松
《现代电子技术》
北大核心
2016年第3期76-79,共4页
网络上不良信息的出现是困扰社会精神健康发展的"顽疾",如果不进行有效的过滤,会给搜索服务带来不良影响,极大的影响了社会的和谐稳定发展。提出一种基于特征加权的网络不良内容识别方法,在对网页上的文本预处理后,引入针对...
网络上不良信息的出现是困扰社会精神健康发展的"顽疾",如果不进行有效的过滤,会给搜索服务带来不良影响,极大的影响了社会的和谐稳定发展。提出一种基于特征加权的网络不良内容识别方法,在对网页上的文本预处理后,引入针对不良内容的加权方法,然后再结合KNN、朴素贝叶斯、SVM三种文本分类方法进行实验对比。对比实验结果表明,所采用的方法在识别网络不良内容上的准确率和召回率都有较大提高。
展开更多
关键词
互联网
不良内容
特征加权
内容识别
在线阅读
下载PDF
职称材料
基于卷积神经网络的跨领域语义信息检索研究
被引量:
3
4
作者
谢先章
王兆凯
+3 位作者
李亚星
冯旭鹏
刘利军
黄青松
《计算机应用与软件》
北大核心
2018年第8期73-78,共6页
随着社会信息化的发展,信息检索成为了影响人们日常生活和生产工作的重要技术,同时人们对信息检索技术的要求也越来越高[1]。为了改进传统检索方式,基于卷积神经网络CNNs(Convolutional Neural Networks)提出一种语义信息检索模型,对句...
随着社会信息化的发展,信息检索成为了影响人们日常生活和生产工作的重要技术,同时人们对信息检索技术的要求也越来越高[1]。为了改进传统检索方式,基于卷积神经网络CNNs(Convolutional Neural Networks)提出一种语义信息检索模型,对句子卷积特征和词聚特征进行映射训练,达到搜索近似语句的目的。实验表明基于卷积神经网络的近似语义检索模型相比传统检索模型有助于提高信息检索的质量。
展开更多
关键词
卷积神经网络
信息检索
词向量
SVM
快速聚类
在线阅读
下载PDF
职称材料
基于标签相似度的不良信息多标签分类方法
被引量:
8
5
作者
刘卓然
胡杨
+3 位作者
刘骊
冯旭鹏
刘利军
黄青松
《计算机应用研究》
CSCD
北大核心
2016年第4期989-992,共4页
在多标记分类中,标签与标签之间的相关关系是影响分类效果的一个重要因子。传统的经典多标签分类方法如BR算法、ML-KNN算法等,忽略了标签之间的相关关系对实际分类的影响,分类效果一直不能令人满意;面对类别关联度极高的不良信息的多标...
在多标记分类中,标签与标签之间的相关关系是影响分类效果的一个重要因子。传统的经典多标签分类方法如BR算法、ML-KNN算法等,忽略了标签之间的相关关系对实际分类的影响,分类效果一直不能令人满意;面对类别关联度极高的不良信息的多标签分类,分类效果更是大打折扣。针对上述问题,通过改进经典的多标签分类算法RAk EL,首先根据训练文本计算出各标签之间的相似度系数,然后再根据自定义不良信息层次关系计算出综合标签相似度系数矩阵,最后在RAk EL算法投票过程中根据综合标签相似度与中心标签重新确定最终的结果标签集合。与传统的分类方法在真实的语料库上进行多标签分类效果对比,结果证明,该方法对不良信息分类具有较好的效果。
展开更多
关键词
多标签分类
标签之间的相关关系
不良信息
中心标签
标签相似度系数矩阵
在线阅读
下载PDF
职称材料
基于情感角色模型的文本情感分类方法
被引量:
3
6
作者
胡杨
戴丹
+3 位作者
刘骊
冯旭鹏
刘利军
黄青松
《计算机应用》
CSCD
北大核心
2015年第5期1310-1313,1319,共5页
针对传统情感分类方法因情感项指向不明引发的误判和隐藏观点遗漏等问题,提出一种基于评价对象情感角色模型的文本情感分类方法。该方法首先识别文本中的潜在评价对象,通过局部语义分析对潜在评价对象所在语句进行情感标注,确定潜在评...
针对传统情感分类方法因情感项指向不明引发的误判和隐藏观点遗漏等问题,提出一种基于评价对象情感角色模型的文本情感分类方法。该方法首先识别文本中的潜在评价对象,通过局部语义分析对潜在评价对象所在语句进行情感标注,确定潜在评价对象所在语句的正负极性,并定义其情感角色;然后,改进特征权值计算方法,将情感角色对应的倾向值融入模型特征空间中;最后,通过特征聚合对特征空间实现模型降维。实验结果表明,所提方法与提取强主观性情感项作为特征的情感分类方法相比,分类准确率约提高3.2%,可有效改善文本情感分类效果。
展开更多
关键词
文本情感分类
向量空间模型
局部语义分析
情感角色
特征聚合
在线阅读
下载PDF
职称材料
面向短文本情感分类的特征拓扑聚合模型
被引量:
3
7
作者
胡杨
冯旭鹏
+3 位作者
黄青松
付晓东
刘骊
刘利军
《中文信息学报》
CSCD
北大核心
2016年第5期28-35,共8页
由于短文本极稀疏性和特征分散的特点,短文本的情感分类效果总是不及篇章文本的情感分类,针对此问题,该文提出面向短文本情感分类的特征拓扑聚合模型。模型首先从特征点互信息,情感指向相似度,主题归属差异值三个维度整合计算情感特征...
由于短文本极稀疏性和特征分散的特点,短文本的情感分类效果总是不及篇章文本的情感分类,针对此问题,该文提出面向短文本情感分类的特征拓扑聚合模型。模型首先从特征点互信息,情感指向相似度,主题归属差异值三个维度整合计算情感特征的关联度,然后根据特征关联度建立拓扑聚合图模型,通过在图上求解强联通分量聚合高关联度情感特征,从大量未标注语料中提取相似特征对训练集特征进行补充,同时降低训练空间维度。实验将模型应用于短文本情感分类,与基准算法对比能提高分类准确率和召回率分别达0.03和0.027。验证了模型在缓解短文本极稀疏性和特征分散问题上的效果。
展开更多
关键词
短文本
情感分类
特征关联度
强联通分量
拓扑聚合
在线阅读
下载PDF
职称材料
基于用户属性与覆盖范围的意见领袖挖掘研究
被引量:
3
8
作者
李亚星
王兆凯
+2 位作者
刘利军
冯旭鹏
黄青松
《计算机应用研究》
CSCD
北大核心
2017年第12期3556-3559,共4页
针对微博信息的交互性和不确定性,提出一种基于用户属性与覆盖范围的意见领袖研究方法。该方法分别计算用户属性值和用户传播覆盖范围,根据粉丝忠实程度计算出用户属性值从而得到用户属性排名;利用用户间微博内容主题相似度构建贡献图,...
针对微博信息的交互性和不确定性,提出一种基于用户属性与覆盖范围的意见领袖研究方法。该方法分别计算用户属性值和用户传播覆盖范围,根据粉丝忠实程度计算出用户属性值从而得到用户属性排名;利用用户间微博内容主题相似度构建贡献图,获得用户覆盖范围排名。最后,结合用户属性排名和用户覆盖范围排名生成最终的意见领袖排名。实验结果表明,该方法相比其他意见领袖挖掘方法有更好的效果。
展开更多
关键词
意见领袖
情感分析
主题相似度
贡献图
延时传播
在线阅读
下载PDF
职称材料
最小费用最大流跨领域情感分类框架
被引量:
1
9
作者
胡杨
冯旭鹏
+2 位作者
戴丹
刘利军
黄青松
《小型微型计算机系统》
CSCD
北大核心
2017年第1期49-55,共7页
在对文本的情感极性进行分类的过程中,针对标注训练数据与待判断情感极性的数据来自不同领域,特征分布差异较大,导致传统监督学习方法分类准确率大幅下降的问题,提出基于最小费用最大流框架的跨领域情感分类方法.该方法将跨领域情感分...
在对文本的情感极性进行分类的过程中,针对标注训练数据与待判断情感极性的数据来自不同领域,特征分布差异较大,导致传统监督学习方法分类准确率大幅下降的问题,提出基于最小费用最大流框架的跨领域情感分类方法.该方法将跨领域情感分类问题转化为最大化领域间传播信息量和最小化跨领域特征拟合损失量的双重最优化问题,并建立连接源领域和目标领域的费用容量网络,将信息量和损失量分别看作网络中的容量和费用权值,通过最小费用最大流框架解决上述双重最优化问题,调配训练数据特征权值.以更为直观的模型描述领域间的映射关系.实验发现,方法能有效提高跨领域情感分类的准确率.
展开更多
关键词
跨领域
情感分类
双重最优化问题
费用流量网络
最小费用最大流
领域映射关系
在线阅读
下载PDF
职称材料
面向微博可信度评估的辩论图模型
被引量:
1
10
作者
黄青松
戴丹
+3 位作者
冯旭鹏
付晓东
刘骊
刘利军
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2017年第2期392-398,共7页
微博内容具有信息混杂和不确定性等特点,传统可信度判别方法存在一定局限性。因此,该文提出一种面向微博可信度评估的辩论有向图模型,从辩论的角度出发,以图模型直观、形象化地描述了辩论推演过程。通过话题语料构成争议节点,利用争议...
微博内容具有信息混杂和不确定性等特点,传统可信度判别方法存在一定局限性。因此,该文提出一种面向微博可信度评估的辩论有向图模型,从辩论的角度出发,以图模型直观、形象化地描述了辩论推演过程。通过话题语料构成争议节点,利用争议间的主题情感和潜在逻辑关系定义规则可信度,并设置图中边的权值来代表争议间的防卫和攻击强度。根据相关算法得出结论的可信度,递归进行辩论图演化,得到需判别信息的可信度。实验结果表明该模型比传统方法综合指标值平均提升6%。
展开更多
关键词
辩论
争议节点
有向图
可信度
在线阅读
下载PDF
职称材料
基于聚类集成的微博话题发现方法
11
作者
冯旭鹏
马震
+2 位作者
谢波
刘利军
黄青松
《计算机工程与应用》
CSCD
北大核心
2017年第8期81-86,共6页
微博中短文本、用语不规范和大量噪音等特性使得传统话题发现方法不能很好地从中获取新话题。针对微博以上特性和话题动态性提出一种基于聚类集成的微博话题发现方法,该方法考虑微博发布的非线性时间因子,采用改进的K-Means方法分别融...
微博中短文本、用语不规范和大量噪音等特性使得传统话题发现方法不能很好地从中获取新话题。针对微博以上特性和话题动态性提出一种基于聚类集成的微博话题发现方法,该方法考虑微博发布的非线性时间因子,采用改进的K-Means方法分别融合微博的各个特性构造其对应的基聚类器,并评估各基聚类器之间的有效性和差异性,以此设置集成投票权值并最终进行聚类集成。实验对比结果表明,该方法将微博发现话题的准确性提升约9.5%,能够更有效地探测到新话题。
展开更多
关键词
短文本
噪音
话题发现
动态性
非线性时间
基聚类器
聚类集成
在线阅读
下载PDF
职称材料
基于评价修饰分布差的评论文本倾向性识别方法
12
作者
冯旭鹏
马震
+2 位作者
谢波
刘利军
黄青松
《计算机工程》
CAS
CSCD
北大核心
2016年第10期176-180,186,共6页
针对文本倾向性分类时因情感指向不明导致的修饰词极性误判和隐藏观点遗漏等问题,提出基于评价修饰分布差的倾向识别方法。建立修饰关系二部图和修饰分布向量,计算评价对象在正、负训练语料中被修饰词用于修饰的分布差异,提取修饰分布...
针对文本倾向性分类时因情感指向不明导致的修饰词极性误判和隐藏观点遗漏等问题,提出基于评价修饰分布差的倾向识别方法。建立修饰关系二部图和修饰分布向量,计算评价对象在正、负训练语料中被修饰词用于修饰的分布差异,提取修饰分布差异明显的特征,并将正、负修饰差异信息融入特征值的计算中。实验结果表明,相比抽取带有主观情感词作为特征进行支持向量机二类分类的倾向性识别方法,所提方法的分类准确率和召回率分别提高约4.6%和5.6%,可有效改善评论文本倾向性识别的效果。在面对跨领域情况时,分类准确率和召回率的降低幅度比抽取带有主观情感词作为特征进行支持向量机的二类分类减少约6.6%和6.4%,具有一定的领域适应性。
展开更多
关键词
文本倾向识别
评价对象
修饰关系
分布差异
领域适应
在线阅读
下载PDF
职称材料
聊天机器人中用户就医意图识别方法
被引量:
10
13
作者
余慧
冯旭鹏
+1 位作者
刘利军
黄青松
《计算机应用》
CSCD
北大核心
2018年第8期2170-2174,共5页
传统的聊天机器人中用户意图识别一般采用基于模板匹配或人工特征集合等方法,针对其费时费力而且扩展性不强的问题,并结合医疗领域聊天文本的特点,提出了基于短文本主题模型(BTM)和双向门控循环单元(Bi GRU)的意图识别模型。该混合模型...
传统的聊天机器人中用户意图识别一般采用基于模板匹配或人工特征集合等方法,针对其费时费力而且扩展性不强的问题,并结合医疗领域聊天文本的特点,提出了基于短文本主题模型(BTM)和双向门控循环单元(Bi GRU)的意图识别模型。该混合模型将用户就医意图识别看作分类问题,使用主题特征,首先通过BTM对用户聊天文本逐句进行主题挖掘并量化,然后送入Bi GRU进行完整上下文学习得到连续语句最终表示,最后通过分类完成用户就医意图识别。对爬取的语料进行实验,BTM-Bi GRU方法明显优于传统的支持向量机(SVM)等方法,其F值更是高出目前较好的卷积长短期记忆组合神经网络(CNN-LSTM)近1.5个百分点。实验结果表明,在本任务上该混合模型重点考虑研究对象的特点,能有效提高意图识别的准确率。
展开更多
关键词
就医意图识别
医疗聊天文本
短文本主题模型
双向门控循环单元
模板匹配
在线阅读
下载PDF
职称材料
基于SOM聚类的微博话题发现
被引量:
10
14
作者
宋莉娜
冯旭鹏
+1 位作者
刘利军
黄青松
《计算机应用研究》
CSCD
北大核心
2018年第3期671-674,679,共5页
随着微博用户的增多,微博平台的信息更新频繁。针对微博文本的数据稀疏性、新词多、用语不规范等特点,提出了基于SOM聚类的微博话题发现方法。从原始语料中对文本进行预处理,通过词向量模型对短文本进行特征提取,降低了向量维度过高带...
随着微博用户的增多,微博平台的信息更新频繁。针对微博文本的数据稀疏性、新词多、用语不规范等特点,提出了基于SOM聚类的微博话题发现方法。从原始语料中对文本进行预处理,通过词向量模型对短文本进行特征提取,降低了向量维度过高带来的计算量繁重问题。采用改进的SOM对话题进行聚类,该算法改善了传统文本聚类的不足,进而能有效地发现话题。实验表明该算法较传统文本聚类算法的综合指标F值有明显提高。
展开更多
关键词
话题发现
词向量模型
文本相似度
短文本
SOM聚类
在线阅读
下载PDF
职称材料
基于LDA的微博用户粉丝亲密度评价模型
被引量:
3
15
作者
王秋森
俞浩亮
+3 位作者
徐浩诚
冯旭鹏
刘利军
黄青松
《计算机应用与软件》
CSCD
2016年第10期67-71,共5页
用户关系是目前微博研究的热门方向,微博用户亲密度评价在对用户隐含亲密粉丝的发现、微博网络环境优化等方面具有重要意义。目前微博用户群体庞大且关系复杂,仅从用户自身出发,以用户特征和关系网络等为依据对用户关系亲密度评价的准...
用户关系是目前微博研究的热门方向,微博用户亲密度评价在对用户隐含亲密粉丝的发现、微博网络环境优化等方面具有重要意义。目前微博用户群体庞大且关系复杂,仅从用户自身出发,以用户特征和关系网络等为依据对用户关系亲密度评价的准确率太低。针对这一问题,提出基于LDA的微博用户粉丝亲密度评价模型。首先,对用户粉丝集中非活跃粉丝过滤剔除,获取其活跃粉丝。然后,利用LDA主题模型对用户某时间段所发微博集进行训练,获取用户阶段性微博的主题分布;同时通过主题分布推断其兴趣取向分布,并利用余弦相似方法计算用户与其粉丝之间的兴趣相似度。最后,结合用户的背景相似度和关系紧密度,为用户建立综合的亲密度评价标准。通过新浪API接口抓取微博近期相关数据,组成实验数据集。在数据集上基于评价的推荐实验结果表明,所提出的模型方法具有较高的准确率和有效性。
展开更多
关键词
亲密度
LDA粉丝
主题模型
相似度
在线阅读
下载PDF
职称材料
基于主题角色的文本情感分类方法
被引量:
2
16
作者
刘晨晨
冯旭鹏
+3 位作者
胡杨
刘利军
黄青松
段成香
《计算机应用与软件》
2017年第1期154-159,共6页
传统文本情感分类方法通常以词或短语等词汇信息作为文本向量模型特征,造成情感指向不明和隐藏观点遗漏的问题。针对此问题提出一种基于主题角色的文本情感分类方法。该方法首先提取出文本中的潜在评价对象形成评价对象集,评价对象作为...
传统文本情感分类方法通常以词或短语等词汇信息作为文本向量模型特征,造成情感指向不明和隐藏观点遗漏的问题。针对此问题提出一种基于主题角色的文本情感分类方法。该方法首先提取出文本中的潜在评价对象形成评价对象集,评价对象作为情感句描述的主体能够很好地保存文本情感信息;然后使用LDA模型对评价对象集进行主题抽取,将抽取出的主题分裂成"正""负"两种特征项,将这两种特征项记为正负主题角色用于保存文本情感信息;最后,计算主题角色在文本中的情感影响值并建立主题角色模型。实验结果表明,所提方法与传统方法相比可有效提高主观性文本情感分类的准确率。
展开更多
关键词
文本情感分类
潜在评价对象
LDA
主题抽取
主题角色
在线阅读
下载PDF
职称材料
基于自动文摘的答案生成方法研究
被引量:
3
17
作者
胡迁
黄青松
+1 位作者
刘利军
冯旭鹏
《计算机应用与软件》
北大核心
2018年第12期187-192,307,共7页
在自动问答系统中,用户提出的问题具有句式复杂和语义多变的特点。而自动问答知识库中资源有限,因此问句和答案句的语义表示和问句答案间的语义匹配是答案生成的关键^([1])。针对以上问题,提出一种基于自动文摘的答案生成方法。将答案...
在自动问答系统中,用户提出的问题具有句式复杂和语义多变的特点。而自动问答知识库中资源有限,因此问句和答案句的语义表示和问句答案间的语义匹配是答案生成的关键^([1])。针对以上问题,提出一种基于自动文摘的答案生成方法。将答案生成转换为特征匹配和自动摘要问题,即计算问句间的相似度并以相似问题的答案构建原始答案集。利用循环神经网络构建序列到序列学习模型实现原始答案集的自动摘要,得到简洁准确答案。
展开更多
关键词
答案生成
自动文摘
循环神经网络
序列到序列学习模型
在线阅读
下载PDF
职称材料
面向微博博主的评论质量评估
被引量:
1
18
作者
栾杰
刘利军
+1 位作者
冯旭鹏
黄青松
《小型微型计算机系统》
CSCD
北大核心
2018年第1期58-63,共6页
针对现有评论质量评估研究中未考虑到个体的差异性以及参照物的选取存在误差的问题.该文选取博主作为评估人,以被博主回复的评论作为高质量评论的参照物,提出基于最大熵的微博评论质量评估模型.通过爬虫和词向量抽取特征,对抽取的特征...
针对现有评论质量评估研究中未考虑到个体的差异性以及参照物的选取存在误差的问题.该文选取博主作为评估人,以被博主回复的评论作为高质量评论的参照物,提出基于最大熵的微博评论质量评估模型.通过爬虫和词向量抽取特征,对抽取的特征进行特征选择,依据特征选择的结果,采用监督学习的方式训练分类模型并用测试数据验证所提模型的有效性.实验表明,该文所提模型对于不同的博主具有广泛适用性,评论分类的平均准确率、召回率和F值可达到66.64%、86.33%、75.2%.
展开更多
关键词
最大熵
评论质量
词向量
特征选择
监督学习
分类
在线阅读
下载PDF
职称材料
基于多元特征的电商低质量商品评论识别
被引量:
1
19
作者
栾杰
付晓东
+3 位作者
冯旭鹏
刘利军
黄青松
刘晓梅
《计算机应用与软件》
2017年第2期100-105,共6页
为了改变已有评论识别方法在新兴特性("返现评论"的出现)识别上的不足,根据新兴特性提出一种新的"无用评论"划分方法,定义其为低质量评论。根据其具有的特性,提出基于多元特征(情感强度,是否包含负面情感,主流观点...
为了改变已有评论识别方法在新兴特性("返现评论"的出现)识别上的不足,根据新兴特性提出一种新的"无用评论"划分方法,定义其为低质量评论。根据其具有的特性,提出基于多元特征(情感强度,是否包含负面情感,主流观点的包含程度)的识别方法。将提取出的特征放入基于文本特征分类器中,对多元特征与文本特征的不同组合进行有监督的学习,选取出分类效果最好的特征组合。实验表明在文本特征分类中加入多元特征后,分类准确率能达到83%。
展开更多
关键词
低质量评论
分类
多元特征
监督学习
在线阅读
下载PDF
职称材料
基于改进的宽深度模型的推荐方法研究
被引量:
2
20
作者
王艺平
冯旭鹏
+1 位作者
刘利军
黄青松
《计算机应用与软件》
北大核心
2018年第11期49-54,共6页
现代社交网络的个性化博文推荐中,博文特征选取质量的高低直接影响了推荐的质量和效率。深度模型可以较高质量地提取出文本中句法和语义的特征。然而短文本特征稀疏且未考虑上下文语境的问题,普遍存在于文本推荐任务中。针对以上问题,...
现代社交网络的个性化博文推荐中,博文特征选取质量的高低直接影响了推荐的质量和效率。深度模型可以较高质量地提取出文本中句法和语义的特征。然而短文本特征稀疏且未考虑上下文语境的问题,普遍存在于文本推荐任务中。针对以上问题,在现有宽深度模型的基础上,利用门限循环单元对其多层普通神经网络进行改进,提出宽深度门循环联合(Wide&Deep-GRU)模型,进一步探索浅层部分和深度部分的联合训练。使用从新浪微博获取的真实数据集分别与单一逻辑回归模型、单一深度神经网络模型和宽深度模型进行对比。实验表明,该方法整体上推荐质量较高,同时推荐效率较之前模型也有显著提高。
展开更多
关键词
文本推荐
排序模型
深度学习
门循环神经单元
在线阅读
下载PDF
职称材料
题名
基于深度信念网络的个性化信息推荐
被引量:
5
1
作者
王兆凯
李亚星
冯旭鹏
刘利军
黄青松
刘晓梅
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机
技术
应用重点实验室
昆明
佳谦科技有限公司
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第10期201-206,共6页
基金
国家自然科学基金资助项目(81360230)
科技部科技型中小企业技术创新基金资助项目(13C26215305404)
文摘
为在信息推荐过程中挖掘出更多的信息关系,提出一种基于深度信念网络的信息推荐方法。利用模糊聚类进行预处理以达到跨类推荐的目的,根据用户浏览记录通过网络计算高分信息,并结合用户兴趣,使用潜在狄里克雷分配模型对高分信息进行权值调整,从而提高推荐准确率。在整个推荐过程中网络会根据用户行为对推荐信息权值进行相应调整。实验结果表明,该方法的推荐成功率比BP神经网络提高5.7%。
关键词
信息推荐
深度学习
深度信念网络
潜在狄利克雷分配模型
模糊聚类
Keywords
information recommendation
deep learning
Deep Belief Network (DBN)
Latent Dirichlet Allocation(LDA) model
fuzzy clustering
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于实时词共现网络的微博话题发现
被引量:
5
2
作者
李亚星
王兆凯
冯旭鹏
刘利军
黄青松
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机
技术
应用重点实验室(
昆明理工大学
)
出处
《计算机应用》
CSCD
北大核心
2016年第5期1302-1306,共5页
基金
国家自然科学基金资助项目(81360230)~~
文摘
针对微博的实时性、稀疏性和海量性特点,提出基于实时词共现网络的话题发现模型。首先,从原始语料中筛选出主题词集合,再利用时间参数计算共现主题词的关系权重以实现词共现网络的构建,通过该网络推算出与话题关联性强的潜在特征词以解决微博特征词的稀疏性;其次,采用改进Single-Pass算法实现话题增量聚类;最后,对每个话题的主题词按热度计算进行排序,获得最具代表性的话题主题词。实验结果表明,该模型与经典Single-Pass聚类算法相比,话题发现准确率约提高6%,综合指标提高8%。实验结果证明所提模型的有效性和准确性。
关键词
话题发现
实时共现网络
短文本
Single-Pass聚类
热度计算
Keywords
topic discovery
real-time co-occurrence network
short text
Single-Pass cluster
hot degree calculation
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于特征加权的网络不良内容识别方法
被引量:
5
3
作者
俞浩亮
王秋森
冯旭鹏
刘利军
傅铁威
黄青松
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机
技术
应用重点实验室
出处
《现代电子技术》
北大核心
2016年第3期76-79,共4页
基金
国家自然科学基金资助项目(81360230)
科技部科技型中小企业技术创新基金资助项目(13C26215305404)
文摘
网络上不良信息的出现是困扰社会精神健康发展的"顽疾",如果不进行有效的过滤,会给搜索服务带来不良影响,极大的影响了社会的和谐稳定发展。提出一种基于特征加权的网络不良内容识别方法,在对网页上的文本预处理后,引入针对不良内容的加权方法,然后再结合KNN、朴素贝叶斯、SVM三种文本分类方法进行实验对比。对比实验结果表明,所采用的方法在识别网络不良内容上的准确率和召回率都有较大提高。
关键词
互联网
不良内容
特征加权
内容识别
Keywords
Internet
undesirable content
feature weighting
content identification
分类号
TN711-34 [电子电信—电路与系统]
在线阅读
下载PDF
职称材料
题名
基于卷积神经网络的跨领域语义信息检索研究
被引量:
3
4
作者
谢先章
王兆凯
李亚星
冯旭鹏
刘利军
黄青松
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机
技术
应用重点实验室
出处
《计算机应用与软件》
北大核心
2018年第8期73-78,共6页
基金
国家自然科学基金项目(81360230
81560296)
文摘
随着社会信息化的发展,信息检索成为了影响人们日常生活和生产工作的重要技术,同时人们对信息检索技术的要求也越来越高[1]。为了改进传统检索方式,基于卷积神经网络CNNs(Convolutional Neural Networks)提出一种语义信息检索模型,对句子卷积特征和词聚特征进行映射训练,达到搜索近似语句的目的。实验表明基于卷积神经网络的近似语义检索模型相比传统检索模型有助于提高信息检索的质量。
关键词
卷积神经网络
信息检索
词向量
SVM
快速聚类
Keywords
Convolutional neural network
Information retrieval
Word vector
SVM
Fast clustering
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于标签相似度的不良信息多标签分类方法
被引量:
8
5
作者
刘卓然
胡杨
刘骊
冯旭鹏
刘利军
黄青松
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机
技术
应用重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2016年第4期989-992,共4页
基金
国家自然科学基金资助项目(81360230)
国家科技部科技型中小企业技术创新基金资助项目(13C26215305404)
文摘
在多标记分类中,标签与标签之间的相关关系是影响分类效果的一个重要因子。传统的经典多标签分类方法如BR算法、ML-KNN算法等,忽略了标签之间的相关关系对实际分类的影响,分类效果一直不能令人满意;面对类别关联度极高的不良信息的多标签分类,分类效果更是大打折扣。针对上述问题,通过改进经典的多标签分类算法RAk EL,首先根据训练文本计算出各标签之间的相似度系数,然后再根据自定义不良信息层次关系计算出综合标签相似度系数矩阵,最后在RAk EL算法投票过程中根据综合标签相似度与中心标签重新确定最终的结果标签集合。与传统的分类方法在真实的语料库上进行多标签分类效果对比,结果证明,该方法对不良信息分类具有较好的效果。
关键词
多标签分类
标签之间的相关关系
不良信息
中心标签
标签相似度系数矩阵
Keywords
multi-label classification
relationship between lables
bad information
similarity coefficient
similarity coefficient matrix between lables
分类号
TP391.43 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于情感角色模型的文本情感分类方法
被引量:
3
6
作者
胡杨
戴丹
刘骊
冯旭鹏
刘利军
黄青松
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机
技术
应用重点实验室
出处
《计算机应用》
CSCD
北大核心
2015年第5期1310-1313,1319,共5页
基金
国家自然科学基金资助项目(81360230)
科技部科技型中小企业技术创新基金资助项目(13C26215305404)
文摘
针对传统情感分类方法因情感项指向不明引发的误判和隐藏观点遗漏等问题,提出一种基于评价对象情感角色模型的文本情感分类方法。该方法首先识别文本中的潜在评价对象,通过局部语义分析对潜在评价对象所在语句进行情感标注,确定潜在评价对象所在语句的正负极性,并定义其情感角色;然后,改进特征权值计算方法,将情感角色对应的倾向值融入模型特征空间中;最后,通过特征聚合对特征空间实现模型降维。实验结果表明,所提方法与提取强主观性情感项作为特征的情感分类方法相比,分类准确率约提高3.2%,可有效改善文本情感分类效果。
关键词
文本情感分类
向量空间模型
局部语义分析
情感角色
特征聚合
Keywords
text sentiment classification
Vector Space Model (VSM)
local semantic analysis
emotion role
feature converge
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
面向短文本情感分类的特征拓扑聚合模型
被引量:
3
7
作者
胡杨
冯旭鹏
黄青松
付晓东
刘骊
刘利军
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机
技术
应用重点实验室
出处
《中文信息学报》
CSCD
北大核心
2016年第5期28-35,共8页
基金
国家自然科学基金(81360230
61462056
61462051)
文摘
由于短文本极稀疏性和特征分散的特点,短文本的情感分类效果总是不及篇章文本的情感分类,针对此问题,该文提出面向短文本情感分类的特征拓扑聚合模型。模型首先从特征点互信息,情感指向相似度,主题归属差异值三个维度整合计算情感特征的关联度,然后根据特征关联度建立拓扑聚合图模型,通过在图上求解强联通分量聚合高关联度情感特征,从大量未标注语料中提取相似特征对训练集特征进行补充,同时降低训练空间维度。实验将模型应用于短文本情感分类,与基准算法对比能提高分类准确率和召回率分别达0.03和0.027。验证了模型在缓解短文本极稀疏性和特征分散问题上的效果。
关键词
短文本
情感分类
特征关联度
强联通分量
拓扑聚合
Keywords
short-text
sentiment classification
features correlation
strongly connected components
topological polymerization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于用户属性与覆盖范围的意见领袖挖掘研究
被引量:
3
8
作者
李亚星
王兆凯
刘利军
冯旭鹏
黄青松
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机
技术
应用重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2017年第12期3556-3559,共4页
基金
国家自然科学基金资助项目(81360230
81560296)
文摘
针对微博信息的交互性和不确定性,提出一种基于用户属性与覆盖范围的意见领袖研究方法。该方法分别计算用户属性值和用户传播覆盖范围,根据粉丝忠实程度计算出用户属性值从而得到用户属性排名;利用用户间微博内容主题相似度构建贡献图,获得用户覆盖范围排名。最后,结合用户属性排名和用户覆盖范围排名生成最终的意见领袖排名。实验结果表明,该方法相比其他意见领袖挖掘方法有更好的效果。
关键词
意见领袖
情感分析
主题相似度
贡献图
延时传播
Keywords
opinion leader
sentiment analysis
topic similarity
contribution diagram
delayed transmission
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
最小费用最大流跨领域情感分类框架
被引量:
1
9
作者
胡杨
冯旭鹏
戴丹
刘利军
黄青松
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机
技术
应用重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第1期49-55,共7页
基金
国家自然科学基金项目(81360230
81560296)资助
文摘
在对文本的情感极性进行分类的过程中,针对标注训练数据与待判断情感极性的数据来自不同领域,特征分布差异较大,导致传统监督学习方法分类准确率大幅下降的问题,提出基于最小费用最大流框架的跨领域情感分类方法.该方法将跨领域情感分类问题转化为最大化领域间传播信息量和最小化跨领域特征拟合损失量的双重最优化问题,并建立连接源领域和目标领域的费用容量网络,将信息量和损失量分别看作网络中的容量和费用权值,通过最小费用最大流框架解决上述双重最优化问题,调配训练数据特征权值.以更为直观的模型描述领域间的映射关系.实验发现,方法能有效提高跨领域情感分类的准确率.
关键词
跨领域
情感分类
双重最优化问题
费用流量网络
最小费用最大流
领域映射关系
Keywords
cross domain
sentiment classification
double optimization problem
cost-volume network
minimum-cost and maximum-flow
mapping relationship between the domains
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
面向微博可信度评估的辩论图模型
被引量:
1
10
作者
黄青松
戴丹
冯旭鹏
付晓东
刘骊
刘利军
机构
昆明理工大学
信息工程与自动化学院
云南省计算机
技术
应用重点实验室
昆明理工大学教育技术与网络中心
出处
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2017年第2期392-398,共7页
基金
国家自然科学基金(81360230
81560296
+1 种基金
61462056
61462051)
文摘
微博内容具有信息混杂和不确定性等特点,传统可信度判别方法存在一定局限性。因此,该文提出一种面向微博可信度评估的辩论有向图模型,从辩论的角度出发,以图模型直观、形象化地描述了辩论推演过程。通过话题语料构成争议节点,利用争议间的主题情感和潜在逻辑关系定义规则可信度,并设置图中边的权值来代表争议间的防卫和攻击强度。根据相关算法得出结论的可信度,递归进行辩论图演化,得到需判别信息的可信度。实验结果表明该模型比传统方法综合指标值平均提升6%。
关键词
辩论
争议节点
有向图
可信度
Keywords
argumentation
argument node
directed graphs
reliability
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于聚类集成的微博话题发现方法
11
作者
冯旭鹏
马震
谢波
刘利军
黄青松
机构
昆明理工大学教育技术与网络中心
昆明理工大学
信息工程与自动化学院
出处
《计算机工程与应用》
CSCD
北大核心
2017年第8期81-86,共6页
基金
国家自然科学基金(No.81360230
No.81560296)
文摘
微博中短文本、用语不规范和大量噪音等特性使得传统话题发现方法不能很好地从中获取新话题。针对微博以上特性和话题动态性提出一种基于聚类集成的微博话题发现方法,该方法考虑微博发布的非线性时间因子,采用改进的K-Means方法分别融合微博的各个特性构造其对应的基聚类器,并评估各基聚类器之间的有效性和差异性,以此设置集成投票权值并最终进行聚类集成。实验对比结果表明,该方法将微博发现话题的准确性提升约9.5%,能够更有效地探测到新话题。
关键词
短文本
噪音
话题发现
动态性
非线性时间
基聚类器
聚类集成
Keywords
short text
noise
topic detection
dynamic
nonlinear time factor
base cluster
clustering ensemble
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于评价修饰分布差的评论文本倾向性识别方法
12
作者
冯旭鹏
马震
谢波
刘利军
黄青松
机构
昆明理工大学教育技术与网络中心
昆明理工大学
信息工程与自动化学院
云南省计算机
技术
应用重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第10期176-180,186,共6页
基金
国家自然科学基金资助项目(81360230
81560296)
文摘
针对文本倾向性分类时因情感指向不明导致的修饰词极性误判和隐藏观点遗漏等问题,提出基于评价修饰分布差的倾向识别方法。建立修饰关系二部图和修饰分布向量,计算评价对象在正、负训练语料中被修饰词用于修饰的分布差异,提取修饰分布差异明显的特征,并将正、负修饰差异信息融入特征值的计算中。实验结果表明,相比抽取带有主观情感词作为特征进行支持向量机二类分类的倾向性识别方法,所提方法的分类准确率和召回率分别提高约4.6%和5.6%,可有效改善评论文本倾向性识别的效果。在面对跨领域情况时,分类准确率和召回率的降低幅度比抽取带有主观情感词作为特征进行支持向量机的二类分类减少约6.6%和6.4%,具有一定的领域适应性。
关键词
文本倾向识别
评价对象
修饰关系
分布差异
领域适应
Keywords
text orientation identification
evaluation object
modification relationship
distribution difference
domain adaption
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
聊天机器人中用户就医意图识别方法
被引量:
10
13
作者
余慧
冯旭鹏
刘利军
黄青松
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机
技术
应用重点实验室(
昆明理工大学
)
出处
《计算机应用》
CSCD
北大核心
2018年第8期2170-2174,共5页
基金
国家自然科学基金资助项目(81360230
81560296)~~
文摘
传统的聊天机器人中用户意图识别一般采用基于模板匹配或人工特征集合等方法,针对其费时费力而且扩展性不强的问题,并结合医疗领域聊天文本的特点,提出了基于短文本主题模型(BTM)和双向门控循环单元(Bi GRU)的意图识别模型。该混合模型将用户就医意图识别看作分类问题,使用主题特征,首先通过BTM对用户聊天文本逐句进行主题挖掘并量化,然后送入Bi GRU进行完整上下文学习得到连续语句最终表示,最后通过分类完成用户就医意图识别。对爬取的语料进行实验,BTM-Bi GRU方法明显优于传统的支持向量机(SVM)等方法,其F值更是高出目前较好的卷积长短期记忆组合神经网络(CNN-LSTM)近1.5个百分点。实验结果表明,在本任务上该混合模型重点考虑研究对象的特点,能有效提高意图识别的准确率。
关键词
就医意图识别
医疗聊天文本
短文本主题模型
双向门控循环单元
模板匹配
Keywords
identification of medical intention
medical chatting text
biterm topic model
bidirectional gated recurrent unit
template matching
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于SOM聚类的微博话题发现
被引量:
10
14
作者
宋莉娜
冯旭鹏
刘利军
黄青松
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
昆明理工大学
云南省计算机
技术
应用重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2018年第3期671-674,679,共5页
基金
国家自然科学基金资助项目(81360230
81560296)
文摘
随着微博用户的增多,微博平台的信息更新频繁。针对微博文本的数据稀疏性、新词多、用语不规范等特点,提出了基于SOM聚类的微博话题发现方法。从原始语料中对文本进行预处理,通过词向量模型对短文本进行特征提取,降低了向量维度过高带来的计算量繁重问题。采用改进的SOM对话题进行聚类,该算法改善了传统文本聚类的不足,进而能有效地发现话题。实验表明该算法较传统文本聚类算法的综合指标F值有明显提高。
关键词
话题发现
词向量模型
文本相似度
短文本
SOM聚类
Keywords
topics detection
word vector model
texts similarity
short texts
SOM clustering
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于LDA的微博用户粉丝亲密度评价模型
被引量:
3
15
作者
王秋森
俞浩亮
徐浩诚
冯旭鹏
刘利军
黄青松
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机
技术
应用重点实验室
出处
《计算机应用与软件》
CSCD
2016年第10期67-71,共5页
基金
国家自然科学基金项目(81360230)
科技部科技型中小企业技术创新基金项目(13C26215305404)
文摘
用户关系是目前微博研究的热门方向,微博用户亲密度评价在对用户隐含亲密粉丝的发现、微博网络环境优化等方面具有重要意义。目前微博用户群体庞大且关系复杂,仅从用户自身出发,以用户特征和关系网络等为依据对用户关系亲密度评价的准确率太低。针对这一问题,提出基于LDA的微博用户粉丝亲密度评价模型。首先,对用户粉丝集中非活跃粉丝过滤剔除,获取其活跃粉丝。然后,利用LDA主题模型对用户某时间段所发微博集进行训练,获取用户阶段性微博的主题分布;同时通过主题分布推断其兴趣取向分布,并利用余弦相似方法计算用户与其粉丝之间的兴趣相似度。最后,结合用户的背景相似度和关系紧密度,为用户建立综合的亲密度评价标准。通过新浪API接口抓取微博近期相关数据,组成实验数据集。在数据集上基于评价的推荐实验结果表明,所提出的模型方法具有较高的准确率和有效性。
关键词
亲密度
LDA粉丝
主题模型
相似度
Keywords
Intimacy;LDA;Follows( fans);Theme model;Similarity
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
基于主题角色的文本情感分类方法
被引量:
2
16
作者
刘晨晨
冯旭鹏
胡杨
刘利军
黄青松
段成香
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机应用重点实验室
昆明
迪时科技有限公司
出处
《计算机应用与软件》
2017年第1期154-159,共6页
基金
国家自然科学基金项目(81360230)
文摘
传统文本情感分类方法通常以词或短语等词汇信息作为文本向量模型特征,造成情感指向不明和隐藏观点遗漏的问题。针对此问题提出一种基于主题角色的文本情感分类方法。该方法首先提取出文本中的潜在评价对象形成评价对象集,评价对象作为情感句描述的主体能够很好地保存文本情感信息;然后使用LDA模型对评价对象集进行主题抽取,将抽取出的主题分裂成"正""负"两种特征项,将这两种特征项记为正负主题角色用于保存文本情感信息;最后,计算主题角色在文本中的情感影响值并建立主题角色模型。实验结果表明,所提方法与传统方法相比可有效提高主观性文本情感分类的准确率。
关键词
文本情感分类
潜在评价对象
LDA
主题抽取
主题角色
Keywords
Text sentiment classification
Potential evaluation objects
Latent Dirichlet Allocation(LDA)
Topic mining
Topic role
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于自动文摘的答案生成方法研究
被引量:
3
17
作者
胡迁
黄青松
刘利军
冯旭鹏
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学
云南省计算机
技术
应用重点实验室
昆明理工大学教育技术与网络中心
出处
《计算机应用与软件》
北大核心
2018年第12期187-192,307,共7页
基金
国家自然科学基金项目(81360230
81560296)
文摘
在自动问答系统中,用户提出的问题具有句式复杂和语义多变的特点。而自动问答知识库中资源有限,因此问句和答案句的语义表示和问句答案间的语义匹配是答案生成的关键^([1])。针对以上问题,提出一种基于自动文摘的答案生成方法。将答案生成转换为特征匹配和自动摘要问题,即计算问句间的相似度并以相似问题的答案构建原始答案集。利用循环神经网络构建序列到序列学习模型实现原始答案集的自动摘要,得到简洁准确答案。
关键词
答案生成
自动文摘
循环神经网络
序列到序列学习模型
Keywords
Answer generation
Automatic abstracting
Recurrent neural network
Sequence to sequence
learning model
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
面向微博博主的评论质量评估
被引量:
1
18
作者
栾杰
刘利军
冯旭鹏
黄青松
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机
技术
应用重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2018年第1期58-63,共6页
基金
国家自然科学基金项目(81360230
81560296)资助
文摘
针对现有评论质量评估研究中未考虑到个体的差异性以及参照物的选取存在误差的问题.该文选取博主作为评估人,以被博主回复的评论作为高质量评论的参照物,提出基于最大熵的微博评论质量评估模型.通过爬虫和词向量抽取特征,对抽取的特征进行特征选择,依据特征选择的结果,采用监督学习的方式训练分类模型并用测试数据验证所提模型的有效性.实验表明,该文所提模型对于不同的博主具有广泛适用性,评论分类的平均准确率、召回率和F值可达到66.64%、86.33%、75.2%.
关键词
最大熵
评论质量
词向量
特征选择
监督学习
分类
Keywords
smaximum entropy
review quality
word vector
feature selection
supervised learning
classification
分类号
TF391 [冶金工程—冶金机械及自动化]
在线阅读
下载PDF
职称材料
题名
基于多元特征的电商低质量商品评论识别
被引量:
1
19
作者
栾杰
付晓东
冯旭鹏
刘利军
黄青松
刘晓梅
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机应用重点实验室
昆明
佳谦科技有限公司
出处
《计算机应用与软件》
2017年第2期100-105,共6页
基金
国家自然科学基金项目(81360230)
文摘
为了改变已有评论识别方法在新兴特性("返现评论"的出现)识别上的不足,根据新兴特性提出一种新的"无用评论"划分方法,定义其为低质量评论。根据其具有的特性,提出基于多元特征(情感强度,是否包含负面情感,主流观点的包含程度)的识别方法。将提取出的特征放入基于文本特征分类器中,对多元特征与文本特征的不同组合进行有监督的学习,选取出分类效果最好的特征组合。实验表明在文本特征分类中加入多元特征后,分类准确率能达到83%。
关键词
低质量评论
分类
多元特征
监督学习
Keywords
Low quality review
Classification
Multivariate characteristics
Supervised learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于改进的宽深度模型的推荐方法研究
被引量:
2
20
作者
王艺平
冯旭鹏
刘利军
黄青松
机构
昆明理工大学
信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机
技术
应用重点实验室
出处
《计算机应用与软件》
北大核心
2018年第11期49-54,共6页
基金
国家自然科学基金项目(81360230
81560296)
文摘
现代社交网络的个性化博文推荐中,博文特征选取质量的高低直接影响了推荐的质量和效率。深度模型可以较高质量地提取出文本中句法和语义的特征。然而短文本特征稀疏且未考虑上下文语境的问题,普遍存在于文本推荐任务中。针对以上问题,在现有宽深度模型的基础上,利用门限循环单元对其多层普通神经网络进行改进,提出宽深度门循环联合(Wide&Deep-GRU)模型,进一步探索浅层部分和深度部分的联合训练。使用从新浪微博获取的真实数据集分别与单一逻辑回归模型、单一深度神经网络模型和宽深度模型进行对比。实验表明,该方法整体上推荐质量较高,同时推荐效率较之前模型也有显著提高。
关键词
文本推荐
排序模型
深度学习
门循环神经单元
Keywords
Text recommendation
Sorting model
Deep learning
GRU
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度信念网络的个性化信息推荐
王兆凯
李亚星
冯旭鹏
刘利军
黄青松
刘晓梅
《计算机工程》
CAS
CSCD
北大核心
2016
5
在线阅读
下载PDF
职称材料
2
基于实时词共现网络的微博话题发现
李亚星
王兆凯
冯旭鹏
刘利军
黄青松
《计算机应用》
CSCD
北大核心
2016
5
在线阅读
下载PDF
职称材料
3
基于特征加权的网络不良内容识别方法
俞浩亮
王秋森
冯旭鹏
刘利军
傅铁威
黄青松
《现代电子技术》
北大核心
2016
5
在线阅读
下载PDF
职称材料
4
基于卷积神经网络的跨领域语义信息检索研究
谢先章
王兆凯
李亚星
冯旭鹏
刘利军
黄青松
《计算机应用与软件》
北大核心
2018
3
在线阅读
下载PDF
职称材料
5
基于标签相似度的不良信息多标签分类方法
刘卓然
胡杨
刘骊
冯旭鹏
刘利军
黄青松
《计算机应用研究》
CSCD
北大核心
2016
8
在线阅读
下载PDF
职称材料
6
基于情感角色模型的文本情感分类方法
胡杨
戴丹
刘骊
冯旭鹏
刘利军
黄青松
《计算机应用》
CSCD
北大核心
2015
3
在线阅读
下载PDF
职称材料
7
面向短文本情感分类的特征拓扑聚合模型
胡杨
冯旭鹏
黄青松
付晓东
刘骊
刘利军
《中文信息学报》
CSCD
北大核心
2016
3
在线阅读
下载PDF
职称材料
8
基于用户属性与覆盖范围的意见领袖挖掘研究
李亚星
王兆凯
刘利军
冯旭鹏
黄青松
《计算机应用研究》
CSCD
北大核心
2017
3
在线阅读
下载PDF
职称材料
9
最小费用最大流跨领域情感分类框架
胡杨
冯旭鹏
戴丹
刘利军
黄青松
《小型微型计算机系统》
CSCD
北大核心
2017
1
在线阅读
下载PDF
职称材料
10
面向微博可信度评估的辩论图模型
黄青松
戴丹
冯旭鹏
付晓东
刘骊
刘利军
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2017
1
在线阅读
下载PDF
职称材料
11
基于聚类集成的微博话题发现方法
冯旭鹏
马震
谢波
刘利军
黄青松
《计算机工程与应用》
CSCD
北大核心
2017
0
在线阅读
下载PDF
职称材料
12
基于评价修饰分布差的评论文本倾向性识别方法
冯旭鹏
马震
谢波
刘利军
黄青松
《计算机工程》
CAS
CSCD
北大核心
2016
0
在线阅读
下载PDF
职称材料
13
聊天机器人中用户就医意图识别方法
余慧
冯旭鹏
刘利军
黄青松
《计算机应用》
CSCD
北大核心
2018
10
在线阅读
下载PDF
职称材料
14
基于SOM聚类的微博话题发现
宋莉娜
冯旭鹏
刘利军
黄青松
《计算机应用研究》
CSCD
北大核心
2018
10
在线阅读
下载PDF
职称材料
15
基于LDA的微博用户粉丝亲密度评价模型
王秋森
俞浩亮
徐浩诚
冯旭鹏
刘利军
黄青松
《计算机应用与软件》
CSCD
2016
3
在线阅读
下载PDF
职称材料
16
基于主题角色的文本情感分类方法
刘晨晨
冯旭鹏
胡杨
刘利军
黄青松
段成香
《计算机应用与软件》
2017
2
在线阅读
下载PDF
职称材料
17
基于自动文摘的答案生成方法研究
胡迁
黄青松
刘利军
冯旭鹏
《计算机应用与软件》
北大核心
2018
3
在线阅读
下载PDF
职称材料
18
面向微博博主的评论质量评估
栾杰
刘利军
冯旭鹏
黄青松
《小型微型计算机系统》
CSCD
北大核心
2018
1
在线阅读
下载PDF
职称材料
19
基于多元特征的电商低质量商品评论识别
栾杰
付晓东
冯旭鹏
刘利军
黄青松
刘晓梅
《计算机应用与软件》
2017
1
在线阅读
下载PDF
职称材料
20
基于改进的宽深度模型的推荐方法研究
王艺平
冯旭鹏
刘利军
黄青松
《计算机应用与软件》
北大核心
2018
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部