-
题名基于卷积神经网络的微博情感倾向性分析
被引量:99
- 1
-
-
作者
刘龙飞
杨亮
张绍武
林鸿飞
-
机构
大连理工大学信息检索实验室
-
出处
《中文信息学报》
CSCD
北大核心
2015年第6期159-165,共7页
-
基金
国家自然科学基金(61277370
61402075)
+5 种基金
国家863高科技计划资助项目(2006AA01Z151)
辽宁省自然科学基金(201202031
2014020003)
教育部留学回国人员科研启动基金
高等学校博士学科点专项科研基金(20090041110002)
中央高校基本科研业务费专项资金资助
-
文摘
微博情感倾向性分析旨在发现用户对热点事件的观点态度。由于微博噪声大、新词多、缩写频繁、有自己的固定搭配、上下文信息有限等原因,微博情感倾向性分析是一项有挑战性的工作。该文主要探讨利用卷积神经网络进行微博情感倾向性分析的可行性,分别将字级别词向量和词级别词向量作为原始特征,采用卷积神经网络来发现任务中的特征,在COAE2014任务4的语料上进行了实验。实验结果表明,利用字级别词向量及词级别词向量的卷积神经网络分别取得了95.42%的准确率和94.65%的准确率。由此可见对于中文微博语料而言,利用卷积神经网络进行微博情感倾向性分析是有效的,且使用字级别的词向量作为原始特征会好于使用词级别的词向量作为原始特征。
-
关键词
深度学习
情感倾向性分析
卷积神经网络
词向量
-
Keywords
deep learning
sentiment analysis
convolutional neural networks
word embeddilig
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向社交网络的潜在药物不良反应发现
被引量:7
- 2
-
-
作者
赵明珍
林鸿飞
徐博
郝辉辉
-
机构
大连理工大学信息检索实验室
-
出处
《中文信息学报》
CSCD
北大核心
2017年第5期194-202,共9页
-
基金
国家自然科学基金(61572102
61632011
+1 种基金
61772103)
中央高校基本科研业务费(DUT16ZD216)
-
文摘
随着互联网的发展,社交网络中积累了大量的医疗健康领域的文本数据。该文利用基于信息熵的方法,从健康社交网络中的用药者评论数据中识别药物的潜在不良反应;同时,对于潜在药物不良反应,该文提出了基于Word2vec和Skip-gram模型的蛋白质关联紧密度函数,尽最大努力发现药物引起其"潜在"不良反应的证据链。实验证明,该方法用来寻求潜在药物不良反应证据链是有效的。
-
关键词
社交网络
药物不良反应
信息熵
Word2vec
Skip-gram
-
Keywords
social networks
adverse drug reactions
information entropy
Word2vec
Skip-gram
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于pu-learning的同行评议文本情感分析
被引量:4
- 3
-
-
作者
林原
王凯巧
杨亮
林鸿飞
任璐
丁堃
-
机构
大连理工大学科学学与科技管理研究所
中国科学院声学研究所南海研究站
大连理工大学信息检索实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第3期143-149,共7页
-
基金
国家自然科学基金面上项目(61976036,61772103)
大连理工大学研究生教改基金(JG_2021040)。
-
文摘
最近几年逐渐出现了对同行评议文本情感分析的研究,包括通过同行评议文本预测审稿人的推荐状态的任务。现有模型融入了论文本身或摘要信息,采用神经网络学习论文或摘要的高层表示,结合同行评议文本预测审稿人的推荐状态,这使得模型变得非常复杂的同时结果却没有实质性的提高。为此,提出了OSA机制来提高情感分析模型中对观点句的关注度。具体来说,采用pu-learning从同行评议文本的前N个句子中学习观点句的特征,使每一个句子都得到一个观点句权重,将其应用于情感分析模型的倒数第二层,由此得到最终的预测结果。在ICLR2017—2018数据集上使用不同的情感分析模型对OSA进行了评估,实验结果验证了OSA的高效性,并在两个数据集上取得了优异的性能。
-
关键词
同行评议
情感分析
pu-learning
数据挖掘
-
Keywords
peer review
sentiment analysis
pu-learning
data mining
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多特征融合的谐音广告语生成模型
被引量:2
- 4
-
-
作者
徐琳宏
林鸿飞
祁瑞华
杨亮
-
机构
大连外国语大学软件学院
大连理工大学信息检索实验室
-
出处
《中文信息学报》
CSCD
北大核心
2018年第10期109-117,共9页
-
基金
国家自然科学基金(61632011)
国家自然科学基金(61702080
+5 种基金
61501082)
国家社会科学基金(15BYY028)
辽宁省自然科学基金(20170540230
2015020017
20170540232)
辽宁省优秀人才项目(LJQ2014127)
-
文摘
广告语是广告传播中不可或缺的一部分,凝练着品牌的核心价值。该文以古代诗词为基础,通过多特征融合的方式,提出谐音广告语群的生成及评估模型。在生成模型中,首先利用语音模板,获取候选广告语群。同时分别通过语音、形状、语义和情境四个维度,计算广告语的九大特征,得到候选广告语群的特征矩阵。最后采用基于主成分分析和权重的双序评估算法,筛选出高分广告语群。实验结果表明,四个维度的特征细致地刻画了广告语,在生成的特征矩阵基础上,双序评估算法能够准确地评估广告语的质量,与人工评估结果基本接近,有一定的实用价值。
-
关键词
特征融合
广告语群
双序评估
-
Keywords
features fusion
homophonic advertising cluster
evaluation algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名维基百科中争议性文章的发现方法研究
被引量:1
- 5
-
-
作者
常天舒
林鸿飞
-
机构
大连理工大学信息检索实验室
-
出处
《中文信息学报》
CSCD
北大核心
2014年第4期76-83,共8页
-
基金
国家自然科学基金(60673039
60973068)
+3 种基金
国家社科基金(08BTQ025)
教育部留学回国人员科研启动基金
高等学校博士学科点专项科研基金资助课题(20090041110002
201100411100 34)
-
文摘
维基百科收录的文章和参与编辑的用户日益增多,其中不乏一些用户对同一条目持有不同的见解。该文旨在发现维基百科中的争议性文章,通过维基百科提供的历史信息,在传统的挖掘方法基础上,对具有特殊属性的用户角色进行总结并融合到排序模型中,探讨这类用户对争议性文章挖掘的作用。在16 745篇文章组成的数据集上进行了实验,除传统的PRF和NDCG评价外,该文给出了更直观的排序结果,与其他基准模型相比有较大的提升。
-
关键词
维基百科
争议度排序
社会网络分析
-
Keywords
Wikipedia
Controversy Rank
Social Network Analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-