摘要
[目的/意义]旨在研究引文分析中引入情感分析后对论文排名的影响。[方法/过程]提出一种引文情感分析方法,确定引文文本中的情绪,并使用监督分类器为每个文本句分配一个分数来确定其情感倾向,利用C4.5决策树对引文的极性进行分类;提出一个考虑定量(引用次数)和定性(情感分析)因素的论文评价指数pc指数,并基于该指数对论文进行了排名。[结果/结论]C4.5决策树对引文的极性进行分类,获得了较为准确的结果;pc指数对朴素算法进行改进后获得了对被引论文的影响力新的排名,排名对于较小的语料库影响不大(只有4篇论文排名发生了变化),而对于更大的语料库,预计影响会更大。
[Purpose/significance]The paper is to study the impact of citation analysis on the ranking of papers after the introduction of sentiment analysis.[Method/process]The paper proposes a citation sentiment analysis method to determine the emotions in the citation text uses the supervised classifier to assign a score to each text sentence and uses C4.5 decision tree to classify the polarity of citations;proposes a paper evaluation index(pc index)which is in consideration of the quantitative(number of references)and qualitative(sentiment analysis)factors,and ranks the papers based on the index.[Result/conclusion]The C4.5 decision tree classifies the polarity of citations and obtains more accurate results.It obtains a new ranking of the influence on the cited papers after using pc index to improve the naive algorithm.The ranking has little effect on the smaller corpus(only four papers have changed in ranking)while for larger corpora the impact is expected to be greater.
作者
尹莉
Yin Li(Library of Chang’an University,Xi’an Shannxi 710064;Literature Resources Institute of Chang’an University,Xi’an Shannxi 710064)
出处
《情报探索》
2020年第4期9-15,共7页
Information Research
基金
教育部人文社会科学研究一般项目“引文分析中引入‘极性’概念的实证研究”(项目编号:17XJC870002)
2017年中央高校基本科研业务费资助项目“陕西省高校智库建设的资源状况及政府扶持政策研究”(项目编号:310850170443)
中央高校教育教学改革专项经费资助项目(项目编号:300103191819)科研成果之一。
关键词
情感分析
引用
引用极性
排名
文献计量学
sentiment analysis
citation
citation polarity
rank
bibliometrics
作者简介
尹莉(1982-),女,博士,副研究馆员,研究方向为情报分析、引文分析。