高水平论文是优秀科技人才的标志性成果之一。聚焦"Web Of Science(WOS)"热点研究学科,在构建学术论文语义Neo4j网络图和挖掘出活跃科研社区基础上,利用PageRank人才挖掘算法实现对科研社区中优秀科研人才的挖掘。首先,对现...高水平论文是优秀科技人才的标志性成果之一。聚焦"Web Of Science(WOS)"热点研究学科,在构建学术论文语义Neo4j网络图和挖掘出活跃科研社区基础上,利用PageRank人才挖掘算法实现对科研社区中优秀科研人才的挖掘。首先,对现有的人才挖掘算法进行详细研究和分析;其次,结合WOS论文数据对PageRank人才挖掘算法进行了优化设计和实现,加入了论文发表的时间因子、作者署名排序递减模型、周围作者节点对当前节点的影响、论文被引用量等多维度考量因素。最后,基于热点学科计算机科学某社区近五年的论文数据进行了实验和验证。结果表明,基于社区的挖掘更具有针对性,能够快速定位各学科代表性优秀和潜在人才,且改进后的算法对人才的发现更加客观有效。展开更多
为了解决传统微博用户影响力评价算法全面性和客观性差的问题,通过对微博用户影响力的定义和影响因素进行分析,鉴于微博社区网络与web页面网络的拓扑结构有着天然相似性的特点,提出了一种基于PageRank的用户影响力评价改进算法(Self and...为了解决传统微博用户影响力评价算法全面性和客观性差的问题,通过对微博用户影响力的定义和影响因素进行分析,鉴于微博社区网络与web页面网络的拓扑结构有着天然相似性的特点,提出了一种基于PageRank的用户影响力评价改进算法(Self and Followers User Influence Rank)SF-UIR.运用用户追随者数、用户是否认证、用户微博的传播能力三个指标对用户自身影响因素进行了量化,改善了PageRank值对用户影响力评价客观性差的问题.采用权重因子将追随者对其所关注用户的影响力贡献值进行科学的量化分配,解决了追随者影响力等值传递的弊端.与四类主流算法的对比实验结果表明:SFUIR算法同时考虑了基于用户行为的自身影响因素和基于拓扑结构的追随者影响因素,能够有效地解决追随者数量排名算法中的"僵尸粉"干扰问题,能比平均转发数算法更真实地反映用户的影响力高低,能有效规避K-覆盖度算法中未考虑微博用户自身行为特征和将所有的追随者都一视同仁的严重缺陷,能极大地改进PageRank算法单纯依赖追随者数量和追随者质量的不足,从而能够更加全面、更加客观地反映微博用户的影响力.展开更多
文摘高水平论文是优秀科技人才的标志性成果之一。聚焦"Web Of Science(WOS)"热点研究学科,在构建学术论文语义Neo4j网络图和挖掘出活跃科研社区基础上,利用PageRank人才挖掘算法实现对科研社区中优秀科研人才的挖掘。首先,对现有的人才挖掘算法进行详细研究和分析;其次,结合WOS论文数据对PageRank人才挖掘算法进行了优化设计和实现,加入了论文发表的时间因子、作者署名排序递减模型、周围作者节点对当前节点的影响、论文被引用量等多维度考量因素。最后,基于热点学科计算机科学某社区近五年的论文数据进行了实验和验证。结果表明,基于社区的挖掘更具有针对性,能够快速定位各学科代表性优秀和潜在人才,且改进后的算法对人才的发现更加客观有效。
文摘为了解决传统微博用户影响力评价算法全面性和客观性差的问题,通过对微博用户影响力的定义和影响因素进行分析,鉴于微博社区网络与web页面网络的拓扑结构有着天然相似性的特点,提出了一种基于PageRank的用户影响力评价改进算法(Self and Followers User Influence Rank)SF-UIR.运用用户追随者数、用户是否认证、用户微博的传播能力三个指标对用户自身影响因素进行了量化,改善了PageRank值对用户影响力评价客观性差的问题.采用权重因子将追随者对其所关注用户的影响力贡献值进行科学的量化分配,解决了追随者影响力等值传递的弊端.与四类主流算法的对比实验结果表明:SFUIR算法同时考虑了基于用户行为的自身影响因素和基于拓扑结构的追随者影响因素,能够有效地解决追随者数量排名算法中的"僵尸粉"干扰问题,能比平均转发数算法更真实地反映用户的影响力高低,能有效规避K-覆盖度算法中未考虑微博用户自身行为特征和将所有的追随者都一视同仁的严重缺陷,能极大地改进PageRank算法单纯依赖追随者数量和追随者质量的不足,从而能够更加全面、更加客观地反映微博用户的影响力.