-
题名一种结合显式特征和隐式特征的开发者混合推荐算法
被引量:18
- 1
-
-
作者
于旭
何亚东
杜军威
王昭哲
江峰
巩敦卫
-
机构
青岛科技大学信息科学技术学院
中国矿业大学信息与电气工程学院
-
出处
《软件学报》
EI
CSCD
北大核心
2022年第5期1635-1651,共17页
-
基金
国家自然科学基金(6217072142,61773384,61973180)
山东省自然科学基金(ZR2021MF092,ZR2019MF014,ZR2018MF007,ZR2019MF033)
山东省重点研发项目(2018GGX101052)。
-
文摘
现有开发者推荐算法通过对任务和开发者的显式信息进行挖掘,抽取任务和开发者的显式特征,完成针对任务的开发者推荐.然而,由于显式信息中的描述信息是主观的,往往是不精确的,现有基于显式特征的开发者推荐算法性能不够理想.众包软件开发平台除包含大量不精确的描述信息外,还包含客观的、较准确的“任务—开发者”成绩信息,可以有效地推断任务和开发者的隐式特征.考虑到隐式特征作为显式特征的补充,将有效缓解描述信息不精确的难题,提出一种结合显式特征和隐式特征的开发者混合推荐算法.首先,利用任务和开发者的平台可见信息充分提取显式特征,提出面向显式特征的因子分解机(FM)推荐模型建模任务、开发者显式特征和相应评分的映射关系.然后,利用“任务—开发者”成绩矩阵提取隐式特征,提出面向隐式特征的矩阵分解(MF)推荐模型.最后,融合面向显式特征的FM推荐模型和面向隐式特征的MF推荐模型,提出多层感知器融合算法.进一步,针对冷启动问题,首先,基于历史数据,构建多层感知器模型建模显式特征到隐式特征的映射关系.然后,针对冷启动任务或冷启动开发者,通过任务或开发者的显式特征求解相应的隐式特征.最后,基于已训练好的多层感知器融合算法预测评分.在Topcoder软件众包平台的仿真实验表明本文算法相对于对比算法在4种不同测试指标上具有明显的优势.
-
关键词
软件众包开发
开发者推荐
混合推荐算法
冷启动难题
多层感知器融合模型
因子分解机
-
Keywords
crowdsourcing software development
developer recommendation
hybrid recommendation algorithm
cold-start problem
multilayer perceptron fusion algorithm
factorization machine(FM)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于多关系知识增强的开发者推荐算法
被引量:1
- 2
-
-
作者
杜军威
王昭哲
于旭
胡强
江峰
巩敦卫
-
机构
青岛科技大学信息科学技术学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2023年第11期3111-3119,共9页
-
基金
国家自然科学基金(No.62172249,No.61973180)
山东省自然科学基金(No.ZR2021MF092,No.ZR2022MF326)
中央高校基本科研业务费(No.93K172022K01)。
-
文摘
近年来,随着众包平台的不断发展,信息过载问题日趋严重,任务难以及时找到可靠的开发者完成,为任务推荐合适的开发者变得至关重要.传统推荐方法存在两大挑战:一是任务和开发者的文本特征高度简练,传统推荐方法聚焦于表面文本信息,未发现其中包含的大量知识实体;二是任务具有一次性,导致显式交互数据极其稀疏.为了解决上述挑战,本文提出一种基于多关系知识增强的开发者推荐算法.对于一个任务和开发者,首先将他们包含的文本内容中的每个单词与知识图谱中的相关实体关联起来,用于丰富任务和开发者的信息表示.除直接相关联的实体外,还使用每个实体的上下文实体集合来提供更多的信息.然后,对于开发者本文使用多关系邻域聚合的方式增强其特征表示,并使用注意力模块区分开发者对任务的关注度.最终获得的用户和开发者的嵌入输入到深度神经网络中进行预测.在真实的Topcoder数据集上进行广泛的实验,结果表明,本文方法在正确率和序位倒数均值上相比于最佳对比方法平均提高11.7%和17.5%.
-
关键词
开发者推荐
软件众包开发
多关系
知识图谱
图神经网络
-
Keywords
developer recommendation
crowdsourced software development
multi-relationship
knowledge graph
graph neural network
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-