面向开源项目推荐开发人员对开源生态建设具有重要意义。区别于传统软件开发,开源领域的开发者、项目、组织及相互关系体现了开放式协作项目的特点,而它们蕴含的语义有助于精准推荐开源项目的开发者。因此,提出一种基于协作贡献网络(CCN...面向开源项目推荐开发人员对开源生态建设具有重要意义。区别于传统软件开发,开源领域的开发者、项目、组织及相互关系体现了开放式协作项目的特点,而它们蕴含的语义有助于精准推荐开源项目的开发者。因此,提出一种基于协作贡献网络(CCN)的开发者推荐(DRCCN)方法。首先,利用开源软件(OSS)开发者、OSS项目、OSS组织之间的贡献关系构建CCN;其次,基于CCN构建一个3层深度的异构GraphSAGE(Graph SAmple and aggreGatE)图神经网络(GNN)模型,预测开发者节点和开源项目节点之间的链接,从而产生相应的嵌入对;最后,根据预测结果,采用K最近邻(KNN)算法完成开发者推荐。在GitHub数据集上训练和测试模型的实验结果表明,相较于序列推荐的对比学习模型CL4SRec(Contrastive Learning for Sequential Recommendation),DRCCN在精确率、召回率和F1值这3个指标上分别提升了约10.7%、2.6%和4.2%。因此,所提模型可以为开源社区项目的开发者推荐提供重要的参考依据。展开更多
文摘现有的基于双向长短时记忆(BiLSTM)网络的命名实体识别(NER)模型难以全面理解文本的整体语义以及捕捉复杂的实体关系。因此,提出一种基于全域信息融合和多维关系感知的NER模型。首先,通过BERT(Bidirectional Encoder Representations from Transformers)获取输入序列的向量表示,并结合BiLSTM进一步学习输入序列的上下文信息。其次,提出由梯度稳定层和特征融合模块组成的全域信息融合机制:前者使模型保持稳定的梯度传播并更新优化输入序列的表示,后者则融合BiLSTM的前后向表示获取更全面的特征表示。接着,构建多维关系感知结构学习不同子空间单词的关联性,以捕获文档中复杂的实体关系。此外,使用自适应焦点损失函数动态调整不同类别实体的权重,提高模型对少数类实体的识别性能。最后,在7个公开数据集上将所提模型和11个基线模型进行对比,实验结果表明所提模型的F1值均优于对比模型,可见该模型的综合性较优。
文摘面向开源项目推荐开发人员对开源生态建设具有重要意义。区别于传统软件开发,开源领域的开发者、项目、组织及相互关系体现了开放式协作项目的特点,而它们蕴含的语义有助于精准推荐开源项目的开发者。因此,提出一种基于协作贡献网络(CCN)的开发者推荐(DRCCN)方法。首先,利用开源软件(OSS)开发者、OSS项目、OSS组织之间的贡献关系构建CCN;其次,基于CCN构建一个3层深度的异构GraphSAGE(Graph SAmple and aggreGatE)图神经网络(GNN)模型,预测开发者节点和开源项目节点之间的链接,从而产生相应的嵌入对;最后,根据预测结果,采用K最近邻(KNN)算法完成开发者推荐。在GitHub数据集上训练和测试模型的实验结果表明,相较于序列推荐的对比学习模型CL4SRec(Contrastive Learning for Sequential Recommendation),DRCCN在精确率、召回率和F1值这3个指标上分别提升了约10.7%、2.6%和4.2%。因此,所提模型可以为开源社区项目的开发者推荐提供重要的参考依据。