对学术机构进行客观公正的评价是科研管理过程中不可或缺的工作,基于网络计量学的机构影响力评价成为学术机构评价研究中有别于传统文献计量方法的另外一种有效的评价手段。为了进一步探讨不同的分析策略对网络影响力的评价效果的影响,...对学术机构进行客观公正的评价是科研管理过程中不可或缺的工作,基于网络计量学的机构影响力评价成为学术机构评价研究中有别于传统文献计量方法的另外一种有效的评价手段。为了进一步探讨不同的分析策略对网络影响力的评价效果的影响,文章以我国342所大学作为研究样本,对比分析不同Web数据采集策略下,利用不同评价指标对机构的网络影响力进行评价的可靠性。研究结果表明,机构入链所属的大学域名的数量指标RD_EDU以及学院层面的链接指标Linknet与多个大学排名之间的平均相关系数接近0.8,并且高于以Webometrics Ranking of World Universities和uni Rank为代表的网络影响力排名与ARWU、CARK和CUAA等大学排名之间的相关性强度。展开更多
古籍文本中存在大量事实上的引文条目,即引书。目前,引文分析法多基于现代文本开展研究,学术界对古籍文本中的引用现象的关注较少。本文将引文分析法应用于古籍文本,计算和分析引书的引文指标,为古籍文本的引书计量学研究建立初步框架...古籍文本中存在大量事实上的引文条目,即引书。目前,引文分析法多基于现代文本开展研究,学术界对古籍文本中的引用现象的关注较少。本文将引文分析法应用于古籍文本,计算和分析引书的引文指标,为古籍文本的引书计量学研究建立初步框架。本文选择《十三经注疏》中的《论语注疏》《毛诗正义》《春秋左传正义》三部典籍为研究对象,分别基于CRF(conditional random field)模型、Bi-LSTM(bidirectional long short-term memory)模型以及Bi-LSTM-CRF模型,从古籍文本中自动识别引书条目,并对比抽取性能,利用引文分析方法计算并分析了三部典籍中引书的各项引文计量指标,进而分析古籍文本之间的知识关联,探讨古人的引用行为。研究结果表明,机器学习模型应用于引书条目的自动识别整体效果良好,两种深度学习模型表现更佳,CRF模型存在明显差距。在两种深度学习模型中,Bi-LSTM-CRF模型性能略好。古籍文本之间的关联强度不一,引书的规模受多方因素影响,经部文献的被引次数占比最高,经部文献中的礼制类文献尤甚。此外,古人的引用行为也受成书目的、学者知识背景、引书文献获取难易程度等多重因素的影响。展开更多
针对基因组新测序物种缺乏高质量的基因结构用于从头预测软件训练的现状,本文提出了一种以新测序物种自身RNA-seq组装为基础的可靠基因训练集构建方法(Building reliable training gene set,BRTGS)。该方法利用RNA-seq组装获得大量初始...针对基因组新测序物种缺乏高质量的基因结构用于从头预测软件训练的现状,本文提出了一种以新测序物种自身RNA-seq组装为基础的可靠基因训练集构建方法(Building reliable training gene set,BRTGS)。该方法利用RNA-seq组装获得大量初始基因结构,然后根据蛋白同源证据筛选具有正确且编码区相对完整的基因结构,最后综合利用RNA-seq组装结构和蛋白同源证据统计信息确定的基因起始密码子和终止密码子位置,从而获得基因完整的编码结构。实验结果表明,该方法不仅可为各种组装水平的基因组构建高质量的基因训练集,而且从头预测软件在这些基因集上训练后能够获得很好的预测性能。展开更多
文摘对学术机构进行客观公正的评价是科研管理过程中不可或缺的工作,基于网络计量学的机构影响力评价成为学术机构评价研究中有别于传统文献计量方法的另外一种有效的评价手段。为了进一步探讨不同的分析策略对网络影响力的评价效果的影响,文章以我国342所大学作为研究样本,对比分析不同Web数据采集策略下,利用不同评价指标对机构的网络影响力进行评价的可靠性。研究结果表明,机构入链所属的大学域名的数量指标RD_EDU以及学院层面的链接指标Linknet与多个大学排名之间的平均相关系数接近0.8,并且高于以Webometrics Ranking of World Universities和uni Rank为代表的网络影响力排名与ARWU、CARK和CUAA等大学排名之间的相关性强度。
文摘古籍文本中存在大量事实上的引文条目,即引书。目前,引文分析法多基于现代文本开展研究,学术界对古籍文本中的引用现象的关注较少。本文将引文分析法应用于古籍文本,计算和分析引书的引文指标,为古籍文本的引书计量学研究建立初步框架。本文选择《十三经注疏》中的《论语注疏》《毛诗正义》《春秋左传正义》三部典籍为研究对象,分别基于CRF(conditional random field)模型、Bi-LSTM(bidirectional long short-term memory)模型以及Bi-LSTM-CRF模型,从古籍文本中自动识别引书条目,并对比抽取性能,利用引文分析方法计算并分析了三部典籍中引书的各项引文计量指标,进而分析古籍文本之间的知识关联,探讨古人的引用行为。研究结果表明,机器学习模型应用于引书条目的自动识别整体效果良好,两种深度学习模型表现更佳,CRF模型存在明显差距。在两种深度学习模型中,Bi-LSTM-CRF模型性能略好。古籍文本之间的关联强度不一,引书的规模受多方因素影响,经部文献的被引次数占比最高,经部文献中的礼制类文献尤甚。此外,古人的引用行为也受成书目的、学者知识背景、引书文献获取难易程度等多重因素的影响。
文摘针对基因组新测序物种缺乏高质量的基因结构用于从头预测软件训练的现状,本文提出了一种以新测序物种自身RNA-seq组装为基础的可靠基因训练集构建方法(Building reliable training gene set,BRTGS)。该方法利用RNA-seq组装获得大量初始基因结构,然后根据蛋白同源证据筛选具有正确且编码区相对完整的基因结构,最后综合利用RNA-seq组装结构和蛋白同源证据统计信息确定的基因起始密码子和终止密码子位置,从而获得基因完整的编码结构。实验结果表明,该方法不仅可为各种组装水平的基因组构建高质量的基因训练集,而且从头预测软件在这些基因集上训练后能够获得很好的预测性能。