-
题名BLAST序列比对与生物医学文献检索
被引量:9
- 1
-
-
作者
丁六松
张宇伟
-
机构
浙江大学医学图书馆
浙江大学医学院病理学与法医学研究所
-
出处
《情报杂志》
CSSCI
北大核心
2003年第4期74-75,共2页
-
文摘
生物信息学的急速发展及其数据库的急剧增长给文献检索提出了新课题。利用生物信息相关数据库需要结合生物信息学知识。本研究从新基因的名词与序列入手 ,介绍NCBI的ENTREZ、BLAST检索 ,阐明与基因相关的文献检索的方法与技巧 ,着重介绍了BLAST序列比对在信息检索中的步骤和作用。
-
关键词
BLAST序列比对
生物医学文献检索
生物信息学
数据库
基因
-
分类号
G354.4
[文化科学—情报学]
Q811.4
[生物学—生物工程]
-
-
题名一种融合语义资源的生物医学查询理解方法
被引量:5
- 2
-
-
作者
徐博
林鸿飞
林原
许侃
-
机构
大连理工大学计算机科学与技术学院
大连理工大学公共管理与法学学院
认知智能国家重点实验室(科大讯飞)
-
出处
《计算机学报》
EI
CSCD
北大核心
2019年第10期2160-2174,共15页
-
基金
国家自然科学基金(61632011,61572102,61602078,61562080)
认知智能国家重点实验室开放基金(COGOS-20190001)
+2 种基金
博士后科学基金面上项目(2018M641691)
教育部人文社会科学基金青年项目(19YJCZH199)
中央高校基本科研业务费专项资金(DUT18ZD102)资助~~
-
文摘
近年来,随着生物医学相关研究的快速发展,生物医学文献的数量与日俱增,相关人员从海量文献中获取所需信息变得越来越困难,信息检索技术能够为用户提供所需信息,但由于领域专业度高,术语庞杂,传统通用领域的检索技术往往很难胜任这项任务,而生物医学领域存在丰富的语义资源,这些资源涵盖该领域专业术语,可以对文献检索起到辅助和提升作用.因此,为进一步提升生物医学文献检索的性能,该文尝试基于词共现查询扩展模型,结合生物医学领域特征,利用医学主题词表衡量扩展词的重要性,综合权衡扩展词与查询词的共现关系和扩展词在医学主题词表中的分布情况,选择优质扩展词;并在此基础上提出一种基于组排序学习的监督式查询扩展方法,该方法根据候选扩展词对检索性能的影响和候选扩展词能否反映查询的主题信息两个方面对扩展词进行相关性标注,提取与扩展词相关的上下文特征和领域语义特征对扩展词进行向量化表示,最后采用组排序学习方法训练扩展词选择模型,完成查询扩展.在TREC基因任务数据集上的实验结果表明,该方法能够有效提升查询扩展性能,与基于排序学习方法ListMLE的监督式查询扩展方法相比,在文档平均准确率方面分别提升4.41%和11.35%,有效提升了生物医学文献检索的综合性能.
-
关键词
生物医学文献检索
医学主题词表
词共现模型
查询扩展
组排序
-
Keywords
biomedical literature retrieval
medical subject headings
co-occurrence model
query expansion
group ranking
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-