-
题名基于字典匹配和支持向量机的中文科技论文元数据抽取
被引量:3
- 1
-
-
作者
刘宇
钱跃
-
机构
大连理工大学软件学院
-
出处
《工程数学学报》
CSCD
北大核心
2012年第4期586-592,共7页
-
基金
国家自然科学基金(60803074)
中央高校基本科研业务费专项资金(DUT10JR06)~~
-
文摘
针对中文PDF格式论文元数据抽取问题,对大量中文科技论文进行分析归纳,总结出中文论文元数据的互不包含性、排它性、重复性、顺序性和部分确定性,并据此定义简单元数据和复杂元数据的概念,应用字典匹配和支持向量机模型抽取中文科技论文元数据.实验结果表明,该模型的综合性能指标在96%以上,优于条件随机场模型和隐马尔科夫模型.
-
关键词
元数据抽取
抽取模型
字典匹配
支持向量机
中文科技论文
-
Keywords
metadata extraction
extraction model
dictionary matching
support vector machine
Chinese papers
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名医学博士科研产出统计分析
被引量:3
- 2
-
-
作者
黄太平
董晓建
扈国栋
-
机构
第四军医大学训练部
第四军医大学医学教育研究中心
-
出处
《中国医药导报》
CAS
2016年第1期147-150,共4页
-
文摘
目的了解我国医学博士在校学习期间的科研产出情况,为促进博士科研产出提供参考。方法对某军医大学2005-2014年间博士生发表SCI/EI、CSTPC/CSSCI论文数量、申请课题、申报专利、参与编写书籍、参与国内国际会议及大会论文收录等进行统计,数据采用Excel录入,结果运用相关分析、t检验、方差分析进行比较分析。结果 2005-2014年间,某军医大学博士科研产出数量增长较快,共发表SCI/EI论文3177篇,CSTPC/CSSCI论文3000篇,不同学科人均发表论文数量差异明显。申请各类课题366项,申报专利204项,参加国内国际会议及大会交流3713次,参与编写书籍191部。结论某军医大学博士科研产出数量逐年提升,科研产出主要体现在发表学术论文上,存在着科研能力水平差异较大、层次不一等问题。
-
关键词
科研产出
科学引文索引/工程索引
中国科技论文与引文数据库/中文社会科学引文索引
科研能力
-
Keywords
Scientific research output
SCI/EI
CSTPC/CSSCI
Scientific research ability
-
分类号
R643
[医药卫生—外科学]
-