期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
中文专利文献术语自动识别研究 被引量:8
1
作者 杨双龙 吕学强 +1 位作者 李卓 徐丽萍 《中文信息学报》 CSCD 北大核心 2016年第3期111-117,124,共8页
中文专利文献中含有大量领域术语,对这些术语进行自动识别是信息抽取、文本挖掘等领域的重要任务。该文提出了基于专利文献标题的术语词性规则自动生成方法以及针对候选术语排序的TermRank算法。该方法首先从大量的中文专利文献标题中... 中文专利文献中含有大量领域术语,对这些术语进行自动识别是信息抽取、文本挖掘等领域的重要任务。该文提出了基于专利文献标题的术语词性规则自动生成方法以及针对候选术语排序的TermRank算法。该方法首先从大量的中文专利文献标题中自动生成词性规则;然后利用生成的词性规则对中文专利文献正文部分进行规则匹配获得候选术语表;再利用提出的TermRank排序算法对候选术语表排序,最终得到术语列表。通过在9 725篇中文专利文献数据上实验,证实了该方法的有效性。 展开更多
关键词 术语自动识别 专利文献 信息抽取 文本挖掘
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部