-
题名基于汉英双语语料的语义精准抽取系统设计
- 1
-
-
作者
周晓航
周晓宇
-
机构
北京信息科技大学
黑龙江省科学院自动化研究所
-
出处
《现代电子技术》
北大核心
2020年第10期156-159,共4页
-
基金
国家自然科学基金青年项目(41504037)
北京信息科技大学重点教学改革项目(2018JGZD12)。
-
文摘
针对原有语义精准抽取系统抽取结果精度较差的问题,设计基于汉英双语语料的语义精准抽取系统。硬件部分沿用原有系统硬件部分,仅对语义信息录入设备与信息存储设备设计。软件部分设计,构建自动语义知识库,增加汉英双语语料信息;根据tf-idf算法制定抽取规则;利用计算机编程语言控制抽取过程,实现精确抽取。至此,基于汉英双语语料的语义精准抽取系统设计完成。构建测试环境,完成性能测试,通过与原有系统对比可知,此系统抽取准确率与信息召回率远高于原有系统。由此可知,该系统抽取精度更高,更为有效。
-
关键词
语义抽取
系统设计
双语语料
制定抽取规则
精准抽取
性能测试
-
Keywords
semantic extraction
system design
bilingual corpus
set extraction rule
precise extraction
performance test
-
分类号
TN912.34-34
[电子电信—通信与信息系统]
TP391
[自动化与计算机技术—计算机应用技术]
-