-
题名基于实体语义扩展的跨境民族文化文本检索
被引量:1
- 1
-
-
作者
毛存礼
郝鹏鹏
雷雄丽
王斌
王红斌
张亚飞
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
昆明冶金高等专科学校
-
出处
《中文信息学报》
CSCD
北大核心
2022年第11期101-109,共9页
-
基金
国家自然科学基金(61732005,61866019,61761026,61972186)
云南省应用基础研究计划重点项目(2019FA023)
+1 种基金
云南省中青年学术和技术带头人后备人才项目(2019HB006)
云南省重大科技专项计划项目(202103AA080015,202002AD080001)。
-
文摘
由于跨境民族相关的文化实体常出现相同实体具有不同名称表达的情况,使用当前主流的文本检索方法在跨境民族文化数据集上将面临语义稀疏的问题。该文提出一种基于实体语义扩展的跨境民族文化检索方法,利用跨境民族文化知识图谱,以知识三元组的形式将跨境民族文化之间的实体关联起来,并添加实体类别标签,以此缓解跨境民族文化实体中语义信息不充分的问题。通过TransH模型对实体及扩展语义信息进行向量化表示,融合到查询文本中进行语义增强,以此提升跨境民族文化文本检索的准确性。实验结果表明,该方法比基线模型提高了5.4%。
-
关键词
文本检索
跨境民族文化
知识图谱
实体语义扩展
-
Keywords
text retrieval
cross border national culture
knowledge graph
entity semantic extension
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-