题名 一种数学检索结果排序中的多隶属度评价方法
被引量:3
1
作者
王海彬
田学东
张凯歌
崔晓娟
史青宣
李新福
机构
河北大学网络空间安全与计算机学院
出处
《科学技术与工程》
北大核心
2019年第8期164-170,共7页
基金
国家自然科学基金(61375075)
河北省教育厅河北省高等学校科学技术研究重点项目(ZD2017208
+2 种基金
ZD2017209)
河北省教育厅青年项目(QN2018214)
河北大学"一省一校"项目资助
文摘
针对现有数学检索排序方法所存在的排序属性单一问题,提出一种基于犹豫模糊距离的科技文档多属性综合排序方法。归纳科技文档的评价特征,确立了包括数学表达式几何属性、文档重要性属性和全局属性的三元组;建立以数学查询表达式为标准的科技文档犹豫模糊集,定义了各指标对应的犹豫模糊隶属度函数;利用犹豫模糊集在多属性决策方面的优势,采用文档相似度评价方法对检索结果进行排序。不同领域包含345 027个数学表达式的19 964篇科技文档的排序对比实势表明,此方法比科技文档单一属性排序方法的合理性有一定的提高。
关键词
数学检索
数学 表达式
科技文档
犹豫模糊集
排序
Keywords
math retrieval
mathematical expressions
scientific documents
hesitant fuzzy set sorting
分类号
O223
[理学—运筹学与控制论]
O159
[理学—基础数学]
题名 基于Ontology扩展查询的数学表达式检索模型
被引量:2
2
作者
李新福
徐筱
田学东
机构
河北大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第5期155-161,共7页
基金
国家自然科学基金(61375075)
河北省教育厅高等学校科学技术研究重点项目(ZD2017208
ZD2017209)
文摘
针对现有数学表达式检索系统中待检索表达式与目标文档之间的语义关联问题,在使用序列化特征提取方法解析La Te X表达式的基础上,提出一种基于Ontology的数学表达式检索方法。运用Ontology建立数学表达式及其概念之间的联系并构建数学表达式语义本体库,以达到输入关键词、概念、短语和数学名词可检索数学表达式语义相关文献的目的。实验结果表明,基于Ontology的数学表达式检索方法运用本体概念扩展查询结果集,使得查全率、查准率和扩展率均有一定程度提高。
关键词
数学 表达式检索
语义
序列化特征提取
本体
查询扩展
Keywords
mathematical expression retrieval
semantics
Serialized Feature Extraction (SFE)
ontology
query expansion
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 引入IVHFS的数学表达式检索结果排序方法
3
作者
韩苹
田学东
机构
河北大学网络空间安全与计算机学院
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第1期34-40,共7页
基金
国家自然科学基金项目(61375075)资助
河北省自然科学基金项目(F2019201329)资助
河北省教育厅河北省高等学校科学技术研究重点项目(ZD2017208)资助。
文摘
针对数学表达式表达形式多样、语法语义变换丰富给基于数学表达式的检索结果排序所带来的困难,提出一种基于IVHFS(Interval Valued Hesitation Fuzzy Sets)的数学表达式检索结果排序算法,利用IVHFS在排序中可以完整保留属性信息的优势,改善排序性能.首先,通过对数学表达式检索特征的归纳,确定数学表达式检索结果的排序属性;然后,利用所归纳的数学排序属性构造IVHFS集合;最后,采用IVHFS相似性测度计算出数学表达式之间的相似度,进而得出排序结果.本实验从公共数据集NTCIR-12_Math IR_Wikipedia_Corpus中获取了528188个数学表达式作为实验数据集,并设计了子式空间结构属性、运算符关联属性以及运算数关联属性作为评价指标,从而实现数学表达式检索结果的排序.实验结果表明,检索系统的查全率和查准率分别为75.8%和66.4%,其检索结果排序效果更加合理.
关键词
数学检索
检索 结果排序
区间值犹豫模糊集
多属性决策
相似度
Keywords
math retrieval
sorting of retrieval results
interval-valued hesitation fuzzy sets
multi-attribute decision making
similarity degree
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于数学文本和表达式转换的融合检索模型
被引量:4
4
作者
张倩倩
田学东
杨芳
李新福
机构
河北大学网络空间安全与计算机学院
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第3期175-181,187,共8页
基金
国家自然科学基金(61375075)
河北省教育厅河北省高等学校科学技术研究重点项目(ZD2017208
+1 种基金
ZD2017209)
河北大学"一省一校"项目
文摘
数学信息检索中查询式和检索结果以数学表达式为主,忽略了文档中数学文本语义。为此,提出一种融入数学文本特征的数学表达式检索模型。对中文科技文档进行遍历提取数学文本,利用数学字典将其映射为LaTeX数学表达式,并转化为二叉树结构。在此基础上,构建数学表达式索引,设计匹配算法,从而实现数学文本和表达式检索。实验结果表明,该方法提高了数学检索系统的检索效率。
关键词
数学 信息检索
数学 文本
数学 表达式
词典
索引
Keywords
Mathematical Information Retrieval(MIR)
mathematical text
mathematical expression
dictionary
index
分类号
TP399
[自动化与计算机技术—计算机应用技术]
题名 基于运算符信息的数学表达式检索方法
被引量:2
5
作者
徐以聪
田学东
左丽娜
机构
河北大学网络空间安全与计算机学院
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第4期77-84,共8页
基金
国家自然科学基金(61375075)
河北省自然科学基金(F2019201329)
河北省高等学校科学技术研究重点项目(ZD2017208,ZD2019131)。
文摘
传统的文本检索技术主要面向一维文本,难以用于对二维结构数学表达式的检索.针对该问题,通过引入公式描述结构,实现基于运算符信息的数学表达式检索.利用公式描述结构提取算法获取LaTeX数学表达式的节点信息,从而得到公式骨架存储结构.在此基础上,选择运算符值为1的节点及其相关文档建立索引,并通过数学表达式匹配算法得到与输入相似的表达式集合.实验结果表明,该方法能够从519 588个数学表达式中快速、准确地找到相似表达式,并且不受一般运算数的影响.
关键词
数学 表达式检索
运算符信息
公式描述结构
LaTeX系统
相似表达式
Keywords
mathematical expression retrieval
operator information
Formula Description Structure(FDS)
LaTeX system
similar expression
分类号
TP391
[自动化与计算机技术—计算机应用技术]