期刊文献+
共找到169篇文章
< 1 2 9 >
每页显示 20 50 100
一种基于文本相似计算的校园智能问答系统设计 被引量:3
1
作者 李月 周江 《现代信息科技》 2019年第22期9-12,17,共5页
问答系统是继搜索引擎之后诞生的又一用来帮助用户在海量数据中提高检索效率的系统。目前常见的问答系统主要应用于商业领域,针对在校学生这一特定用户群体的智能问答系统并不多见。本文在分析问答系统现状以及建设难点的基础上,提出了... 问答系统是继搜索引擎之后诞生的又一用来帮助用户在海量数据中提高检索效率的系统。目前常见的问答系统主要应用于商业领域,针对在校学生这一特定用户群体的智能问答系统并不多见。本文在分析问答系统现状以及建设难点的基础上,提出了一种面向学校这一特定领域的,用来提升在校学生学习、生活质量的校园智能问答系统建设方法,并从语料库建设方法、问题及答案提取等多个方面进行了详细阐述。 展开更多
关键词 问答系统 文本处理 相似计算 语料库
在线阅读 下载PDF
中医古文相似度计算研究:一种以生成式AI融合领域知识的SimCSE方法
2
作者 张君冬 刘江峰 +2 位作者 邓景鹏 刘艳华 黄奇 《现代情报》 北大核心 2025年第4期49-59,共11页
[目的/意义]为构建专门适用于中医古籍文本的相似度计算模型,解决BERT在中医古籍文本上语义表征困难和数据标注成本高昂的问题。[方法/过程]本文在多个模型增量预训练的基础上,利用生成式AI生成全部任务数据,结合SimCSE方法,对比不同训... [目的/意义]为构建专门适用于中医古籍文本的相似度计算模型,解决BERT在中医古籍文本上语义表征困难和数据标注成本高昂的问题。[方法/过程]本文在多个模型增量预训练的基础上,利用生成式AI生成全部任务数据,结合SimCSE方法,对比不同训练方式、预训练模型、正负样本构造方法、正样本混合策略的作用。[结果/结论]研究结果显示,无监督学习模型性能普遍偏低,引入AI生成的正负样本对后性能明显提升。其中,使用AI构建的语义不同的、相似性较低的负样本,并与采用AI辅助的同义词替换方法构建的正样本混合而成的训练集上,TCM-Gujiroberta模型性能最佳,达到90.9%;此外,选择相似性较低的负样本并随机混合不同类型正样本的数据集可进一步提升模型性能。本研究在零样本情境下,设计出一种融合中医古籍知识的SimCSE相似度计算模型,可为古籍研究和应用提供支持,未来考虑在数据集构建策略方面进一步优化。 展开更多
关键词 中医古籍 相似计算 预训练语言模型 SimCSE AIGC
在线阅读 下载PDF
基于多模态知识的垂直行业领域精准计算实现方法研究
3
作者 左春 王洋 《河北省科学院学报》 2025年第1期7-12,33,共7页
人工智能生成内容(artificial intelligence generated content,AIGC)为多模态数据下的精准计算提供了补充手段。然而,人工智能(artificial intelligence,AI)模型在工程化应用中面临模型收敛、训练稳定性、可停止性和成本等问题。本研... 人工智能生成内容(artificial intelligence generated content,AIGC)为多模态数据下的精准计算提供了补充手段。然而,人工智能(artificial intelligence,AI)模型在工程化应用中面临模型收敛、训练稳定性、可停止性和成本等问题。本研究旨在解决垂直行业领域实现精准计算所面临的关键挑战,包括轻基座模型的选择尺度、降低基座模型的“幻觉”比例,以及如何将现有的多模态知识和多样化工具与AIGC有效结合。为此,提出了一种基于多模态知识的垂直行业领域精准计算实现方法。该方法主要包括三个核心设计思路:①基于领域数据字典和词根表对基座模型进行维度裁剪,确保基座模型的轻量级;②利用领域基础事实内容构建长链知识用例库和标准集,使模型的归纳推断能力收敛于标准答案或其附近的语义空间;③对现有多模态知识和多样化工具进行按需集成,形成以演绎为主、归纳推断为辅的精准计算支撑格局。本方法涵盖基座选择、知识准备与注入、持续训练及微调、算法集成及交叉验证等环节。该方法突破了基于词根表和领域数据字典的知识切分和向量化处理技术、基于蓝图数据结构的贝叶斯链路技术以及基于大数定律与中心极限定理的核数据训练方法,最后在保险核保场景进行了方法验证,取得了良好效果。 展开更多
关键词 精准计算 长链知识 向量嵌入 多模态 领域语义空间 相似计算
在线阅读 下载PDF
基于图像特征的汉字字形相似度计算
4
作者 王昭 杨婧 杨敏 《山西电子技术》 2024年第2期61-63,共3页
汉字作为一种数量众多,结构复杂的象形文字,其字形的相似度计算对汉语的错别字识别和纠正具有重要意义。将汉字视为图形,通过尺度不变特征变换算法提取汉字的特征点,并利用汉字间特征点的对应关系,提出了一种基于特征点的相似度计算方... 汉字作为一种数量众多,结构复杂的象形文字,其字形的相似度计算对汉语的错别字识别和纠正具有重要意义。将汉字视为图形,通过尺度不变特征变换算法提取汉字的特征点,并利用汉字间特征点的对应关系,提出了一种基于特征点的相似度计算方法。对《通用规范汉字表》的8105个汉字进行了相似度分析,结果表明,该方法和人的认知结果比较一致。 展开更多
关键词 汉字字形 形似字 相似计算 尺度不变特征变换
在线阅读 下载PDF
基于上下文多元信息的文档相似度计算研究 被引量:2
5
作者 于凤 郑德权 +1 位作者 赵铁军 李生 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2006年第B07期397-402,共6页
提出一种基于上下文多元信息实现文档相似度计算的方法,该方法首先抽取文档的特征词,对具有相同(或相近)意义特征词的文档,分别获得特征词在上下文中同现词的词性、语义信息、位置关系、平均同现概率等多元信息,以量化形式描述成... 提出一种基于上下文多元信息实现文档相似度计算的方法,该方法首先抽取文档的特征词,对具有相同(或相近)意义特征词的文档,分别获得特征词在上下文中同现词的词性、语义信息、位置关系、平均同现概率等多元信息,以量化形式描述成一个相似函数;然后分别从两两文档的相似函数中得到文档的相似度评价值,作为衡量文档相似程度的重要依据.利用该评价方法,使用NTCIR-3中的跨语言信息检索数据集中的中文文档,对初始检索文档的顺序重新排列,实验结果表明,该方法分别将前10个最佳召回文档和前100个最佳召回文档的平均精确度提高了15.45%-18.49%和11.96%~15.35%;在另一组有关相同网页信息的实验中,几组不同类别文档相似度F1-measure平均值均在95%以上. 展开更多
关键词 相似计算 上下文 多元信息 相似函数 知识获取
在线阅读 下载PDF
基于词向量的句子相似度计算及其应用研究 被引量:12
6
作者 郭胜国 邢丹丹 《现代电子技术》 北大核心 2016年第13期99-102,107,共5页
目前计算机辅助翻译在相似度计算方面存在很大的局限性,精度较低。针对特定领域,收集领域相关的训练语料,采用Google的word2vec进行英语和汉语的词向量模型构建,设计并实现汉语句子的相似度计算方法,提出基于词向量Jaccard相似度与基于... 目前计算机辅助翻译在相似度计算方面存在很大的局限性,精度较低。针对特定领域,收集领域相关的训练语料,采用Google的word2vec进行英语和汉语的词向量模型构建,设计并实现汉语句子的相似度计算方法,提出基于词向量Jaccard相似度与基于词向量依存句法相结合的相似度计算方法,实验结果显示其效果比传统方法有较大提升。最后,将相关英汉句子相似度算法以接口的形式封装,作为商品化软件华建IAT系统的相似度计算模块投入实际应用。 展开更多
关键词 计算机辅助翻译 相似计算 词向量 IAT系统
在线阅读 下载PDF
一种模糊概念相似度的计算方法 被引量:2
7
作者 张凌宇 马宗民 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第9期1236-1239,共4页
由于现有的经典本体映射方法以及相似度计算方法无法处理模糊信息,因此它们都无法计算模糊概念之间的相似度.为此,提出了一种新的基于向量空间模型的模糊概念相似度计算方法 Sim FC-VSM(similarity of fuzzy concept based on vector sp... 由于现有的经典本体映射方法以及相似度计算方法无法处理模糊信息,因此它们都无法计算模糊概念之间的相似度.为此,提出了一种新的基于向量空间模型的模糊概念相似度计算方法 Sim FC-VSM(similarity of fuzzy concept based on vector space model).Sim FC-VSM方法首先利用模糊本体中的模糊关系构建向量空间模型;然后将模糊概念表示成此向量空间模型中的向量;最后通过向量运算的方法来计算模糊概念之间的相似度.因此,所提出的方法 Sim FC-VSM可以有效地利用向量空间模型来计算模糊概念之间的相似度. 展开更多
关键词 模糊本体 模糊概念 相似计算 模糊关系 向量空间模型
在线阅读 下载PDF
基于序列相似性计算的甲骨残片缀合算法 被引量:1
8
作者 张重生 王斌 《电子学报》 EI CAS CSCD 北大核心 2023年第4期860-869,共10页
甲骨残片缀合一直是甲骨学研究中最急迫最具基础性的工作,它使得甲骨残片经过拼接,复原为更加完整的原始材料.尽管前人及同行曾提出若干计算机辅助的甲骨缀合方法,但这些方法缀合准确度不足,未能真正投入使用,并不能真正帮助专家解决甲... 甲骨残片缀合一直是甲骨学研究中最急迫最具基础性的工作,它使得甲骨残片经过拼接,复原为更加完整的原始材料.尽管前人及同行曾提出若干计算机辅助的甲骨缀合方法,但这些方法缀合准确度不足,未能真正投入使用,并不能真正帮助专家解决甲骨缀合问题,导致当前的甲骨缀合工作仍旧依靠人工、依旧费时费力.为了更好地研究甲骨残片的机器缀合问题,本文使用一个较大规模甲骨缀合基准数据集OB-Rejoin,该数据集包含了约一千幅甲骨拓片图像,且融入了大量的甲骨学界已缀成果,用于算法评估.基于该数据集,本文设计了一种基于斜率变化量序列匹配的甲骨缀合算法(Slope United Sequence Matching for Oracle Bone Fragments Conjugation,SUM),该方法将甲骨残片的断边碴口图像匹配问题转化为数值型的序列数据和序列相似性比对问题,以将尚不够非常精密的计算机视觉领域的碴口图像匹配问题转换为数据科学领域较为成熟的序列数据相似性匹配问题.SUM将数值型的碴口序列数据进一步转换为斜率变化量序列和字符序列数据,最后利用字符序列的模糊匹配完成甲骨残片的碴口匹配.在实验环节,SUM算法与经典的序列相似性计算方法在精确率、召回率、漏检率方面进行了对比,并与两个较新的基于深度学习的序列匹配算法和形状匹配算法进行了性能对比.整体而言,SUM在OB-Rejoin数据集上的Top-15缀合召回率达到了95.181%,超越了对比算法.重要出土文献的精准复原本身是历史学和古文字研究中客观存在的重大现实需求,具有重要的史学价值和意义,因此,本文的研究成果,不但有助于解决甲骨残片的机器缀合问题,还对秦汉简牍和敦煌遗书等重要出土文献的精准复原具有重要的参考价值. 展开更多
关键词 甲骨文 甲骨缀合 序列相似计算 形状匹配 边缘匹配
在线阅读 下载PDF
移动社会网络中用户相似性计算的隐私保护研究 被引量:1
9
作者 李金双 李凤云 《电信科学》 北大核心 2013年第10期119-122,共4页
移动社会网络(MSN)增强了虚拟世界与现实世界的联系,它允许移动用户发现其现实世界中附近的用户并与之交流。在MSN应用中,为提供更好的服务,通常会比较两个用户的相似性,但在计算用户相似性的过程中很有可能泄露用户的隐私信息。针对这... 移动社会网络(MSN)增强了虚拟世界与现实世界的联系,它允许移动用户发现其现实世界中附近的用户并与之交流。在MSN应用中,为提供更好的服务,通常会比较两个用户的相似性,但在计算用户相似性的过程中很有可能泄露用户的隐私信息。针对这一问题,设计了两种新的相似性计算协议,这些协议保证了在进行相似性计算时不会泄露用户的任何隐私信息。 展开更多
关键词 移动社会网络 相似计算 同态加密 隐私
在线阅读 下载PDF
远程高等教育课程学分转换方法探析:课程相似度计算 被引量:2
10
作者 张润芝 黄荣怀 《开放教育研究》 CSSCI 北大核心 2013年第5期96-103,共8页
建立继续教育学分积累与转换制度、实现不同类型学习成果的互认和衔接是《国家中长期教育改革和发展规划纲要(2010-2020年)》的重要方向之一。然而,目前门类繁多的高等继续教育及机构间开展课程学分转换主要依赖经验,缺乏具体方法,这在... 建立继续教育学分积累与转换制度、实现不同类型学习成果的互认和衔接是《国家中长期教育改革和发展规划纲要(2010-2020年)》的重要方向之一。然而,目前门类繁多的高等继续教育及机构间开展课程学分转换主要依赖经验,缺乏具体方法,这在一定程度上制约了学分转换制度的建立。本文通过相关文献分析引入相似度计算原理进行课程相似度计算,并以此作为课程学分转换的基本方法。基于此,本文通过理论分析提出了"课程微观结构模型",确定了课程的3个特征向量:知识点集合、知识点认知水平及知识点学习方式,分析了各个特征向量的表示及相应的课程相似度计算公式与思路,并以两所学校"C语言程序设计"课程学分转换为实践案例,对此方法的效度进行初步检验。 展开更多
关键词 学分转换 课程相似计算 课程微观结构模型 课程特征向量
在线阅读 下载PDF
基于相似性计算的高效存储型XSS客户端攻击识别模型 被引量:1
11
作者 程宏兵 宁一笑 钱漫匀 《南京邮电大学学报(自然科学版)》 北大核心 2017年第4期84-90,共7页
针对存储型XSS攻击的主要注入方法和基本变异方式,文中设计并实现了一种在客户端识别存储型XSS攻击字符串的模型。首先通过选取攻击特征,计算特征权重来构建类型标准向量组。其次对预处理后的字符串识别攻击特征,构建攻击特征向量,将其... 针对存储型XSS攻击的主要注入方法和基本变异方式,文中设计并实现了一种在客户端识别存储型XSS攻击字符串的模型。首先通过选取攻击特征,计算特征权重来构建类型标准向量组。其次对预处理后的字符串识别攻击特征,构建攻击特征向量,将其与向量组中的类型标准向量进行相似性计算。再次将结果与阈值比较,对字符串进行攻击类型分类。最后构造了攻击字符串测试所提出的模型,并与Github上两个经典的开源XSS过滤工具进行识别率比较,结果验证了所提出的模型可以有效地识别存储型XSS攻击。 展开更多
关键词 相似计算 XXS 攻击识别
在线阅读 下载PDF
基于相似度计算的主观题阅卷系统设计 被引量:5
12
作者 秦学勇 《安徽建筑工业学院学报(自然科学版)》 2010年第4期77-80,共4页
网络在线考试以其高效性和公正性正逐步取代传统的考试方法,客观题评阅通过将标准答案和学生答案进行精确比较给出评分,而主观题由于其复杂性和多样性成为机器阅卷算法关键点和难点。简单的关键词匹配算法速度较快但准确率不高,本文采... 网络在线考试以其高效性和公正性正逐步取代传统的考试方法,客观题评阅通过将标准答案和学生答案进行精确比较给出评分,而主观题由于其复杂性和多样性成为机器阅卷算法关键点和难点。简单的关键词匹配算法速度较快但准确率不高,本文采用向量空间模型来表示文本,通过计算文本之间的相似度来进行主观题评阅,并在系统中增加一些策略和规则,取得了较好的阅卷效果。 展开更多
关键词 相似计算 向量空间模型 中文分词
在线阅读 下载PDF
双向词典和语义相似度计算相结合的词对齐算法 被引量:1
13
作者 尹宝生 杨阳 《沈阳航空航天大学学报》 2015年第2期67-74,共8页
基于统计的词对齐方法需要大规模的双语语料作为输入,难以避免数据稀疏的问题并且算法时间开销大。针对句子或段落级的实时性对齐需求,提出了一种基于双向词典和语义相似度计算的高效词对齐算法,通过采用动态组块切分和匹配、基于知网... 基于统计的词对齐方法需要大规模的双语语料作为输入,难以避免数据稀疏的问题并且算法时间开销大。针对句子或段落级的实时性对齐需求,提出了一种基于双向词典和语义相似度计算的高效词对齐算法,通过采用动态组块切分和匹配、基于知网的语义相似度计算、基于最大匹配的冲突消解和剪枝消歧等策略,有效地解决了由于翻译的灵活性和多样性带来的近似译文的词对齐问题。实验表明,该算法不仅继承了基于词典词对齐算法的优点,同时还改进了传统基于词典词对齐算法的不足,有效提升了词对齐的正确率和召回率,在小规模双语语料和实时性对齐方面具有更好的适用性。 展开更多
关键词 词对齐 双向词典 动态组块切分和匹配 语义相似计算
在线阅读 下载PDF
中文语句相似度计算的方法初探 被引量:2
14
作者 李伟 《兰州工业高等专科学校学报》 2009年第4期1-3,24,共4页
分析了中文自然语言处理中句子相似度的计算方法,介绍了基于向量空间模型的TF-IDF的、基于句子语义和基于句子依存关系的三种句子相似度计算模型,并对它们的计算原理、计算方法进行了分析,给出了他们的优缺点.基于向量空间模型的句子相... 分析了中文自然语言处理中句子相似度的计算方法,介绍了基于向量空间模型的TF-IDF的、基于句子语义和基于句子依存关系的三种句子相似度计算模型,并对它们的计算原理、计算方法进行了分析,给出了他们的优缺点.基于向量空间模型的句子相似度计算模型已经比较成熟,一般情况下能够产生较好的效果.由于TF-IDF方法没有考虑这种语义信息,所以传统的TF-IDF方法具有一定的局限性.而基于句子语义或句子的依存结构来进行相似度计算,能达到更好的效果. 展开更多
关键词 TF—IDF 语义 依存结构 相似计算 模型
在线阅读 下载PDF
距离边数矢量与分子相似度的计算
15
作者 杨嘉安 许禄 《应用化学》 CAS CSCD 北大核心 1999年第5期94-96,共3页
A methematical pattern on computation of molecular simularity is proposed and used to compute the molecular simularity of three organic hetero compounds. The results are relatively identical with those obtained from c... A methematical pattern on computation of molecular simularity is proposed and used to compute the molecular simularity of three organic hetero compounds. The results are relatively identical with those obtained from codes for chemical environment. 展开更多
关键词 距离边数矢量 化学环境编码算法 分子相似计算
在线阅读 下载PDF
信息检索中相似度计算的新方法
16
作者 陈琴 《微电子学与计算机》 CSCD 北大核心 2010年第9期159-161,共3页
提出一种计算相似度的新方法,在计算相似度时考虑到查询词出现在文档中不同部分对相似度计算的不同贡献,即不同的权重系数,并用遗传算法确定各个权重系数.实验结果表明,这种新方法在信息检索中在计算相似度时比传统的向量空间模型方法... 提出一种计算相似度的新方法,在计算相似度时考虑到查询词出现在文档中不同部分对相似度计算的不同贡献,即不同的权重系数,并用遗传算法确定各个权重系数.实验结果表明,这种新方法在信息检索中在计算相似度时比传统的向量空间模型方法具有更好的效果. 展开更多
关键词 相似计算 权重系数 遗传算法
在线阅读 下载PDF
物联网中基于相似性计算的传感器搜索 被引量:7
17
作者 刘素艳 刘元安 +1 位作者 吴帆 范文浩 《电子与信息学报》 EI CSCD 北大核心 2018年第12期3020-3027,共8页
物联网逐渐成为学术界研究的热点领域,无处不在的传感器设备促进了传感器搜索服务的产生。物联网中搜索的强时空性、海量数据的异构性与传感器节点的资源受限性,给物联网搜索引擎高效地查询传感器提出了挑战。该文提出基于传感器定量数... 物联网逐渐成为学术界研究的热点领域,无处不在的传感器设备促进了传感器搜索服务的产生。物联网中搜索的强时空性、海量数据的异构性与传感器节点的资源受限性,给物联网搜索引擎高效地查询传感器提出了挑战。该文提出基于传感器定量数值的线性分段拟合相似性(PLSS)搜索算法。PLSS算法通过分段和线性拟合的方法,构建传感器定量数值的相似性计算模型,从而计算传感器的相似度,根据相似度查找最相似的传感器集群。与模糊集(FUZZY)算法和最小二乘法相比,PLSS算法平均查询精度和查询效率较高。与原数据相比,PLSS算法的存储开销至少降低了两个数量级。 展开更多
关键词 物联网 搜索服务 传感器搜索 传感器相似计算 线性分段拟合
在线阅读 下载PDF
ABox推理计算实体相似度 被引量:2
18
作者 薛咏 冯博琴 武艳芳 《西安交通大学学报》 EI CAS CSCD 北大核心 2015年第9期70-76,共7页
针对主题图本体映射中主题上下文语义不易确定,缺少分类信息,但有明确的结构语义特征的特点,提出了A-Sim主题图本体映射算法。首先对主题图中的主题进行分类,利用描述逻辑语言ALCIR+的表达能力,根据主题属性及关联关系建立各种能表达上... 针对主题图本体映射中主题上下文语义不易确定,缺少分类信息,但有明确的结构语义特征的特点,提出了A-Sim主题图本体映射算法。首先对主题图中的主题进行分类,利用描述逻辑语言ALCIR+的表达能力,根据主题属性及关联关系建立各种能表达上下文语义信息的概念术语集,将主题图本体转换为断言集合;其次在断言集合上进行多项式复杂度实例检测,记录模型构造过程中的个体,获得主题的上下文语义;最后将上下文语义结合元素级概念相似度算法计算实体综合相似度,获得异构主题图实体间的实体映射关系。通过对主题图进行相似度计算实验,结果证明新算法对主题图实体相似度计算综合性能至少提升了14%。 展开更多
关键词 本体映射 相似计算 描述逻辑 实例检测
在线阅读 下载PDF
利用深度学习的文本相似度计算方法 被引量:4
19
作者 汪一百 陈实 叶剑锋 《湘潭大学自然科学学报》 CAS 2018年第2期104-107,共4页
针对在自然语言处理中起着关键作用的文本相似度计算问题,提出了一种神经网络深度学习的词向量模型计算方法.利用词向量计算文本语义相似度,并采用高频词滤波的方法削弱扰动的影响.对百度新闻、新浪新闻等的中文词库进行训练,并与传统... 针对在自然语言处理中起着关键作用的文本相似度计算问题,提出了一种神经网络深度学习的词向量模型计算方法.利用词向量计算文本语义相似度,并采用高频词滤波的方法削弱扰动的影响.对百度新闻、新浪新闻等的中文词库进行训练,并与传统的检测方法进行对比.实验结果证明了提出方法的有效性和准确性. 展开更多
关键词 文本相似计算 词向量模型 深度学习 高频词滤波
在线阅读 下载PDF
基于相似度的保障资源相似性识别计算方法研究
20
作者 辛冀 张乐 《电子产品可靠性与环境试验》 2021年第6期31-34,共4页
直升机保障资源仍普遍存在型号多、种类杂、功能单一和体积庞大等问题,整体上落后于直升机装备发展,与当前高强度、全疆域、快速部署的保障理念相违背,制约着直升机航空兵部队的整体战斗力和快速机动能力。通过融合Jaccard与余弦方式,... 直升机保障资源仍普遍存在型号多、种类杂、功能单一和体积庞大等问题,整体上落后于直升机装备发展,与当前高强度、全疆域、快速部署的保障理念相违背,制约着直升机航空兵部队的整体战斗力和快速机动能力。通过融合Jaccard与余弦方式,首次提出了直升机保障资源相似度识别方法以识别异形保障资源中各个属性的相似度,为后续保障资源优化提供输入。 展开更多
关键词 保障资源 Jaccard 相似计算
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部