期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于Simhash算法的题库查重系统的设计与实现
1
作者 熊良钰 邓伦丹 《科学技术创新》 2024年第9期91-94,共4页
Simhash算法是一种基于局部敏感哈希(LSH)的技术,以其快速的计算速度和高度的查重准确性而知名。该算法通过将文本特征转换为二进制码,进而通过计算这些二进制码之间的汉明距离来评估文本的相似度。在文本去重和重复文档检测等多个领域,... Simhash算法是一种基于局部敏感哈希(LSH)的技术,以其快速的计算速度和高度的查重准确性而知名。该算法通过将文本特征转换为二进制码,进而通过计算这些二进制码之间的汉明距离来评估文本的相似度。在文本去重和重复文档检测等多个领域,Simhash算法已经展现出了显著的效果。鉴于此,将Simhash算法应用于题库查重具有很高的可行性和实际应用价值。 展开更多
关键词 Simhash算法 汉明距离 题库查重系统 文本相似度计算 哈希函数
在线阅读 下载PDF
自学习分词算法在科研项目查重系统中的应用 被引量:1
2
作者 胡局新 鞠训光 《科技通报》 北大核心 2013年第6期14-16,19,共4页
分析了几种常见分词算法的优缺点,简述了自动分词算法模型以及其应用领域,基于现有分词算法的局限,提出了一种基于字符串和统计分词算法相结合的自学习分词算法,并将此算法成功应用于科技项目查重系统中,实现便捷、快速、准确的一种有... 分析了几种常见分词算法的优缺点,简述了自动分词算法模型以及其应用领域,基于现有分词算法的局限,提出了一种基于字符串和统计分词算法相结合的自学习分词算法,并将此算法成功应用于科技项目查重系统中,实现便捷、快速、准确的一种有效检测手段,为进一步实现科研项目查重系统更智能化、更科技化打下基础。 展开更多
关键词 自学习 分词技术 查重系统
在线阅读 下载PDF
高校大创项目结项材料查重系统的数据库建设与算法设计
3
作者 简国明 陈渊末 +3 位作者 叶心荣 彭建高 徐金烽 何希彦 《信息技术与信息化》 2020年第5期14-17,共4页
本文针对大学生创新创业训练计划项目结项材料验收重复查找问题,分析了大创项目结项材料查重的需求,包括结题验收登记表、项目总结、研究报告、分类别的项目成果等,应用MyIsam存储引擎,建立E-R图数据库,给出了查重系统算法架构、功能模... 本文针对大学生创新创业训练计划项目结项材料验收重复查找问题,分析了大创项目结项材料查重的需求,包括结题验收登记表、项目总结、研究报告、分类别的项目成果等,应用MyIsam存储引擎,建立E-R图数据库,给出了查重系统算法架构、功能模块和算法实现。 展开更多
关键词 结项材料 查重系统 用户需求 系统数据库 系统算法
在线阅读 下载PDF
大学生学术论文查重系统的设计开发与应用实现
4
作者 彭建高 简国明 +3 位作者 倪婧 陈渊末 梁晓灵 陈晓峰 《信息技术与信息化》 2019年第8期50-53,共4页
针对“挑战杯”大学生学术论文和大学生创新创业训练计划项目结项论文的重复性问题,构建融合某高校几年内大学生学术论文数据库,通过系统需求分析,应用敏捷开发GitHub Flow技术,在系统前端使用Vue.js+Element,后端使用Larvel+MySQL,采... 针对“挑战杯”大学生学术论文和大学生创新创业训练计划项目结项论文的重复性问题,构建融合某高校几年内大学生学术论文数据库,通过系统需求分析,应用敏捷开发GitHub Flow技术,在系统前端使用Vue.js+Element,后端使用Larvel+MySQL,采用论文数据库管理,构建各种功能模块,通过文本比对,相似判别与甄别,线上运行,实现论文查重,得出查重报告。 展开更多
关键词 学术论文 查重系统 Vue.js LARVAL MYSQL
在线阅读 下载PDF
基于Lucence的稿件查重系统的研究和实现
5
作者 何亮 孙超 《中国传媒科技》 2007年第8期39-41,共3页
新闻媒体作为社会正确舆论的核心和导向,为保持其单纯性和权威性,就必须避免出现对同一新闻事件进行反复报道和评论的情况。目前在许多新闻单位中都配备全文检索系统,通过人工选择判断来比对重复稿件,但对于应付日后越来越纷繁复杂... 新闻媒体作为社会正确舆论的核心和导向,为保持其单纯性和权威性,就必须避免出现对同一新闻事件进行反复报道和评论的情况。目前在许多新闻单位中都配备全文检索系统,通过人工选择判断来比对重复稿件,但对于应付日后越来越纷繁复杂的信息是不够的。在此情况下,根据己知稿件内容,通过计算机快速自动地查找信息系统内的相似稿件就变得非常重要。 展开更多
关键词 稿件内容 查重系统 全文检索系统 信息系统 新闻媒体 新闻事件 新闻单位 单纯性
在线阅读 下载PDF
科技项目申报书查重方法研究 被引量:1
6
作者 王东 王飘 +2 位作者 江俊鹏 李青 徐晨阳 《中国科技资源导刊》 2022年第5期30-40,共11页
开展面向科技项目申报书的查重方法研究,对于推进学术诚信建设、营造风清气正的科研环境具有重要意义。目前,关于科技项目申报书的查重研究仍处于起步阶段,针对存在的查重系统架构不明确、查重算法准确率较低等问题,构建一套涵盖科技项... 开展面向科技项目申报书的查重方法研究,对于推进学术诚信建设、营造风清气正的科研环境具有重要意义。目前,关于科技项目申报书的查重研究仍处于起步阶段,针对存在的查重系统架构不明确、查重算法准确率较低等问题,构建一套涵盖科技项目申报书数据处理、分布式任务、查重算法模块与查重报告生成的系统模型,并在查重算法方面提出基于DSSM架构的相似度检测算法模型。实验结果表明,该查重系统能够实现较高的查重准确率和查重效率,能够在科技项目申报书查重方面发挥积极的作用。 展开更多
关键词 科技项目申报书 DSSM架构 文本相似度 查重算法 查重系统
在线阅读 下载PDF
基于动态规划的文本查重算法实现
7
作者 李成龙 冯凯 麻哲 《数字技术与应用》 2013年第8期115-115,共1页
近年来学术界抄袭事件时有发生,给整个学术界的声誉造成了极坏的影响。针对海量文本查重问题,运用基于编辑距离的动态规划算法,实现文本集合间的相似度计算。该算法通过计算句子相似度数值来判断文本相似度,检测并标明出相似句对应的原... 近年来学术界抄袭事件时有发生,给整个学术界的声誉造成了极坏的影响。针对海量文本查重问题,运用基于编辑距离的动态规划算法,实现文本集合间的相似度计算。该算法通过计算句子相似度数值来判断文本相似度,检测并标明出相似句对应的原句。实验结果可知,该系统对较长的文本可以完成雷同判定。 展开更多
关键词 相似度 LD算法 查重系统
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部