期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于文档指纹的中文复制检测方法 被引量:7
1
作者 麻会东 刘国华 +1 位作者 李现伟 刘春辉 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期112-115,共4页
文档复制检测技术是保护知识产权和提高信息检索效率的有效有段。目前,关于英文的复制检测技术已经趋向成熟,但关于中文的复制检测技术才刚刚起步。在此提出基于文档指纹的中文复制检测方法,改进了正向最大匹配分词方法并建立了相应的... 文档复制检测技术是保护知识产权和提高信息检索效率的有效有段。目前,关于英文的复制检测技术已经趋向成熟,但关于中文的复制检测技术才刚刚起步。在此提出基于文档指纹的中文复制检测方法,改进了正向最大匹配分词方法并建立了相应的语料库机制,提出k-words分解句子的方法;定义了两篇文档同粒度指纹矩阵之间的匹配运算。实验结果表明,所提出的方法能高效地进行中文文档复制检测。 展开更多
关键词 指纹 剽窃 文本块 匹配
在线阅读 下载PDF
基于提取关键词的中文文档复制检测研究 被引量:6
2
作者 麻会东 刘国华 +3 位作者 李旭 梁鹏 刘春辉 张凌宇 《计算机工程与科学》 CSCD 2007年第10期63-64,88,共3页
文档复制检测技术在保护知识产权和信息索引中起重要作用,它可以防止剽窃事件的发生,提高互联网检索效率。目前,英文复制检测技术已经比较成熟,但中文复制检测技术研究还处于起步阶段。本文提出一种基于关键词的指纹提取方法;提出k-word... 文档复制检测技术在保护知识产权和信息索引中起重要作用,它可以防止剽窃事件的发生,提高互联网检索效率。目前,英文复制检测技术已经比较成熟,但中文复制检测技术研究还处于起步阶段。本文提出一种基于关键词的指纹提取方法;提出k-words方法分解句子;定义了数字指纹树概念,并用数字指纹树来存储指纹。最后,用实验验证了所提出的方法。 展开更多
关键词 指纹 剽窃 文本块 匹配
在线阅读 下载PDF
文档复制检测技术 被引量:1
3
作者 麻会东 刘国华 +1 位作者 梁鹏 苑迎 《燕山大学学报》 CAS 2007年第5期410-417,共8页
随着数字图书馆和互联网的飞速发展,数字化文档唾手可得。近年来学术剽窃现象屡见报端,互联网上日益增多的重复网页降低了检索效率,给用户带来不便。文档复制检测技术在保护知识产权和优化搜索引擎方面起着重要作用,是近年来数据库安全... 随着数字图书馆和互联网的飞速发展,数字化文档唾手可得。近年来学术剽窃现象屡见报端,互联网上日益增多的重复网页降低了检索效率,给用户带来不便。文档复制检测技术在保护知识产权和优化搜索引擎方面起着重要作用,是近年来数据库安全领域研究的热点。文档复制检测方法有两类:一是基于词频统计的方法,一是基于字符串匹配的方法。本文详尽分析了现有基于这两类方法的复制检测技术,并指出它们的优缺点,针对两类方法都存在的问题提出一些改进方案。最后总结了复制检测技术应满足的特性,讨论了检测方法的准确性和文档分解规则。 展开更多
关键词 复制检测 剽窃 指纹 文本块 匹配
在线阅读 下载PDF
一种基于信息分解与合成的数据库加密方法 被引量:4
4
作者 李现伟 刘国华 +1 位作者 苑迎 麻会东 《计算机工程与科学》 CSCD 2007年第10期54-56,60,共4页
针对数据库加密后检索与运行效率低、SQL查询操作受制约等问题,本文提出了一种不依赖数据值加密的新型数据库加密方法。该方法根据关系数据库中数据是结构化的这一特征,通过信息分解与信息合成的思想来保障数据库安全。同时,本文还给出... 针对数据库加密后检索与运行效率低、SQL查询操作受制约等问题,本文提出了一种不依赖数据值加密的新型数据库加密方法。该方法根据关系数据库中数据是结构化的这一特征,通过信息分解与信息合成的思想来保障数据库安全。同时,本文还给出了信息分解与合成的定义和基本准则;描述了该加密方法上的查询处理过程。最后,通过实验与传统数据库加密技术进行了性能比较。 展开更多
关键词 数据库加密 安全 信息分解 信息合成
在线阅读 下载PDF
基于源模式分裂的模式匹配算法
5
作者 张凌宇 刘国华 +3 位作者 褚兵义 王聪 麻会东 苑迎 《计算机研究与发展》 EI CSCD 北大核心 2008年第z1期196-201,共6页
模式匹配就是在作为输入的模式中有对应语义关系的元素间产生一个映射.为了提高模式匹配的效率,提出了一种新型的模式匹配方法——源模式分裂模式匹配算法.它可以解决标准模式匹配难以解决的问题:1)源模式的某一个属性和多个目标模式的... 模式匹配就是在作为输入的模式中有对应语义关系的元素间产生一个映射.为了提高模式匹配的效率,提出了一种新型的模式匹配方法——源模式分裂模式匹配算法.它可以解决标准模式匹配难以解决的问题:1)源模式的某一个属性和多个目标模式的多个属性之间建立匹配关系;2)表格中的不同元组对应其他表格同一元组的不同属性值的匹配.在匹配过程中,该方法先搜索种类型属性,然后根据种类型属性建立选择条件,最后把源模式进行分裂形成视图,再重新生成候选匹配集合,从而提高模式匹配的质量. 展开更多
关键词 模式 映射 数据集成 源模式分裂模式匹配
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部