期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于概念格中文信息最优检索串判定算法 被引量:3
1
作者 肖升 阳西述 《湖南师范大学自然科学学报》 EI CAS 北大核心 2006年第2期35-38,共4页
提出了一种以形式概念的概念意义相似性为基础的中文信息最优检索串判定算法,该算法可判定出由相同关键词按不同顺序组成的不同检索串中耗费检索时间最短的最优检索串.
关键词 概念格 中文信息 检索 判定算法
在线阅读 下载PDF
半结构化中文信息检索中查询结果相关度算法的研究 被引量:2
2
作者 曲卫民 孙乐 孙玉芳 《中文信息学报》 CSCD 北大核心 2004年第4期15-22,共8页
本文研究了对富含文本信息的XML数据进行基于关键字的查询时 ,查询结果与查询条件之间相关度的计算问题 ,分析了利用传统信息检索技术解决该问题时存在的一些不足 ,提出了一种基于节点的动态的关键字权重计算法 ,以及综合考虑关键字在... 本文研究了对富含文本信息的XML数据进行基于关键字的查询时 ,查询结果与查询条件之间相关度的计算问题 ,分析了利用传统信息检索技术解决该问题时存在的一些不足 ,提出了一种基于节点的动态的关键字权重计算法 ,以及综合考虑关键字在查询结果中的频率分布特征和结构分布特征的查询结果相关度计算法 ,有效解决了XML数据中的结构信息对相关度计算的影响 。 展开更多
关键词 计算机应用 中文信息处理 XML 检索 相关度算法
在线阅读 下载PDF
中文Web文档全文检索系统的设计及实现 被引量:15
3
作者 曹元大 贺海军 涂哲明 《北京理工大学学报》 EI CAS CSCD 北大核心 2002年第1期68-71,共4页
为解决在检索某些词时发生漏检或错检 ,以及查全率和查准率不高的问题 ,研究字索引技术在中文 Web文档检索中的应用 .着重讨论字索引组织结构和检索方法 ,并引入了字节对齐的索引压缩方法 ,最后描述了一个中文 Web文档全文检索系统的结... 为解决在检索某些词时发生漏检或错检 ,以及查全率和查准率不高的问题 ,研究字索引技术在中文 Web文档检索中的应用 .着重讨论字索引组织结构和检索方法 ,并引入了字节对齐的索引压缩方法 ,最后描述了一个中文 Web文档全文检索系统的结构和实现 .测试表明 ,该系统在响应时间和查准率方面性能均比较好 。 展开更多
关键词 全文检索 WEB文档 字索引 压缩算法 索引库 中文检索系统 系统设计
在线阅读 下载PDF
中文全文检索技术的研究及实现 被引量:13
4
作者 李梅 王庆林 《情报学报》 CSSCI 北大核心 2003年第1期10-17,共8页
本文设计了一个中文全文检索系统,在单汉字全文数据库的基础之上进行了全文检索的算法研究,提出了针对特定检索策略的计算公式.同时还对检索结果集的排序问题进行了讨论,并采用用户反馈信息量,使最后检出的结果在应用中不断得到优化.
关键词 全文检索 信息检索 单汉字索引 检索算法 中文全文检索系统
在线阅读 下载PDF
自动分词在中文信息检索中的应用 被引量:6
5
作者 董小芸 刘俊熙 《情报杂志》 CSSCI 北大核心 2003年第12期65-66,69,共3页
论述了几种分词方法和算法 。
关键词 中文信息 信息检索 自动分词 自然语言 算法
在线阅读 下载PDF
一种中文词句的快速检索算法 被引量:1
6
作者 刘国华 程蕾 祈晓园 《计算机工程》 CAS CSCD 北大核心 2003年第19期70-71,94,共3页
介绍了一种中文词句快速检索算法。该算法将中文文献正文转换成文献中每个汉字的位置索引列表。根据位置索引列表信息能够快速查找出用户关心的某个词句在文献中出现的位置,并将该词句所在的句子或者上下文信息提交给用户。
关键词 全文检索 中文信息处理 词句检索
在线阅读 下载PDF
信息检索中的中文分词问题研究 被引量:4
7
作者 吴凡 《情报杂志》 CSSCI 北大核心 2008年第7期41-43,共3页
分析了信息检索中的中文分词歧义问题,引入N元文法和平滑算法对切分歧义问题和数据稀疏问题进行处理解决,从而来提高信息检索速度和质量。
关键词 中文信息检索 分词 N元文法 平滑算法
在线阅读 下载PDF
Mimir:一种基于密文的全文检索服务系统 被引量:7
8
作者 宋伟 彭智勇 +3 位作者 王骞 李瑞轩 程芳权 崔一辉 《计算机学报》 EI CSCD 北大核心 2014年第5期1170-1183,共14页
针对海量涉密隐私数据高效安全检索的需求,提出了一种基于密文的全文检索系统——Mimir.Mimir基于B+树构建了一种安全密文全文索引结构,Mimir检索过程完全在密文环境下进行,保证了系统的安全性和存储信息的私密性.与传统的全文检索系统... 针对海量涉密隐私数据高效安全检索的需求,提出了一种基于密文的全文检索系统——Mimir.Mimir基于B+树构建了一种安全密文全文索引结构,Mimir检索过程完全在密文环境下进行,保证了系统的安全性和存储信息的私密性.与传统的全文检索系统相比,Mimir密文索引中没有存储索引词的位置信息和词频信息,可以有效地抵御已知明文攻击、选择明文攻击和词频统计攻击.对Mimir密文全文检索系统进行了性能测试,实验结果数据表明,Mimir密文全文检索系统在确保高安全性的同时,也具有很好的检索时间和存储空间性能. 展开更多
关键词 密文全文检索 密文索引 Mimir 中文分词 B+树 信息安全 网络安全
在线阅读 下载PDF
基于LUCENEAPI的中文全文数据库设计与实现 被引量:24
9
作者 赵汀 孟祥武 《计算机工程与应用》 CSCD 北大核心 2003年第20期179-181,197,共4页
实现了中文单字切分模块,并在LuceneAPI基础上建立支持中英文混合检索的全文数据库。在地质公园及地质遗迹全文数据库项目中作为全文检索工具。Lucene中文全文数据库的主要性能和功能包括:支持中英文混合检索;可以不关机动态添加或删除... 实现了中文单字切分模块,并在LuceneAPI基础上建立支持中英文混合检索的全文数据库。在地质公园及地质遗迹全文数据库项目中作为全文检索工具。Lucene中文全文数据库的主要性能和功能包括:支持中英文混合检索;可以不关机动态添加或删除一篇文档索引;采用多线程设计,能承受大量的访问请求;支持跨平台运行;提供命令行直接查询方式和基于WEB的查询方式;易学通用的检索表达式;系统可扩展性强。 展开更多
关键词 中文信息处理 全文数据库 全文检索
在线阅读 下载PDF
基于遗传算法的定题信息搜索策略 被引量:5
10
作者 许欢庆 王永成 孙强 《中文信息学报》 CSCD 北大核心 2003年第1期25-31,共7页
定题检索将信息检索限定在特定主题领域 ,提供主题领域内信息的检索服务。它是新一代搜索引擎的发展方向之一。定题检索的关键技术是主题相关信息的搜索。本文提出了基于遗传算法的定题信息搜索策略 ,提高链接于内容相似度不高的网页之... 定题检索将信息检索限定在特定主题领域 ,提供主题领域内信息的检索服务。它是新一代搜索引擎的发展方向之一。定题检索的关键技术是主题相关信息的搜索。本文提出了基于遗传算法的定题信息搜索策略 ,提高链接于内容相似度不高的网页之后的页面被搜索的机会 ,扩大了相关网页的搜索范围。同时 ,借助超链Metadata的提示信息预测链接页面的主题相关度 ,加快了搜索速度。对比搜索试验证明了算法具有较好的性能。 展开更多
关键词 计算机应用 中文信息处理 定题检索 定题信息搜索 遗传算法
在线阅读 下载PDF
∑^2全文数据库模型算法和应用
11
作者 傅辛 张锦 +1 位作者 周益群 戴芳胜 《计算机工程》 CAS CSCD 北大核心 2001年第1期96-98,共3页
在简单介绍∑2矩阵模型的基础上,以一个应用实例为对象,对∑2矩阵模型的建立、查询等方面进行了较为详细的讨论,提出一些可能遇到的同题和困难,并同时给出了一些解决方法和策略.
关键词 ∑^2矩阵模型 全文检索 全文检索数据库 算法 信息检索 计算机
在线阅读 下载PDF
结合同义词的Web搜索匹配算法初探 被引量:2
12
作者 潘景昌 许中卫 《安徽大学学报(自然科学版)》 CAS 2003年第3期26-29,共4页
对结合同义词的中文全文信息检索算法进行了探讨,在已有的基于字串匹配算法的基础上,加入了同义词数据库的搜索,使得搜索更加全面和合理,更加符合人们的思维方式。本文对语义判定模块在搜索引擎机构中的定位及语义字典的构造进行了讨论... 对结合同义词的中文全文信息检索算法进行了探讨,在已有的基于字串匹配算法的基础上,加入了同义词数据库的搜索,使得搜索更加全面和合理,更加符合人们的思维方式。本文对语义判定模块在搜索引擎机构中的定位及语义字典的构造进行了讨论,同时给出了具有语义匹配的中文全文信息搜索的流程。 展开更多
关键词 中文全文信息检索算法 Web搜索匹配算法 字串匹配算法 同义词数据库 语义判定模块 搜索引擎 语义匹配
在线阅读 下载PDF
一种改进的Wu-Manber多模式匹配算法及应用 被引量:10
13
作者 孙晓山 王强 +1 位作者 关毅 王晓龙 《中文信息学报》 CSCD 北大核心 2006年第2期47-52,共6页
本文针对Wu-Manber多模式匹配算法在处理后缀模式情况下的不足,给出了一种改进的后缀模式处理算法,减少了匹配过程中字符比较的次数,提高了算法的运行效率。本文在随机选择的TREC2000的52,067篇文档上进行了全文检索实验,对比了Wu-Manbe... 本文针对Wu-Manber多模式匹配算法在处理后缀模式情况下的不足,给出了一种改进的后缀模式处理算法,减少了匹配过程中字符比较的次数,提高了算法的运行效率。本文在随机选择的TREC2000的52,067篇文档上进行了全文检索实验,对比了Wu-Manber算法、使用后缀模式的改进算法、不使用后缀模式的简单改进等三种算法的匹配过程中字符比较的次数。实验结果说明,本文的改进能够比较稳定的减少匹配过程中字符比较的次数,提高匹配的速度和效率。 展开更多
关键词 计算机应用 中文信息处理 多模式匹配 后缀模式 字符串匹配 全文检索 信息检索
在线阅读 下载PDF
中文交互式网络搜索引擎及其自学习能力 被引量:14
14
作者 杜阿宁 方滨兴 +1 位作者 胡铭曾 云晓春 《计算机工程与应用》 CSCD 北大核心 2003年第10期148-150,212,共4页
论文介绍了一种具有自学习能力的中文交互式网络搜索引擎INSE(aninteractivenetsearchengineforChi-nesetext),向量空间模型、基于自动机思想的中文分词技术和神经网络BP算法的应用是INSE的主要特点,重点讨论了INSE的自学习能力。基于... 论文介绍了一种具有自学习能力的中文交互式网络搜索引擎INSE(aninteractivenetsearchengineforChi-nesetext),向量空间模型、基于自动机思想的中文分词技术和神经网络BP算法的应用是INSE的主要特点,重点讨论了INSE的自学习能力。基于自动机思想分词是INSE提出的新概念,应用于中文分词可以满足最大匹配且速度较快。INSE自学习能力的实现依靠神经网络的BP算法。该算法应用于交互式网络搜索引擎可以提供更加精确的查询结果。 展开更多
关键词 中文交互式网络搜索引擎 自学习能力 Internet WWW 计算机网络 向量空间模型 自动机 分词 神经网络 BP算法 信息 信息检索 信息资源
在线阅读 下载PDF
网上三大中文期刊数据库特点功能比较 被引量:15
15
作者 顾立茵 《现代情报》 北大核心 2005年第1期135-137,共3页
本文从收录范围、信息发布、检索系统、全文浏览器等方面对常用的 3种中文数字期刊进行了对比分析 ,指出了它们的优势和不足 ,为广大用户对这 3种主要电子期刊的使用提供了指南。
关键词 中文期刊 收录范围 全文浏览器 电子期刊 特点功能 网上 检索系统 数据库 信息发布 使用
在线阅读 下载PDF
汉字自适应散列分组查找算法 被引量:1
16
作者 王忠效 范植华 《中文信息学报》 CSCD 北大核心 2001年第2期16-22,共7页
在文献 [1]的基础上 ,本文提出了一个适合中文信息处理用的汉字自适应散列分组查找算法。由于引进了动态遗忘机制以及根据频率动态调整汉字顺序 ,算法的平均查找长度成倍缩短 ,从而能够更有效地保证涉及大量汉字信息检索操作的应用对时... 在文献 [1]的基础上 ,本文提出了一个适合中文信息处理用的汉字自适应散列分组查找算法。由于引进了动态遗忘机制以及根据频率动态调整汉字顺序 ,算法的平均查找长度成倍缩短 ,从而能够更有效地保证涉及大量汉字信息检索操作的应用对时间性能的要求。此外 ,提出了一个与文献 [1]相比计算量更小。 展开更多
关键词 汉字查找 散列函数 自适应散列查找 中文信息处理 信息检索 散列查找算法 查找长度
在线阅读 下载PDF
信息管理系统软件H—CGRS移植技术
17
作者 邬永久 《远程教育杂志》 1996年第4期30-32,共3页
信息管理系统软件H—CGRS是国家七·五科技攻关项目。1989年10月专家鉴定认为该成果在“中文全文检索技术的研究达到国际先进水平”。它的用途较广,尤其适合学校的行政管理和教学管理。譬如:文件档案、教育计划、教学大纲、学籍管... 信息管理系统软件H—CGRS是国家七·五科技攻关项目。1989年10月专家鉴定认为该成果在“中文全文检索技术的研究达到国际先进水平”。它的用途较广,尤其适合学校的行政管理和教学管理。譬如:文件档案、教育计划、教学大纲、学籍管理材料、图书资料的快速存储、检索,建立电子化资料数据库。它的主要特点是中西文兼容、具有自动抽取关键字、任意词查询和汉字输入帮助等功能,界面友好,检索速度快。 展开更多
关键词 信息管理系统 系统软件 移植技术 中间工作文件 技术路线 中文全文检索技术 字段值 联机检索 事务 信息交换
在线阅读 下载PDF
基于Lucene的站内搜索设计与实现 被引量:12
18
作者 朱学昊 王儒敬 +1 位作者 余锋林 唐昱 《计算机应用与软件》 CSCD 北大核心 2008年第10期6-8,共3页
简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势。该模型引入更好的中文分词技术,可自定义最终结果的排序。能够保证检索的前100条记录最符合检索者... 简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势。该模型引入更好的中文分词技术,可自定义最终结果的排序。能够保证检索的前100条记录最符合检索者的需要。 展开更多
关键词 全文检索 LUCENE 中文分词 信息抽取
在线阅读 下载PDF
网际搜索技术的Java实现 被引量:1
19
作者 刘特 徐迎晓 吴建军 《计算机工程》 CAS CSCD 北大核心 2002年第8期90-91,168,共3页
将技术与递归算法有机地结合起来,用于建立网际全文本搜索系统,有效地提高了网际检索的速度和效率。并且,利用 JavaMS 作为数据库引擎,可以有效地管理和维护后台数据。SQL
关键词 递归算法 全文检索 JAVA语言 INTERNET 信息检索
在线阅读 下载PDF
靓站收藏
20
《现代电子技术》 1998年第A06期28-30,共3页
1848年,在美国加利福尼亚某地发现了黄金,于是引发了近代史上蔚为壮观的淘金热。同样,今天的因特网上信息十分丰富,怎样才能获得自己所要的信息呢?中文和英文搜索引擎,帮您实现网上淘金之梦。“靓站收藏”栏目将就Inter... 1848年,在美国加利福尼亚某地发现了黄金,于是引发了近代史上蔚为壮观的淘金热。同样,今天的因特网上信息十分丰富,怎样才能获得自己所要的信息呢?中文和英文搜索引擎,帮您实现网上淘金之梦。“靓站收藏”栏目将就Internet网上相关中文信息库、网络服务... 展开更多
关键词 金庸小说 网址 搜索器 中文搜索引擎 中文网页 英文搜索引擎 全文检索 中文信息 网络资源 香港科技大学
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部