期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
22
篇文章
<
1
2
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于概念格中文信息最优检索串判定算法
被引量:
3
1
作者
肖升
阳西述
《湖南师范大学自然科学学报》
EI
CAS
北大核心
2006年第2期35-38,共4页
提出了一种以形式概念的概念意义相似性为基础的中文信息最优检索串判定算法,该算法可判定出由相同关键词按不同顺序组成的不同检索串中耗费检索时间最短的最优检索串.
关键词
概念格
中文
信息
检索
判定
算法
在线阅读
下载PDF
职称材料
半结构化中文信息检索中查询结果相关度算法的研究
被引量:
2
2
作者
曲卫民
孙乐
孙玉芳
《中文信息学报》
CSCD
北大核心
2004年第4期15-22,共8页
本文研究了对富含文本信息的XML数据进行基于关键字的查询时 ,查询结果与查询条件之间相关度的计算问题 ,分析了利用传统信息检索技术解决该问题时存在的一些不足 ,提出了一种基于节点的动态的关键字权重计算法 ,以及综合考虑关键字在...
本文研究了对富含文本信息的XML数据进行基于关键字的查询时 ,查询结果与查询条件之间相关度的计算问题 ,分析了利用传统信息检索技术解决该问题时存在的一些不足 ,提出了一种基于节点的动态的关键字权重计算法 ,以及综合考虑关键字在查询结果中的频率分布特征和结构分布特征的查询结果相关度计算法 ,有效解决了XML数据中的结构信息对相关度计算的影响 。
展开更多
关键词
计算机应用
中文
信息
处理
XML
息
检索
相关度
算法
在线阅读
下载PDF
职称材料
中文Web文档全文检索系统的设计及实现
被引量:
15
3
作者
曹元大
贺海军
涂哲明
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2002年第1期68-71,共4页
为解决在检索某些词时发生漏检或错检 ,以及查全率和查准率不高的问题 ,研究字索引技术在中文 Web文档检索中的应用 .着重讨论字索引组织结构和检索方法 ,并引入了字节对齐的索引压缩方法 ,最后描述了一个中文 Web文档全文检索系统的结...
为解决在检索某些词时发生漏检或错检 ,以及查全率和查准率不高的问题 ,研究字索引技术在中文 Web文档检索中的应用 .着重讨论字索引组织结构和检索方法 ,并引入了字节对齐的索引压缩方法 ,最后描述了一个中文 Web文档全文检索系统的结构和实现 .测试表明 ,该系统在响应时间和查准率方面性能均比较好 。
展开更多
关键词
全文
检索
WEB文档
字索引
压缩
算法
索引库
中文
检索
系统
系统设计
在线阅读
下载PDF
职称材料
中文全文检索技术的研究及实现
被引量:
13
4
作者
李梅
王庆林
《情报学报》
CSSCI
北大核心
2003年第1期10-17,共8页
本文设计了一个中文全文检索系统,在单汉字全文数据库的基础之上进行了全文检索的算法研究,提出了针对特定检索策略的计算公式.同时还对检索结果集的排序问题进行了讨论,并采用用户反馈信息量,使最后检出的结果在应用中不断得到优化.
关键词
全文
检索
信息
检索
单汉字索引
检索
算法
中文
全文
检索
系统
在线阅读
下载PDF
职称材料
自动分词在中文信息检索中的应用
被引量:
6
5
作者
董小芸
刘俊熙
《情报杂志》
CSSCI
北大核心
2003年第12期65-66,69,共3页
论述了几种分词方法和算法 。
关键词
中文
信息
信息
检索
自动分词
自然语言
算法
在线阅读
下载PDF
职称材料
一种中文词句的快速检索算法
被引量:
1
6
作者
刘国华
程蕾
祈晓园
《计算机工程》
CAS
CSCD
北大核心
2003年第19期70-71,94,共3页
介绍了一种中文词句快速检索算法。该算法将中文文献正文转换成文献中每个汉字的位置索引列表。根据位置索引列表信息能够快速查找出用户关心的某个词句在文献中出现的位置,并将该词句所在的句子或者上下文信息提交给用户。
关键词
全文
检索
中文
信息
处理
词句
检索
在线阅读
下载PDF
职称材料
信息检索中的中文分词问题研究
被引量:
4
7
作者
吴凡
《情报杂志》
CSSCI
北大核心
2008年第7期41-43,共3页
分析了信息检索中的中文分词歧义问题,引入N元文法和平滑算法对切分歧义问题和数据稀疏问题进行处理解决,从而来提高信息检索速度和质量。
关键词
中文
信息
检索
分词
N元文法
平滑
算法
在线阅读
下载PDF
职称材料
Mimir:一种基于密文的全文检索服务系统
被引量:
7
8
作者
宋伟
彭智勇
+3 位作者
王骞
李瑞轩
程芳权
崔一辉
《计算机学报》
EI
CSCD
北大核心
2014年第5期1170-1183,共14页
针对海量涉密隐私数据高效安全检索的需求,提出了一种基于密文的全文检索系统——Mimir.Mimir基于B+树构建了一种安全密文全文索引结构,Mimir检索过程完全在密文环境下进行,保证了系统的安全性和存储信息的私密性.与传统的全文检索系统...
针对海量涉密隐私数据高效安全检索的需求,提出了一种基于密文的全文检索系统——Mimir.Mimir基于B+树构建了一种安全密文全文索引结构,Mimir检索过程完全在密文环境下进行,保证了系统的安全性和存储信息的私密性.与传统的全文检索系统相比,Mimir密文索引中没有存储索引词的位置信息和词频信息,可以有效地抵御已知明文攻击、选择明文攻击和词频统计攻击.对Mimir密文全文检索系统进行了性能测试,实验结果数据表明,Mimir密文全文检索系统在确保高安全性的同时,也具有很好的检索时间和存储空间性能.
展开更多
关键词
密文
全文
检索
密文索引
Mimir
中文
分词
B+树
信息
安全
网络安全
在线阅读
下载PDF
职称材料
基于LUCENEAPI的中文全文数据库设计与实现
被引量:
24
9
作者
赵汀
孟祥武
《计算机工程与应用》
CSCD
北大核心
2003年第20期179-181,197,共4页
实现了中文单字切分模块,并在LuceneAPI基础上建立支持中英文混合检索的全文数据库。在地质公园及地质遗迹全文数据库项目中作为全文检索工具。Lucene中文全文数据库的主要性能和功能包括:支持中英文混合检索;可以不关机动态添加或删除...
实现了中文单字切分模块,并在LuceneAPI基础上建立支持中英文混合检索的全文数据库。在地质公园及地质遗迹全文数据库项目中作为全文检索工具。Lucene中文全文数据库的主要性能和功能包括:支持中英文混合检索;可以不关机动态添加或删除一篇文档索引;采用多线程设计,能承受大量的访问请求;支持跨平台运行;提供命令行直接查询方式和基于WEB的查询方式;易学通用的检索表达式;系统可扩展性强。
展开更多
关键词
中文
信息
处理
全文
数据库
全文
检索
在线阅读
下载PDF
职称材料
基于遗传算法的定题信息搜索策略
被引量:
5
10
作者
许欢庆
王永成
孙强
《中文信息学报》
CSCD
北大核心
2003年第1期25-31,共7页
定题检索将信息检索限定在特定主题领域 ,提供主题领域内信息的检索服务。它是新一代搜索引擎的发展方向之一。定题检索的关键技术是主题相关信息的搜索。本文提出了基于遗传算法的定题信息搜索策略 ,提高链接于内容相似度不高的网页之...
定题检索将信息检索限定在特定主题领域 ,提供主题领域内信息的检索服务。它是新一代搜索引擎的发展方向之一。定题检索的关键技术是主题相关信息的搜索。本文提出了基于遗传算法的定题信息搜索策略 ,提高链接于内容相似度不高的网页之后的页面被搜索的机会 ,扩大了相关网页的搜索范围。同时 ,借助超链Metadata的提示信息预测链接页面的主题相关度 ,加快了搜索速度。对比搜索试验证明了算法具有较好的性能。
展开更多
关键词
计算机应用
中文
信息
处理
定题
检索
定题
信息
搜索
遗传
算法
在线阅读
下载PDF
职称材料
∑^2全文数据库模型算法和应用
11
作者
傅辛
张锦
+1 位作者
周益群
戴芳胜
《计算机工程》
CAS
CSCD
北大核心
2001年第1期96-98,共3页
在简单介绍∑2矩阵模型的基础上,以一个应用实例为对象,对∑2矩阵模型的建立、查询等方面进行了较为详细的讨论,提出一些可能遇到的同题和困难,并同时给出了一些解决方法和策略.
关键词
∑^2矩阵模型
全文
检索
全文
检索
数据库
算法
信息
检索
计算机
在线阅读
下载PDF
职称材料
结合同义词的Web搜索匹配算法初探
被引量:
2
12
作者
潘景昌
许中卫
《安徽大学学报(自然科学版)》
CAS
2003年第3期26-29,共4页
对结合同义词的中文全文信息检索算法进行了探讨,在已有的基于字串匹配算法的基础上,加入了同义词数据库的搜索,使得搜索更加全面和合理,更加符合人们的思维方式。本文对语义判定模块在搜索引擎机构中的定位及语义字典的构造进行了讨论...
对结合同义词的中文全文信息检索算法进行了探讨,在已有的基于字串匹配算法的基础上,加入了同义词数据库的搜索,使得搜索更加全面和合理,更加符合人们的思维方式。本文对语义判定模块在搜索引擎机构中的定位及语义字典的构造进行了讨论,同时给出了具有语义匹配的中文全文信息搜索的流程。
展开更多
关键词
中文全文信息检索算法
Web搜索匹配
算法
字串匹配
算法
同义词数据库
语义判定模块
搜索引擎
语义匹配
在线阅读
下载PDF
职称材料
一种改进的Wu-Manber多模式匹配算法及应用
被引量:
10
13
作者
孙晓山
王强
+1 位作者
关毅
王晓龙
《中文信息学报》
CSCD
北大核心
2006年第2期47-52,共6页
本文针对Wu-Manber多模式匹配算法在处理后缀模式情况下的不足,给出了一种改进的后缀模式处理算法,减少了匹配过程中字符比较的次数,提高了算法的运行效率。本文在随机选择的TREC2000的52,067篇文档上进行了全文检索实验,对比了Wu-Manbe...
本文针对Wu-Manber多模式匹配算法在处理后缀模式情况下的不足,给出了一种改进的后缀模式处理算法,减少了匹配过程中字符比较的次数,提高了算法的运行效率。本文在随机选择的TREC2000的52,067篇文档上进行了全文检索实验,对比了Wu-Manber算法、使用后缀模式的改进算法、不使用后缀模式的简单改进等三种算法的匹配过程中字符比较的次数。实验结果说明,本文的改进能够比较稳定的减少匹配过程中字符比较的次数,提高匹配的速度和效率。
展开更多
关键词
计算机应用
中文
信息
处理
多模式匹配
后缀模式
字符串匹配
全文
检索
信息
检索
在线阅读
下载PDF
职称材料
中文交互式网络搜索引擎及其自学习能力
被引量:
14
14
作者
杜阿宁
方滨兴
+1 位作者
胡铭曾
云晓春
《计算机工程与应用》
CSCD
北大核心
2003年第10期148-150,212,共4页
论文介绍了一种具有自学习能力的中文交互式网络搜索引擎INSE(aninteractivenetsearchengineforChi-nesetext),向量空间模型、基于自动机思想的中文分词技术和神经网络BP算法的应用是INSE的主要特点,重点讨论了INSE的自学习能力。基于...
论文介绍了一种具有自学习能力的中文交互式网络搜索引擎INSE(aninteractivenetsearchengineforChi-nesetext),向量空间模型、基于自动机思想的中文分词技术和神经网络BP算法的应用是INSE的主要特点,重点讨论了INSE的自学习能力。基于自动机思想分词是INSE提出的新概念,应用于中文分词可以满足最大匹配且速度较快。INSE自学习能力的实现依靠神经网络的BP算法。该算法应用于交互式网络搜索引擎可以提供更加精确的查询结果。
展开更多
关键词
中文
交互式网络搜索引擎
自学习能力
Internet
WWW
计算机网络
向量空间模型
自动机
分词
神经网络
BP
算法
信息
库
信息
检索
信息
资源
在线阅读
下载PDF
职称材料
网上三大中文期刊数据库特点功能比较
被引量:
15
15
作者
顾立茵
《现代情报》
北大核心
2005年第1期135-137,共3页
本文从收录范围、信息发布、检索系统、全文浏览器等方面对常用的 3种中文数字期刊进行了对比分析 ,指出了它们的优势和不足 ,为广大用户对这 3种主要电子期刊的使用提供了指南。
关键词
中文
期刊
收录范围
全文
浏览器
电子期刊
特点功能
网上
检索
系统
数据库
信息
发布
使用
在线阅读
下载PDF
职称材料
汉字自适应散列分组查找算法
被引量:
1
16
作者
王忠效
范植华
《中文信息学报》
CSCD
北大核心
2001年第2期16-22,共7页
在文献 [1]的基础上 ,本文提出了一个适合中文信息处理用的汉字自适应散列分组查找算法。由于引进了动态遗忘机制以及根据频率动态调整汉字顺序 ,算法的平均查找长度成倍缩短 ,从而能够更有效地保证涉及大量汉字信息检索操作的应用对时...
在文献 [1]的基础上 ,本文提出了一个适合中文信息处理用的汉字自适应散列分组查找算法。由于引进了动态遗忘机制以及根据频率动态调整汉字顺序 ,算法的平均查找长度成倍缩短 ,从而能够更有效地保证涉及大量汉字信息检索操作的应用对时间性能的要求。此外 ,提出了一个与文献 [1]相比计算量更小。
展开更多
关键词
汉字查找
散列函数
自适应散列查找
中文
信息
处理
信息
检索
散列查找
算法
查找长度
在线阅读
下载PDF
职称材料
信息管理系统软件H—CGRS移植技术
17
作者
邬永久
《远程教育杂志》
1996年第4期30-32,共3页
信息管理系统软件H—CGRS是国家七·五科技攻关项目。1989年10月专家鉴定认为该成果在“中文全文检索技术的研究达到国际先进水平”。它的用途较广,尤其适合学校的行政管理和教学管理。譬如:文件档案、教育计划、教学大纲、学籍管...
信息管理系统软件H—CGRS是国家七·五科技攻关项目。1989年10月专家鉴定认为该成果在“中文全文检索技术的研究达到国际先进水平”。它的用途较广,尤其适合学校的行政管理和教学管理。譬如:文件档案、教育计划、教学大纲、学籍管理材料、图书资料的快速存储、检索,建立电子化资料数据库。它的主要特点是中西文兼容、具有自动抽取关键字、任意词查询和汉字输入帮助等功能,界面友好,检索速度快。
展开更多
关键词
信息
管理系统
系统软件
移植技术
中间工作文件
技术路线
中文
全文
检索
技术
字段值
联机
检索
事务
信息
交换
在线阅读
下载PDF
职称材料
基于Lucene的站内搜索设计与实现
被引量:
12
18
作者
朱学昊
王儒敬
+1 位作者
余锋林
唐昱
《计算机应用与软件》
CSCD
北大核心
2008年第10期6-8,共3页
简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势。该模型引入更好的中文分词技术,可自定义最终结果的排序。能够保证检索的前100条记录最符合检索者...
简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势。该模型引入更好的中文分词技术,可自定义最终结果的排序。能够保证检索的前100条记录最符合检索者的需要。
展开更多
关键词
全文
检索
LUCENE
中文
分词
信息
抽取
在线阅读
下载PDF
职称材料
网际搜索技术的Java实现
被引量:
1
19
作者
刘特
徐迎晓
吴建军
《计算机工程》
CAS
CSCD
北大核心
2002年第8期90-91,168,共3页
将技术与递归算法有机地结合起来,用于建立网际全文本搜索系统,有效地提高了网际检索的速度和效率。并且,利用 JavaMS 作为数据库引擎,可以有效地管理和维护后台数据。SQL
关键词
递归
算法
全文
本
检索
JAVA语言
INTERNET
信息
检索
在线阅读
下载PDF
职称材料
靓站收藏
20
《现代电子技术》
1998年第A06期28-30,共3页
1848年,在美国加利福尼亚某地发现了黄金,于是引发了近代史上蔚为壮观的淘金热。同样,今天的因特网上信息十分丰富,怎样才能获得自己所要的信息呢?中文和英文搜索引擎,帮您实现网上淘金之梦。“靓站收藏”栏目将就Inter...
1848年,在美国加利福尼亚某地发现了黄金,于是引发了近代史上蔚为壮观的淘金热。同样,今天的因特网上信息十分丰富,怎样才能获得自己所要的信息呢?中文和英文搜索引擎,帮您实现网上淘金之梦。“靓站收藏”栏目将就Internet网上相关中文信息库、网络服务...
展开更多
关键词
金庸小说
网址
搜索器
中文
搜索引擎
中文
网页
英文搜索引擎
全文
检索
中文
信息
网络资源
香港科技大学
在线阅读
下载PDF
职称材料
题名
基于概念格中文信息最优检索串判定算法
被引量:
3
1
作者
肖升
阳西述
机构
湖南省第一师范学校
出处
《湖南师范大学自然科学学报》
EI
CAS
北大核心
2006年第2期35-38,共4页
基金
湖南省教育厅优秀青年科研基金资助项目(04B015)
文摘
提出了一种以形式概念的概念意义相似性为基础的中文信息最优检索串判定算法,该算法可判定出由相同关键词按不同顺序组成的不同检索串中耗费检索时间最短的最优检索串.
关键词
概念格
中文
信息
检索
判定
算法
Keywords
concept lattice
chinese information
index
judging algorithm
分类号
O243 [理学—计算数学]
在线阅读
下载PDF
职称材料
题名
半结构化中文信息检索中查询结果相关度算法的研究
被引量:
2
2
作者
曲卫民
孙乐
孙玉芳
机构
中科院软件所系统软件与中文信息中心
出处
《中文信息学报》
CSCD
北大核心
2004年第4期15-22,共8页
基金
国家自然科学基金资助项目 (6 99830 0 9)
国家 86 3计划资助项目 (2 0 0 1AA1 1 4 0 4 0 )
文摘
本文研究了对富含文本信息的XML数据进行基于关键字的查询时 ,查询结果与查询条件之间相关度的计算问题 ,分析了利用传统信息检索技术解决该问题时存在的一些不足 ,提出了一种基于节点的动态的关键字权重计算法 ,以及综合考虑关键字在查询结果中的频率分布特征和结构分布特征的查询结果相关度计算法 ,有效解决了XML数据中的结构信息对相关度计算的影响 。
关键词
计算机应用
中文
信息
处理
XML
息
检索
相关度
算法
Keywords
and a ranking function that consider both the frequency distribution and structural distribution of keywords in the result. Experimental results prove the effectiveness of our solution. Key words: computer application
Chinese information proc
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
中文Web文档全文检索系统的设计及实现
被引量:
15
3
作者
曹元大
贺海军
涂哲明
机构
北京理工大学计算机科学与工程系
出处
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2002年第1期68-71,共4页
文摘
为解决在检索某些词时发生漏检或错检 ,以及查全率和查准率不高的问题 ,研究字索引技术在中文 Web文档检索中的应用 .着重讨论字索引组织结构和检索方法 ,并引入了字节对齐的索引压缩方法 ,最后描述了一个中文 Web文档全文检索系统的结构和实现 .测试表明 ,该系统在响应时间和查准率方面性能均比较好 。
关键词
全文
检索
WEB文档
字索引
压缩
算法
索引库
中文
检索
系统
系统设计
Keywords
full text retrieval
Web documents
character based indexing
compression algorithm
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
G354.45 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
中文全文检索技术的研究及实现
被引量:
13
4
作者
李梅
王庆林
机构
北京理工大学自动控制系
出处
《情报学报》
CSSCI
北大核心
2003年第1期10-17,共8页
文摘
本文设计了一个中文全文检索系统,在单汉字全文数据库的基础之上进行了全文检索的算法研究,提出了针对特定检索策略的计算公式.同时还对检索结果集的排序问题进行了讨论,并采用用户反馈信息量,使最后检出的结果在应用中不断得到优化.
关键词
全文
检索
信息
检索
单汉字索引
检索
算法
中文
全文
检索
系统
分类号
G354.45 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
自动分词在中文信息检索中的应用
被引量:
6
5
作者
董小芸
刘俊熙
机构
上海大学嘉定校区情报研究中心
出处
《情报杂志》
CSSCI
北大核心
2003年第12期65-66,69,共3页
文摘
论述了几种分词方法和算法 。
关键词
中文
信息
信息
检索
自动分词
自然语言
算法
分类号
G354 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
一种中文词句的快速检索算法
被引量:
1
6
作者
刘国华
程蕾
祈晓园
机构
复旦大学计算机与信息技术系
燕山大学计算机科学系
燕山大学计算机科学系
出处
《计算机工程》
CAS
CSCD
北大核心
2003年第19期70-71,94,共3页
文摘
介绍了一种中文词句快速检索算法。该算法将中文文献正文转换成文献中每个汉字的位置索引列表。根据位置索引列表信息能够快速查找出用户关心的某个词句在文献中出现的位置,并将该词句所在的句子或者上下文信息提交给用户。
关键词
全文
检索
中文
信息
处理
词句
检索
Keywords
Full-text retrieval
Chinese information disposal
Words and sentences retrieval
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
信息检索中的中文分词问题研究
被引量:
4
7
作者
吴凡
机构
广州航海高等专科学校图书馆
出处
《情报杂志》
CSSCI
北大核心
2008年第7期41-43,共3页
文摘
分析了信息检索中的中文分词歧义问题,引入N元文法和平滑算法对切分歧义问题和数据稀疏问题进行处理解决,从而来提高信息检索速度和质量。
关键词
中文
信息
检索
分词
N元文法
平滑
算法
分类号
G252.7 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
Mimir:一种基于密文的全文检索服务系统
被引量:
7
8
作者
宋伟
彭智勇
王骞
李瑞轩
程芳权
崔一辉
机构
武汉大学软件工程国家重点实验室
武汉大学计算机学院
华中科技大学计算机科学与技术学院
出处
《计算机学报》
EI
CSCD
北大核心
2014年第5期1170-1183,共14页
基金
国家自然科学基金(61202034
61232002)
武汉市晨光计划(201271031370)资助~~
文摘
针对海量涉密隐私数据高效安全检索的需求,提出了一种基于密文的全文检索系统——Mimir.Mimir基于B+树构建了一种安全密文全文索引结构,Mimir检索过程完全在密文环境下进行,保证了系统的安全性和存储信息的私密性.与传统的全文检索系统相比,Mimir密文索引中没有存储索引词的位置信息和词频信息,可以有效地抵御已知明文攻击、选择明文攻击和词频统计攻击.对Mimir密文全文检索系统进行了性能测试,实验结果数据表明,Mimir密文全文检索系统在确保高安全性的同时,也具有很好的检索时间和存储空间性能.
关键词
密文
全文
检索
密文索引
Mimir
中文
分词
B+树
信息
安全
网络安全
Keywords
cryptograph full-text retrieval
cryptograph index
Mimir
segmentation
B+ tree
information security
network security
分类号
TP309 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于LUCENEAPI的中文全文数据库设计与实现
被引量:
24
9
作者
赵汀
孟祥武
机构
中国地质科学院矿产资源研究所
北京邮电大学计算机科学与技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2003年第20期179-181,197,共4页
基金
国家科技基础性工作专项资金资助(编号:2001DEA30027)
文摘
实现了中文单字切分模块,并在LuceneAPI基础上建立支持中英文混合检索的全文数据库。在地质公园及地质遗迹全文数据库项目中作为全文检索工具。Lucene中文全文数据库的主要性能和功能包括:支持中英文混合检索;可以不关机动态添加或删除一篇文档索引;采用多线程设计,能承受大量的访问请求;支持跨平台运行;提供命令行直接查询方式和基于WEB的查询方式;易学通用的检索表达式;系统可扩展性强。
关键词
中文
信息
处理
全文
数据库
全文
检索
Keywords
LUCENE API ,Chinese Information Processing,Index,Tokenize
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于遗传算法的定题信息搜索策略
被引量:
5
10
作者
许欢庆
王永成
孙强
机构
上海交通大学计算机系
出处
《中文信息学报》
CSCD
北大核心
2003年第1期25-31,共7页
基金
国家自然科学基金资助项目 (6 0 0 82 0 0 3)
文摘
定题检索将信息检索限定在特定主题领域 ,提供主题领域内信息的检索服务。它是新一代搜索引擎的发展方向之一。定题检索的关键技术是主题相关信息的搜索。本文提出了基于遗传算法的定题信息搜索策略 ,提高链接于内容相似度不高的网页之后的页面被搜索的机会 ,扩大了相关网页的搜索范围。同时 ,借助超链Metadata的提示信息预测链接页面的主题相关度 ,加快了搜索速度。对比搜索试验证明了算法具有较好的性能。
关键词
计算机应用
中文
信息
处理
定题
检索
定题
信息
搜索
遗传
算法
Keywords
computer application
Chinese information processing
topic-specific retrieval
focused crawling
GA
Hub
authority
分类号
G354.4 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
∑^2全文数据库模型算法和应用
11
作者
傅辛
张锦
周益群
戴芳胜
机构
复旦大学计算机科学系
上海第二工业大学
出处
《计算机工程》
CAS
CSCD
北大核心
2001年第1期96-98,共3页
基金
国家863项目课题!( 863-306-ZD06-01-7)
文摘
在简单介绍∑2矩阵模型的基础上,以一个应用实例为对象,对∑2矩阵模型的建立、查询等方面进行了较为详细的讨论,提出一些可能遇到的同题和困难,并同时给出了一些解决方法和策略.
关键词
∑^2矩阵模型
全文
检索
全文
检索
数据库
算法
信息
检索
计算机
Keywords
∑~2 matrix model
Full-text index
Full-text database
分类号
G354.45 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
结合同义词的Web搜索匹配算法初探
被引量:
2
12
作者
潘景昌
许中卫
机构
山东大学威海分校计算机系
出处
《安徽大学学报(自然科学版)》
CAS
2003年第3期26-29,共4页
文摘
对结合同义词的中文全文信息检索算法进行了探讨,在已有的基于字串匹配算法的基础上,加入了同义词数据库的搜索,使得搜索更加全面和合理,更加符合人们的思维方式。本文对语义判定模块在搜索引擎机构中的定位及语义字典的构造进行了讨论,同时给出了具有语义匹配的中文全文信息搜索的流程。
关键词
中文全文信息检索算法
Web搜索匹配
算法
字串匹配
算法
同义词数据库
语义判定模块
搜索引擎
语义匹配
Keywords
semantics
search
matching
synonym
indexing term
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种改进的Wu-Manber多模式匹配算法及应用
被引量:
10
13
作者
孙晓山
王强
关毅
王晓龙
机构
哈尔滨工业大学计算机学院
出处
《中文信息学报》
CSCD
北大核心
2006年第2期47-52,共6页
基金
国家自然科学基金重点基金资助(60435020)
哈尔滨工业大学校基金资助项目(HIT2002.71)
文摘
本文针对Wu-Manber多模式匹配算法在处理后缀模式情况下的不足,给出了一种改进的后缀模式处理算法,减少了匹配过程中字符比较的次数,提高了算法的运行效率。本文在随机选择的TREC2000的52,067篇文档上进行了全文检索实验,对比了Wu-Manber算法、使用后缀模式的改进算法、不使用后缀模式的简单改进等三种算法的匹配过程中字符比较的次数。实验结果说明,本文的改进能够比较稳定的减少匹配过程中字符比较的次数,提高匹配的速度和效率。
关键词
计算机应用
中文
信息
处理
多模式匹配
后缀模式
字符串匹配
全文
检索
信息
检索
Keywords
computer application
Chinese information processing
multiple-pattern matching
sutffix pattern
string matching
full text retrieval
information retrieval
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
中文交互式网络搜索引擎及其自学习能力
被引量:
14
14
作者
杜阿宁
方滨兴
胡铭曾
云晓春
机构
哈尔滨工业大学国家计算机信息内容安全重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2003年第10期148-150,212,共4页
基金
国家863高科技研究发展计划资助项目(编号:863-104-02-01)
文摘
论文介绍了一种具有自学习能力的中文交互式网络搜索引擎INSE(aninteractivenetsearchengineforChi-nesetext),向量空间模型、基于自动机思想的中文分词技术和神经网络BP算法的应用是INSE的主要特点,重点讨论了INSE的自学习能力。基于自动机思想分词是INSE提出的新概念,应用于中文分词可以满足最大匹配且速度较快。INSE自学习能力的实现依靠神经网络的BP算法。该算法应用于交互式网络搜索引擎可以提供更加精确的查询结果。
关键词
中文
交互式网络搜索引擎
自学习能力
Internet
WWW
计算机网络
向量空间模型
自动机
分词
神经网络
BP
算法
信息
库
信息
检索
信息
资源
Keywords
Vector Space Model,word segmentation,BP network,automata,neural networks
分类号
TP393 [自动化与计算机技术—计算机应用技术]
G354.4 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
网上三大中文期刊数据库特点功能比较
被引量:
15
15
作者
顾立茵
机构
国立华侨大学
出处
《现代情报》
北大核心
2005年第1期135-137,共3页
文摘
本文从收录范围、信息发布、检索系统、全文浏览器等方面对常用的 3种中文数字期刊进行了对比分析 ,指出了它们的优势和不足 ,为广大用户对这 3种主要电子期刊的使用提供了指南。
关键词
中文
期刊
收录范围
全文
浏览器
电子期刊
特点功能
网上
检索
系统
数据库
信息
发布
使用
Keywords
Chinese digital periodicals
database
the citation scope
retrieval systems
browser
分类号
G354 [文化科学—情报学]
G255.2 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
汉字自适应散列分组查找算法
被引量:
1
16
作者
王忠效
范植华
机构
中国科学院软件研究所
出处
《中文信息学报》
CSCD
北大核心
2001年第2期16-22,共7页
文摘
在文献 [1]的基础上 ,本文提出了一个适合中文信息处理用的汉字自适应散列分组查找算法。由于引进了动态遗忘机制以及根据频率动态调整汉字顺序 ,算法的平均查找长度成倍缩短 ,从而能够更有效地保证涉及大量汉字信息检索操作的应用对时间性能的要求。此外 ,提出了一个与文献 [1]相比计算量更小。
关键词
汉字查找
散列函数
自适应散列查找
中文
信息
处理
信息
检索
散列查找
算法
查找长度
Keywords
search of Chinese characters
hashing
hash function
adaptive hashing
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
信息管理系统软件H—CGRS移植技术
17
作者
邬永久
机构
浙江广播电视大学
出处
《远程教育杂志》
1996年第4期30-32,共3页
文摘
信息管理系统软件H—CGRS是国家七·五科技攻关项目。1989年10月专家鉴定认为该成果在“中文全文检索技术的研究达到国际先进水平”。它的用途较广,尤其适合学校的行政管理和教学管理。譬如:文件档案、教育计划、教学大纲、学籍管理材料、图书资料的快速存储、检索,建立电子化资料数据库。它的主要特点是中西文兼容、具有自动抽取关键字、任意词查询和汉字输入帮助等功能,界面友好,检索速度快。
关键词
信息
管理系统
系统软件
移植技术
中间工作文件
技术路线
中文
全文
检索
技术
字段值
联机
检索
事务
信息
交换
分类号
TP311.54 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于Lucene的站内搜索设计与实现
被引量:
12
18
作者
朱学昊
王儒敬
余锋林
唐昱
机构
中国科学院合肥智能机械研究所
中国科学技术大学
出处
《计算机应用与软件》
CSCD
北大核心
2008年第10期6-8,共3页
基金
国家863高科技发展研究计划资助项目(2003AA118070)
文摘
简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势。该模型引入更好的中文分词技术,可自定义最终结果的排序。能够保证检索的前100条记录最符合检索者的需要。
关键词
全文
检索
LUCENE
中文
分词
信息
抽取
Keywords
Full text search engine Lucene Chinese word segmentation Information retrieval
分类号
TP316 [自动化与计算机技术—计算机软件与理论]
U285.6 [交通运输工程—交通信息工程及控制]
在线阅读
下载PDF
职称材料
题名
网际搜索技术的Java实现
被引量:
1
19
作者
刘特
徐迎晓
吴建军
机构
上海大学网络中心
出处
《计算机工程》
CAS
CSCD
北大核心
2002年第8期90-91,168,共3页
基金
上海市高等学校科学技术发展基金项目(2000A41)
文摘
将技术与递归算法有机地结合起来,用于建立网际全文本搜索系统,有效地提高了网际检索的速度和效率。并且,利用 JavaMS 作为数据库引擎,可以有效地管理和维护后台数据。SQL
关键词
递归
算法
全文
本
检索
JAVA语言
INTERNET
信息
检索
Keywords
Java
Recursive algorithm
Fulltext search
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
G354.4 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
靓站收藏
20
出处
《现代电子技术》
1998年第A06期28-30,共3页
文摘
1848年,在美国加利福尼亚某地发现了黄金,于是引发了近代史上蔚为壮观的淘金热。同样,今天的因特网上信息十分丰富,怎样才能获得自己所要的信息呢?中文和英文搜索引擎,帮您实现网上淘金之梦。“靓站收藏”栏目将就Internet网上相关中文信息库、网络服务...
关键词
金庸小说
网址
搜索器
中文
搜索引擎
中文
网页
英文搜索引擎
全文
检索
中文
信息
网络资源
香港科技大学
分类号
TN01 [电子电信—物理电子学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于概念格中文信息最优检索串判定算法
肖升
阳西述
《湖南师范大学自然科学学报》
EI
CAS
北大核心
2006
3
在线阅读
下载PDF
职称材料
2
半结构化中文信息检索中查询结果相关度算法的研究
曲卫民
孙乐
孙玉芳
《中文信息学报》
CSCD
北大核心
2004
2
在线阅读
下载PDF
职称材料
3
中文Web文档全文检索系统的设计及实现
曹元大
贺海军
涂哲明
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2002
15
在线阅读
下载PDF
职称材料
4
中文全文检索技术的研究及实现
李梅
王庆林
《情报学报》
CSSCI
北大核心
2003
13
在线阅读
下载PDF
职称材料
5
自动分词在中文信息检索中的应用
董小芸
刘俊熙
《情报杂志》
CSSCI
北大核心
2003
6
在线阅读
下载PDF
职称材料
6
一种中文词句的快速检索算法
刘国华
程蕾
祈晓园
《计算机工程》
CAS
CSCD
北大核心
2003
1
在线阅读
下载PDF
职称材料
7
信息检索中的中文分词问题研究
吴凡
《情报杂志》
CSSCI
北大核心
2008
4
在线阅读
下载PDF
职称材料
8
Mimir:一种基于密文的全文检索服务系统
宋伟
彭智勇
王骞
李瑞轩
程芳权
崔一辉
《计算机学报》
EI
CSCD
北大核心
2014
7
在线阅读
下载PDF
职称材料
9
基于LUCENEAPI的中文全文数据库设计与实现
赵汀
孟祥武
《计算机工程与应用》
CSCD
北大核心
2003
24
在线阅读
下载PDF
职称材料
10
基于遗传算法的定题信息搜索策略
许欢庆
王永成
孙强
《中文信息学报》
CSCD
北大核心
2003
5
在线阅读
下载PDF
职称材料
11
∑^2全文数据库模型算法和应用
傅辛
张锦
周益群
戴芳胜
《计算机工程》
CAS
CSCD
北大核心
2001
0
在线阅读
下载PDF
职称材料
12
结合同义词的Web搜索匹配算法初探
潘景昌
许中卫
《安徽大学学报(自然科学版)》
CAS
2003
2
在线阅读
下载PDF
职称材料
13
一种改进的Wu-Manber多模式匹配算法及应用
孙晓山
王强
关毅
王晓龙
《中文信息学报》
CSCD
北大核心
2006
10
在线阅读
下载PDF
职称材料
14
中文交互式网络搜索引擎及其自学习能力
杜阿宁
方滨兴
胡铭曾
云晓春
《计算机工程与应用》
CSCD
北大核心
2003
14
在线阅读
下载PDF
职称材料
15
网上三大中文期刊数据库特点功能比较
顾立茵
《现代情报》
北大核心
2005
15
在线阅读
下载PDF
职称材料
16
汉字自适应散列分组查找算法
王忠效
范植华
《中文信息学报》
CSCD
北大核心
2001
1
在线阅读
下载PDF
职称材料
17
信息管理系统软件H—CGRS移植技术
邬永久
《远程教育杂志》
1996
0
在线阅读
下载PDF
职称材料
18
基于Lucene的站内搜索设计与实现
朱学昊
王儒敬
余锋林
唐昱
《计算机应用与软件》
CSCD
北大核心
2008
12
在线阅读
下载PDF
职称材料
19
网际搜索技术的Java实现
刘特
徐迎晓
吴建军
《计算机工程》
CAS
CSCD
北大核心
2002
1
在线阅读
下载PDF
职称材料
20
靓站收藏
《现代电子技术》
1998
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部