期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
Web使用模式研究中的数据挖掘 被引量:55
1
作者 张娥 冯秋红 +1 位作者 宣慧玉 田增瑞 《计算机应用研究》 CSCD 北大核心 2001年第3期80-83,共4页
Web使用模式挖掘是利用Web使用数据的高级手段,是对Web使用数据的深层次分析,从而挖掘出有效的、新颖的、潜在的、有用的及最终可以理解的知识,以帮助管理决策。综述了Web使用模式的数据挖掘研究技术的内容、现状和研究的方向。
关键词 数据挖掘 事务数据库 WEB 用户访问模式 INTERNET
在线阅读 下载PDF
不产生候选的快速投影频繁模式树挖掘算法 被引量:11
2
作者 何炎祥 向剑文 +1 位作者 朱骁峰 孔维强 《计算机科学》 CSCD 北大核心 2002年第11期71-75,共5页
Frequent Pattern mining plays an essential role in data mining. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especia... Frequent Pattern mining plays an essential role in data mining. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especially when there exist prolific patterns and/or long patterns.In this study, we introduce a novel frequent pattern growth (FP-growth)method, which is efficient and scalable for mining both long and short frequent patterns without candidate generation. And build a new project frequent pattern growth (PFP-tree)algorithm on this study, which not only heirs all the advantages in the FP-growth method, but also avoids it's bottleneck in database size dependence. So increase algorithm's scalability efficiently. 展开更多
关键词 事务数据库 快速投影频繁模式树挖掘算法 数据挖掘 频繁项集
在线阅读 下载PDF
一种全新的全文索引模型——后继数组模型 被引量:11
3
作者 刘学文 陶晓鹏 +1 位作者 于玉 胡运发 《软件学报》 EI CSCD 北大核心 2002年第1期150-158,共9页
提出了一种新的全文索引模型——后继数组模型,它结合了目前多个主流全文检索模型(倒排表模型、Pat数组模型等)的优点,提高了空间效率和时间效率,并得到了理论和实验的证明.
关键词 全文索引模型 后继数组模型 文本数据库 数据模型
在线阅读 下载PDF
全文索引的研究 被引量:10
4
作者 徐小刚 王俊杰 于玉 《计算机工程》 CAS CSCD 北大核心 2002年第2期101-103,共3页
在倒排表模型的基础上,从加快索引创建速度和改进索引动态结构两个方面着手,提出并实现了一种高效的索引创建算法和相应的索引模型,经过测试,新系统的索引创建速度可以和数据复制速度相提并论。而在空间效率上,也得到了一定程度的提高。
关键词 全文索引 倒排表模型 Pat数组 文本数据库 研究
在线阅读 下载PDF
基于HTML模式代数的Web信息提取方法 被引量:8
5
作者 李石君 于俊清 欧伟杰 《计算机研究与发展》 EI CSCD 北大核心 2006年第9期1644-1650,共7页
高效地生成提取Web信息的包装器有着广阔的应用前景,同时也是至今没有得到有效解决的难题.为此,提出了基于HTML文档的模式代数,该代数包括一致模式集等重要概念以及模式的加法运算.在此基础上,提出了一种提取Web信息的新方法,该方法采... 高效地生成提取Web信息的包装器有着广阔的应用前景,同时也是至今没有得到有效解决的难题.为此,提出了基于HTML文档的模式代数,该代数包括一致模式集等重要概念以及模式的加法运算.在此基础上,提出了一种提取Web信息的新方法,该方法采用在整个训练例子中学习表示各属性提取规则的一致模式集,再由多个模式组成的一致模式集提取数据,适用于提取具有缺省属性、多值属性、属性具有多种不同顺序的表结构网页和层次结构网页,其有效性在原型系统中通过实验得到验证. 展开更多
关键词 WEB信息提取 包装器归纳学习 WEB挖掘
在线阅读 下载PDF
基于Web的时间序列模式挖掘 被引量:7
6
作者 陈才扣 金远平 《计算机应用研究》 CSCD 2000年第7期32-33,共2页
序列模式挖掘是数据挖掘的重要研究课题之一,将其应用于Web环境具有重要意义。论述了Web时间序列模式挖掘问题,并给出了一种Web时间序列模式挖掘的有效算法。
关键词 数据挖掘 WEB 时间序列模式 事务数据库
在线阅读 下载PDF
搜索引擎指标综合特性的评价 被引量:4
7
作者 吴胜利 谭延之 施化吉 《江苏大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期181-186,214,共7页
对搜索引擎的检索性能进行评价是信息检索的一个重要方面,目前已经提出和使用许多各有特色的评价指标.对于如何选择出综合特性最优的评价指标,需要准确、可靠的判断方法.文中提出基于t检验的方法,并使用该方法对5种常用的评价指标进行... 对搜索引擎的检索性能进行评价是信息检索的一个重要方面,目前已经提出和使用许多各有特色的评价指标.对于如何选择出综合特性最优的评价指标,需要准确、可靠的判断方法.文中提出基于t检验的方法,并使用该方法对5种常用的评价指标进行了试验研究,包括平均查准率(average precision,AP)、前10个文档的查准率(precision at 10 document level,P@10)、可查全水平查准率(recall-level precision,RP)、第1位相关文档的倒数(reciprocal ranking,RR)、规范化带折扣的累积收益(normalized discounted cumulative gain,NDCG).结果表明NDCG的综合特性最好,其次是AP,然后是RP和P@10,RR最差.对于任意2个评价指标所提出的方法可以给出定量的比较结果. 展开更多
关键词 搜索引擎 检索性能 评价指标 稳定性 敏感性
在线阅读 下载PDF
基于ActiveX文档的Web数据库应用程序技术 被引量:4
8
作者 王聪华 崔进平 《计算机应用研究》 CSCD 北大核心 2004年第11期291-293,共3页
介绍了ActiveX文档技术,阐述了基于ActiveX文档的Web数据库应用程序的运行模式及在客户端运行的必备条件,并以实例说明了ActiveX文档数据库应用程序的开发方法。
关键词 ACTIVEX文档 WEB数据库 VB 注册DLL
在线阅读 下载PDF
大型事务数据库中的一种快速的规则挖掘算法 被引量:4
9
作者 朱玉全 孙志挥 《计算机科学》 CSCD 北大核心 2002年第10期59-60,69,共3页
1 引言数据挖掘(Data Mining),也称为数据库中知识发现KDD,是指发掘隐藏在堆积如山的数据中的真知灼见,这基本上正在变成一种商业上非做不可的事情。关联规则(As-sociation Rules)是数据挖掘的重要研究内容,目前的绝大部分关联规则挖掘... 1 引言数据挖掘(Data Mining),也称为数据库中知识发现KDD,是指发掘隐藏在堆积如山的数据中的真知灼见,这基本上正在变成一种商业上非做不可的事情。关联规则(As-sociation Rules)是数据挖掘的重要研究内容,目前的绝大部分关联规则挖掘算法一般都分为两个阶段:①频繁项目集的发现;②规则的产生。算法的计算工作量主要集中在第一阶段上,因此,如何快速确定频繁项目集是算法效率的关键,在这方面已有许多工作与成果。但总的来讲,许多研究都是在Apriori算法或其派生算法的基础上进行的。这些算法或多或少存在如下两个问题:①算法必须耗费大量的时间处理规模巨大的候选项目集; 展开更多
关键词 大型事务数据库 规则挖掘算法 数据挖掘 知识发现
在线阅读 下载PDF
改进的向量质心模型在实时信息检索中的应用研究 被引量:2
10
作者 刘绍翰 王箭 黄志球 《计算机应用与软件》 CSCD 2011年第10期62-64,76,共4页
将相关反馈技术应用于信息检索中可以学习和明确用户的信息需求,并对检索结果进行信息过滤,是提高信息检索效果的有效手段之一。除了准确率和召回率之外,过滤算法的适应性、速度也直接影响用户使用信息检索系统的体验。采用向量空间模... 将相关反馈技术应用于信息检索中可以学习和明确用户的信息需求,并对检索结果进行信息过滤,是提高信息检索效果的有效手段之一。除了准确率和召回率之外,过滤算法的适应性、速度也直接影响用户使用信息检索系统的体验。采用向量空间模型表示文档的内容预处理工作少,计算简单,适用于实时信息检索。结合偏差最小的基本原理,将改进的反馈文档向量的质心应用于信息重排。以重排的应用场景,在TREC Filtering Task数据集上进行仿真,并与基于关键词检索和类质心的检索方式进行了试验比较。 展开更多
关键词 信息检索 信息过滤 相关反馈 质心分类器 向量空间模型
在线阅读 下载PDF
基于本体的零件库信息模型
11
作者 陈静 邓立华 +2 位作者 成阳 刘黎 龚志伟 《桂林理工大学学报》 CAS 北大核心 2011年第4期600-603,共4页
零件库是企业产品开发设计过程中积累的大量信息和知识的集合,研究零件库信息的表达对于企业资源利用具有重要意义。在分析零件库信息的内容和组织的基础上,根据GB/T 17645.42标准对零件库进行分类,构建基于本体的零件库信息模型。通过... 零件库是企业产品开发设计过程中积累的大量信息和知识的集合,研究零件库信息的表达对于企业资源利用具有重要意义。在分析零件库信息的内容和组织的基础上,根据GB/T 17645.42标准对零件库进行分类,构建基于本体的零件库信息模型。通过基于本体的零件库信息的语义表达,降低零件库信息冗余度,优化零件库信息的表达,同时本体的语义信息给零件库信息的检索和重用提供了基础模型,最后给出了以OWL语言表达的零件本体和实例。 展开更多
关键词 零件库 事物特性表 本体 信息模型
在线阅读 下载PDF
超媒体系统中的语义约束问题研究
12
作者 周学海 李曦 +2 位作者 龚育昌 李光亚 赵振西 《中国科学技术大学学报》 CAS CSCD 北大核心 2000年第5期538-547,共10页
提出了一种基于数据库模式的超媒体语义网络模型 ,该模型通过引入模式约束图 ,对超媒体系统中的关系约束进行了分类 ,并给出了相应的约束检测算法 ;通过引入视图机制提出了结构约束的概念 ;通过扩充模式约束图的属性 ,描述了超媒体特定... 提出了一种基于数据库模式的超媒体语义网络模型 ,该模型通过引入模式约束图 ,对超媒体系统中的关系约束进行了分类 ,并给出了相应的约束检测算法 ;通过引入视图机制提出了结构约束的概念 ;通过扩充模式约束图的属性 ,描述了超媒体特定应用领域的计算约束 ,从而从整体上对与应用领域无关至特定应用领域的语义约束进行了深入的研究 . 展开更多
关键词 语义约束 数据库模式 超媒体系统
在线阅读 下载PDF
同构化信息温度与热点发现应用初探
13
作者 周启海 黄涛 +1 位作者 张元新 吴红玉 《计算机科学》 CSCD 北大核心 2007年第11期113-117,共5页
本文对信息在生活中的受关注程度进行研究,给出了一种度量信息重要性的标尺——同构化信息温度,并将它与计算机、互联网技术相结合,分别构造了单文本热点挖掘系统、文本数据库热点挖掘系统和Web网页热点挖掘系统模型框架。
关键词 同构化信息温度 单文本热点挖掘系统 文本数据库的热点挖掘系统 Web网页热点挖掘系统
在线阅读 下载PDF
基于分类器串联融合的生物医学命名实体识别
14
作者 马瑞民 马民艳 王浩畅 《大庆石油学院学报》 CAS 北大核心 2011年第2期91-94,122,共4页
鉴于生物医学命名实体识别的多数模型使用单机器学习算法时识别效果不好,提出一种基于条件随机域(CRFs)与最大熵(Maxent)分类器融合的方法,利用基分类器之间的相关性和互补性,结合有效的特征集合,进行再学习,得到融合模型.实验表明,该... 鉴于生物医学命名实体识别的多数模型使用单机器学习算法时识别效果不好,提出一种基于条件随机域(CRFs)与最大熵(Maxent)分类器融合的方法,利用基分类器之间的相关性和互补性,结合有效的特征集合,进行再学习,得到融合模型.实验表明,该模型的识别性能与单一分类器和JNLPBA专题会议相关的系统比较,取得很好成绩,F测度达到70.7%,证明该融合方法有效. 展开更多
关键词 条件随机域 最大熵 分类器融合 特征提取 生物医学命名实体识别
在线阅读 下载PDF
基于TK资源数据库的GUI设计
15
作者 刘莉 符红光 《计算机应用》 CSCD 北大核心 2002年第3期51-53,共3页
文中研究基于TK资源数据库的GUI设计。首先给出资源的定义 ,讨论了资源数据库的作用及其管理 。
关键词 TK资源数据库 图形用户界面 部件 程序设计
在线阅读 下载PDF
基于结构与文本关键词相关度的XML网页分类研究 被引量:14
16
作者 袁家政 须德 鲍泓 《计算机研究与发展》 EI CSCD 北大核心 2006年第8期1361-1367,共7页
针对XML网页特点,提出了计算XML文档结构相似性、文档关键词出现的位置以及关键词频度的方法,根据计算的结果提取XML网页特征,同时设计了一种基于支持向量机的XML网页多类分类算法·算法通过XML文档的训练样本集为每一类文档建立基... 针对XML网页特点,提出了计算XML文档结构相似性、文档关键词出现的位置以及关键词频度的方法,根据计算的结果提取XML网页特征,同时设计了一种基于支持向量机的XML网页多类分类算法·算法通过XML文档的训练样本集为每一类文档建立基于相似公共特征的聚类核,计算测试样本中的文档与每个聚类核的相似度,判断该文档的所属类·实验证明该分类算法具有比较高的分类查全率和查准率,能够较好地解决XML文档同时属于多个类的问题· 展开更多
关键词 XML分类 文档结构 关键词特征 支持向量机
在线阅读 下载PDF
数字图书馆中特色数据库的研究与实践 被引量:25
17
作者 苗凌 李人厚 《大学图书馆学报》 CSSCI 北大核心 2001年第2期13-15,共3页
阐述了特色数据库的定义和开发的必要性,并以一个数字图书馆的特色数据库——钱学森特色库为例子,研究了其结构和各个组成模块。通过将非结构和半结构数据转换成结构型数据,建立了多媒体资源可检索的数据库。
关键词 特色数据库 数字图书馆 非结构型数据 半结构数据 结构型数据 钱学森特色数据库 功能模块 体系结构 技术特点
在线阅读 下载PDF
集成搜索引擎的文本数据库选择 被引量:9
18
作者 孟卫一 吴宗寰 《计算机研究与发展》 EI CSCD 北大核心 2001年第4期396-404,共9页
用户需要检索的信息往往分散存储在多个搜索引擎各自的数据库里 .对普通用户而言 ,访问多个搜索引擎并从返回的结果中分辨出确实有用的网页是一件费时费力的工作 .集成搜索引擎则可以提供给用户一个同时访问多个搜索引擎的集成环境 .集... 用户需要检索的信息往往分散存储在多个搜索引擎各自的数据库里 .对普通用户而言 ,访问多个搜索引擎并从返回的结果中分辨出确实有用的网页是一件费时费力的工作 .集成搜索引擎则可以提供给用户一个同时访问多个搜索引擎的集成环境 .集成搜索引擎能将其接收到的用户查询提交给底层的多个搜索引擎进行搜索 .作为一种搜索工具 ,集成搜索引擎具有如 WEB查询覆盖面比传统引擎更大 ,引擎有更好的可扩展性等优点 .讨论了解决集成搜索引擎的数据库选择问题的多种技术 .针对用户提交的查询要求 。 展开更多
关键词 搜索引擎 信息检索 WEB 方维网 文本数据库
在线阅读 下载PDF
NoSQL数据库间数据交换代价研究 被引量:4
19
作者 郭昆 宋杰 +1 位作者 王洁萍 朱志良 《计算机工程与科学》 CSCD 北大核心 2016年第1期33-40,共8页
随着互联网时代的到来,IT行业迅猛发展,NoSQL数据库以其在大数据环境下出色的业务处理处理能力,在IT行业内得到越来越广泛的应用。而各NoSQL数据库由于自身数据模型的不同,在数据组织方式上彼此存在差异。NoSQL数据库间进行数据交换时,... 随着互联网时代的到来,IT行业迅猛发展,NoSQL数据库以其在大数据环境下出色的业务处理处理能力,在IT行业内得到越来越广泛的应用。而各NoSQL数据库由于自身数据模型的不同,在数据组织方式上彼此存在差异。NoSQL数据库间进行数据交换时,数据模型的不同会导致数据库间数据传输的阻抗,以源数据库数据模型封装的业务数据可能无法直接被目标数据库解析,需进行额外的模型适配操作,参照目标数据库数据模型组织业务数据以供筛选存储。为此,拟定义一种数据描述模型,对NoSQL数据库数据模型特征建模,描述NoSQL数据库的数据组织方式,并定义NoSQL数据库数据模型间距离评估算法。根据数据描述模型与距离评估算法可设计实现一种通用数据模型,其在数据交换过程中可与相关NoSQL数据库进行数据模型上的转换,系统相关业务代码只需参照该数据模型设计,而独立于数据交换过程中NoSQL数据库具体的数据模型。 展开更多
关键词 NOSQL 数据交换 数据模型 距离评估 编辑图
在线阅读 下载PDF
一种主动实时数据库的系统内存管理方法 被引量:8
20
作者 刘云生 何君辉 《计算机应用》 CSCD 北大核心 2004年第4期23-25,共3页
通过对一个主动实时数据库(ARTs DB)的研究,借鉴操作系统的内存管理机制,提出了一种具有现代应用特征的数据库系统内存管理模式。文中从ARTs DB的系统内存管理定义出发,探讨了主动实时数据库系统内存管理的目标及实现策略,并详细介绍了... 通过对一个主动实时数据库(ARTs DB)的研究,借鉴操作系统的内存管理机制,提出了一种具有现代应用特征的数据库系统内存管理模式。文中从ARTs DB的系统内存管理定义出发,探讨了主动实时数据库系统内存管理的目标及实现策略,并详细介绍了一种实现方法。 展开更多
关键词 主动数据库 实时数据库 系统内存 内存管理
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部