期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
Ontology研究综述 被引量:766
1
作者 邓志鸿 唐世渭 +2 位作者 张铭 杨冬青 陈捷 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 2002年第5期730-738,共9页
Ontology是描述概念及概念之间关系的概念模型 ,通过概念之间的关系来描述概念的语义。作为一种有效表现概念层次结构和语义的模型 ,Ontology被广泛地应用到计算机科学的众多领域。本文作者对目前Ontology的研究与应用现状进行了综述性... Ontology是描述概念及概念之间关系的概念模型 ,通过概念之间的关系来描述概念的语义。作为一种有效表现概念层次结构和语义的模型 ,Ontology被广泛地应用到计算机科学的众多领域。本文作者对目前Ontology的研究与应用现状进行了综述性地介绍 ,从Ontology的定义、Ontol ogy理论研究、Ontology在信息系统中的应用以及在语义Web中的地位等方面加以了系统阐述。 展开更多
关键词 ONTOLOGY 信息系统 语义WEB XML RDF 概念模型 概念层次结构 应用模式 人工智能
在线阅读 下载PDF
论文元数据信息的自动抽取 被引量:38
2
作者 李朝光 张铭 +2 位作者 邓志鸿 杨冬青 唐世渭 《计算机工程与应用》 CSCD 北大核心 2002年第21期189-191,235,共4页
为了实现在Web上电子版论文结构的查询,必须提取这些论文的标题、作者、摘要和关键字等元数据信息。在北京大学数字图书馆科技文献检索系统中利用正则表达式规则对论文元数据信息进行自动抽取。该文介绍的这种方法充分利用了论文所特有... 为了实现在Web上电子版论文结构的查询,必须提取这些论文的标题、作者、摘要和关键字等元数据信息。在北京大学数字图书馆科技文献检索系统中利用正则表达式规则对论文元数据信息进行自动抽取。该文介绍的这种方法充分利用了论文所特有的结构,在不采用语法分析等复杂的自然语言处理手段的情况下取得了很好的效果,为面向特定领域的元信息抽取作了有益的研究和探索。 展开更多
关键词 论文 元数据信息 自由抽取 科技文献检索系统 信息抽取 正则表达式规则 WEB
在线阅读 下载PDF
数据仓库中数据质量控制研究 被引量:40
3
作者 方幼林 杨冬青 +3 位作者 唐世渭 张卫华 余利波 付强 《计算机工程与应用》 CSCD 北大核心 2003年第13期1-4,共4页
随着数据仓库的深入应用,数据质量问题成为关系到数据仓库建设成败和数据能否有效应用的重要关键问题。该文首先讨论数据仓库环境下存在的数据质量问题以及保证数据质量的重要性,然后提出数据质量的度量和评价指标,最后给出了数据仓库... 随着数据仓库的深入应用,数据质量问题成为关系到数据仓库建设成败和数据能否有效应用的重要关键问题。该文首先讨论数据仓库环境下存在的数据质量问题以及保证数据质量的重要性,然后提出数据质量的度量和评价指标,最后给出了数据仓库实施和运行过程中数据质量控制的数据质量成熟度模型和保证仓库数据质量的方法。 展开更多
关键词 数据质量 数据仓库 质量控制 数据质量成熟度模型
在线阅读 下载PDF
PCCS部分聚类分类:一种快速的Web文档聚类方法 被引量:23
4
作者 王爱华 张铭 +1 位作者 杨冬青 唐世渭 《计算机研究与发展》 EI CSCD 北大核心 2001年第4期415-421,共7页
PCCS是为了帮助 Web用户从搜索引擎所返回的大量文档片断中筛选出自己所需要的文档 ,而使用的一种对 Web文档进行快速聚类的部分聚类方法 :首先对一部分文档进行聚类 ,然后根据聚类结果形成分类模型对其余的文档进行分类 .采用交互式的... PCCS是为了帮助 Web用户从搜索引擎所返回的大量文档片断中筛选出自己所需要的文档 ,而使用的一种对 Web文档进行快速聚类的部分聚类方法 :首先对一部分文档进行聚类 ,然后根据聚类结果形成分类模型对其余的文档进行分类 .采用交互式的一次改进一个聚类摘选的聚类方法快速地创建一个聚类摘选集 ,将其余的文档使用 Nal¨ve- Bayes分类器进行划分 .为了提高聚类与分类的效率 ,提出了一种混合特征选取方法以减少文档表示的维数 :重新计算文档中各特征的熵 ,从中选取具有最大熵值的前若干个特征 ;或者基于持久分类模型中的特征集来进行特征选取 .实验证明 ,部分聚类方法能够快速、准确地根据文档主题内容组织 Web文档 ,使用户在更高的主题层次上来查看搜索引擎返回的结果 。 展开更多
关键词 聚类 分类 特征选取 文档相似性 PCCS WEB文档 信息检索
在线阅读 下载PDF
面向语义集成——本体在Web信息集成中的研究进展 被引量:49
5
作者 邓志鸿 唐世渭 杨冬青 《计算机应用》 CSCD 北大核心 2002年第1期15-17,共3页
本体 (Ontology)是描述概念及概念之间关系的概念模型 ,通过概念之间的关系来描述概念的语义。作为一种有效表现概念层次结构和语义的模型 ,本体在Web信息集成中得到广泛的应用。文中就目前本体在Web信息集成中的应用做了分析与探讨 。
关键词 本体 结构方法 语义方法 WEB 信息集成 语义集成 计算机网络
在线阅读 下载PDF
基于Ontology的Web内容二阶段半自动提取方法 被引量:18
6
作者 高军 王腾蛟 +1 位作者 杨冬青 唐世渭 《计算机学报》 EI CSCD 北大核心 2004年第3期310-318,共9页
目前Web中的海量信息已经成为人们重要的信息来源 ,如何从大量半结构化或无结构的HTML网页中提取信息已成为目前的研究热点 .但是Web页面的初始设计目的是为了方便用户浏览 ,而不是便于应用程序自动处理 ,如何实现一个精确的、应用广泛... 目前Web中的海量信息已经成为人们重要的信息来源 ,如何从大量半结构化或无结构的HTML网页中提取信息已成为目前的研究热点 .但是Web页面的初始设计目的是为了方便用户浏览 ,而不是便于应用程序自动处理 ,如何实现一个精确的、应用广泛的提取系统面临很多困难 .传统的方法可以粗略划分为基于交互产生的包装程序和自动生成的包装程序 ,但是基于交互产生的包装程序不具备普遍的应用性 ,基于自动生成的包装程序准确性不高 .该文提出了一种新的二阶段基于语义的半自动提取方法 ,在保证提取准确性的前提下 ,尽可能减少交互操作 ,同时随着参与网站的增加 ,逐步提高包装程序生成的自动化 .相对于目前的方法 ,该文方法同时考虑了包装程序提取结果的准确性和提取过程的应用普遍性 .其有效性在原型系统中得到验证 .应用该方法 ,已经成功提取了12 0万HTML页面 . 展开更多
关键词 Internet 搜索引擎系统 信息获取 Web ONTOLOGY 网页分类 半自动提取法
在线阅读 下载PDF
异常点挖掘研究进展 被引量:22
7
作者 王宏鼎 童云海 +2 位作者 谭少华 唐世渭 杨冬青 《智能系统学报》 2006年第1期67-73,共7页
异常点是数据集中与其他数据显著不同的数据.一个人的噪声对另一个人而言可能是有用的数据,因此,随着人们对数据质量、欺诈检测、网络入侵、故障诊断、自动军事侦察等问题的关注,异常点挖掘在信息科学研究领域日益受到重视.在充分调研... 异常点是数据集中与其他数据显著不同的数据.一个人的噪声对另一个人而言可能是有用的数据,因此,随着人们对数据质量、欺诈检测、网络入侵、故障诊断、自动军事侦察等问题的关注,异常点挖掘在信息科学研究领域日益受到重视.在充分调研国内外异常点挖掘研究文献基础上,系统地综述了数据库研究领域中异常点挖掘的研究现状,对已有各种异常点挖掘方法进行了总结和比较,并结合当前研究热点,展望了异常点挖掘未来的研究方向及其面临的挑战. 展开更多
关键词 异常点 挖掘方法 局部异常点 数据流 高维数据
在线阅读 下载PDF
数字图书馆科技文献知识导航 被引量:9
8
作者 张铭 邓志鸿 +2 位作者 陈捷 杨冬青 唐世渭 《计算机工程与应用》 CSCD 北大核心 2002年第17期1-3,24,共4页
提出了一种基于分类法和主题词表的科技文献知识导航体系,该体系支持分类法和主题词表知识导航、元数据结构查询和全文检索这三种检索手段以及他们的混合应用。从分类法主题词表的概念浏览和元数据查询的语义支持的角度来说,这是一个支... 提出了一种基于分类法和主题词表的科技文献知识导航体系,该体系支持分类法和主题词表知识导航、元数据结构查询和全文检索这三种检索手段以及他们的混合应用。从分类法主题词表的概念浏览和元数据查询的语义支持的角度来说,这是一个支持概念检索的知识导航体系。根据该体系,实现了“北京大学科技文献检索系统”实验数字图书馆。 展开更多
关键词 数字图书馆 科技文献 知识导航 元数据抽取 分类 主题词表 概念检索 因特网
在线阅读 下载PDF
基于OAI的数字图书馆中元数据互操作框架 被引量:37
9
作者 王爱华 张铭 +1 位作者 杨冬青 唐世渭 《计算机工程与应用》 CSCD 北大核心 2002年第1期5-7,41,共4页
提出一种基于最新的元数据互操作协议———OAI的元数据互操作框架。文章给出了框架中各个组件的模块及功能说明,并说明各模块之间的交互。这种框架克服了以前人们所提出的其他集成方法过于复杂、难于实施的缺点。
关键词 元数据 OAI 互操作
在线阅读 下载PDF
基于本体的多Agent分布式数字图书馆资源信息发现服务模型之研究 被引量:18
10
作者 邓志鸿 唐世渭 杨冬青 《计算机工程》 CAS CSCD 北大核心 2002年第6期37-38,58,共3页
针对万维网上分布式数字图书馆资源发现和集成存在的问题,提出了基于本体的多分布式数字图书馆资源信息发现服务模Agent型,详细研究和分析在这种模型框架下资源集成和发现的原理和关键技术,并提出进一步的研究工作。
关键词 本体 Agent 分布式数字图书馆 信息发现服务模型 信息发现 信息集成 资源发现
在线阅读 下载PDF
基于XML的本体表示和检索技术的研究 被引量:11
11
作者 邓志鸿 唐世渭 +1 位作者 杨冬青 张铭 《计算机工程与应用》 CSCD 北大核心 2002年第3期14-15,67,共3页
基于XML和本体在抽象层次上都可以用带标签的有向图来表示,文章提出了用XML来描述本体,并在此基础上实现对本体中概念的检索。
关键词 XML 概念检索 本体表示 信息检索 INTERNET
在线阅读 下载PDF
本体内代数系统之研究 被引量:9
12
作者 邓志鸿 唐世渭 +1 位作者 杨冬青 张铭 《计算机工程与应用》 CSCD 北大核心 2001年第23期7-8,40,共3页
信息检索中的语义问题一直是研究的热点。本体作为能描述语义能力的建模方法,在信息系统领域得到广泛的关注和应用。文献犤1犦犤2犦研究了在不同本体之间构建代数系统来解决分布式系统之间的语义异构。文章研究单个本体内的代数系统,给... 信息检索中的语义问题一直是研究的热点。本体作为能描述语义能力的建模方法,在信息系统领域得到广泛的关注和应用。文献犤1犦犤2犦研究了在不同本体之间构建代数系统来解决分布式系统之间的语义异构。文章研究单个本体内的代数系统,给出了该代数的定义和相关概念,并结合实例指出该代数系统有利于提高信息检索的质量。 展开更多
关键词 代数系统 本体 信息检索 WEB INTERNET
在线阅读 下载PDF
数据转换过程的串行化方法 被引量:6
13
作者 方幼林 杨冬青 +3 位作者 唐世渭 张卫华 余利波 付强 《计算机工程与应用》 CSCD 北大核心 2003年第17期4-6,187,共4页
随着数据仓库和数据集成的发展,数据清洗的工作越来越多,用户在进行数据清洗时需要对数据的内容进行多次处理。在设计清洗的建模过程中,用户可能对同一个数据进行多次的清洗和转换处理,由于步骤多,用户往往不知道清洗和转换步骤出现错... 随着数据仓库和数据集成的发展,数据清洗的工作越来越多,用户在进行数据清洗时需要对数据的内容进行多次处理。在设计清洗的建模过程中,用户可能对同一个数据进行多次的清洗和转换处理,由于步骤多,用户往往不知道清洗和转换步骤出现错误。该文对前述问题进行论述,并针对这种清洗和转换处理中的赋值冲突和范围冲突提出解决方法。 展开更多
关键词 数据转换 数据清洗 建模处理
在线阅读 下载PDF
基于期望与K次方差的信息检索质量评估模型的研究 被引量:2
14
作者 邓志鸿 张铭 +1 位作者 唐世渭 杨冬青 《计算机研究与发展》 EI CSCD 北大核心 2002年第12期1764-1770,共7页
查全率和查准率是评估信息检索系统检索质量的两个基本标准 .长期以来 ,基于这两个标准 ,存在着多种评价方法 .但是 ,这些方法基本上是对查全率和查准率做简单的处理 ,仅反映检索的平均性能 ,而对检索稳定性没有分析 ,并且缺乏一套科学... 查全率和查准率是评估信息检索系统检索质量的两个基本标准 .长期以来 ,基于这两个标准 ,存在着多种评价方法 .但是 ,这些方法基本上是对查全率和查准率做简单的处理 ,仅反映检索的平均性能 ,而对检索稳定性没有分析 ,并且缺乏一套科学的、系统的评估体系 .针对这种情况 ,借鉴概率学中的期望和方差的思想 ,用数学语言严格定义了查全期望、查准期望 ,K次查全方差和 K次查准方差等概念 .在这些概念的基础上 ,给出了信息检索质量评估准则 .与其它模型相比 ,该模型能从检索的平均质量和检索的稳定性两方面反映检索系统的性能 ,因此 。 展开更多
关键词 期望 K次方差 信息检索 质量评估模型 查准期望 检索质量
在线阅读 下载PDF
基于Boost和信任函数的多文本分类器组合模型 被引量:1
15
作者 王爱华 张铭 +1 位作者 杨冬青 唐世渭 《计算机工程与应用》 CSCD 北大核心 2002年第2期51-54,共4页
人们对文本分类已经进行了大量的研究,取得很多研究成果,设计多种分类器,达到相当高的分类精确度。但使用单分类器进行文本分类有一些缺点,如分类模型对样本的敏感性,而且单分类器的分类精度很难再有很大的提高。因此,使用多分类器以提... 人们对文本分类已经进行了大量的研究,取得很多研究成果,设计多种分类器,达到相当高的分类精确度。但使用单分类器进行文本分类有一些缺点,如分类模型对样本的敏感性,而且单分类器的分类精度很难再有很大的提高。因此,使用多分类器以提高分类的精度是一个非常活跃的研究领域。文章提出使用近年在传统概率统计方法之上发展起来的信任函数理论和方法对多个文本分类器进行组合使用。具体方法是使用信任函数将分类结果进行综合,得到最终的分类结果。实验证明,基于信任函数的信息综合方法比已有的方法更合理,精度也得到提高。 展开更多
关键词 BOOST 信任函数 多文本分类器组合模型 文档管理 信息处理
在线阅读 下载PDF
形态学准圆结构元素和骨架的研究 被引量:4
16
作者 许超 《电子学报》 EI CAS CSCD 北大核心 1999年第8期78-81,共4页
本文提出了以最短线段结构元素构造准圆结构元素与序列生成准圆结构元素相结合的设计方法,这种方法不仅可以形成高精度的准圆结构元素,而且可以极大地减少相应的形态学运算量.本文推导了结构元素平移时的平移相容性公式和保证准圆结... 本文提出了以最短线段结构元素构造准圆结构元素与序列生成准圆结构元素相结合的设计方法,这种方法不仅可以形成高精度的准圆结构元素,而且可以极大地减少相应的形态学运算量.本文推导了结构元素平移时的平移相容性公式和保证准圆结构元素的凸集性的前提条件,给出了序列生成准圆结构元素的快速算法.文中构造了半径为0~59的准圆结构元素组,其半径误差绝对值均小于05;文中还给出了相应的形态学骨架的优化求解算法。 展开更多
关键词 准圆结构元素 形态学骨架 图像处理
在线阅读 下载PDF
基于GML的地理信息集成系统研究
17
作者 赵文兵 廖湖声 谢昆青 《计算机工程与应用》 CSCD 北大核心 2006年第A01期48-49,53,共3页
GML已经成为事实上网络环境下空间数据的交换标准。基于GML的空间教据集成是未来Web服务的关键技术之一。提出了以关系型空间数据源为对象,以XQuery为查询语言的地理信息集成系统解决方案。对集成系统内部中间件和包装器的设计与实现进... GML已经成为事实上网络环境下空间数据的交换标准。基于GML的空间教据集成是未来Web服务的关键技术之一。提出了以关系型空间数据源为对象,以XQuery为查询语言的地理信息集成系统解决方案。对集成系统内部中间件和包装器的设计与实现进行了研究。 展开更多
关键词 数据集成 中间件 包装器 GML 空间数据
在线阅读 下载PDF
受危险理论启发的网络安全评估方法
18
作者 周振宇 张齐 沈建京 《计算机应用与软件》 CSCD 北大核心 2006年第11期111-113,共3页
危险理论在人工免疫系统(AIS)领域是一个相对较新的研究方向。该理论提出了不同于传统自我—非我模型的新观点。它解释了传统人类免疫系统(H IS)理论中存在的问题,促进了人工免疫系统的发展。介绍了危险理论涉及的内容及其应用,然后构... 危险理论在人工免疫系统(AIS)领域是一个相对较新的研究方向。该理论提出了不同于传统自我—非我模型的新观点。它解释了传统人类免疫系统(H IS)理论中存在的问题,促进了人工免疫系统的发展。介绍了危险理论涉及的内容及其应用,然后构建了一个用于安全评估的多Agent融合模型,并将危险理论应用于安全评估中。 展开更多
关键词 危险理论 人工免疫系统 安全评估
在线阅读 下载PDF
一种吸引分岔知识同模型及其应用实例
19
作者 周昌乐 《软件学报》 EI CSCD 北大核心 1996年第8期505-512,共8页
本文基于非线性动力学,特别是托姆的形态发生学思想,针对视觉学习,给出了一种吸引分岔知识网模型,用于解决知识表示和获取问题.通过引入皮亚杰发生认识论中的概念,模型拥有的学习功能包括强化、同化、顺应、聚合、分裂和遗忘;这... 本文基于非线性动力学,特别是托姆的形态发生学思想,针对视觉学习,给出了一种吸引分岔知识网模型,用于解决知识表示和获取问题.通过引入皮亚杰发生认识论中的概念,模型拥有的学习功能包括强化、同化、顺应、聚合、分裂和遗忘;这样就给出了一个学习视觉知识的完整方法.3个应用系统的结果表明,该模型及其学习方法,对于解决实际问题,是有效和适用的. 展开更多
关键词 知识表示 知识获取 吸引分岔网 人工智能
在线阅读 下载PDF
基于Berkeley DB的文献检索设计与实现 被引量:1
20
作者 孙哲 张铭 唐世渭 《计算机工程与应用》 CSCD 北大核心 2003年第13期200-203,220,共5页
该文基于开放源码的BerkeleyDB嵌入式数据库,采用不支持事务的BerkeleyDBConcurrentDataStore配置,实现了科学文献的全文检索和组合字段检索功能。该检索系统有着低开销,高效率的优点。为了进一步进行比较,文章还设计实现了基于Oracle... 该文基于开放源码的BerkeleyDB嵌入式数据库,采用不支持事务的BerkeleyDBConcurrentDataStore配置,实现了科学文献的全文检索和组合字段检索功能。该检索系统有着低开销,高效率的优点。为了进一步进行比较,文章还设计实现了基于Oracle数据库的检索方案。从实验结果来看,前者无论在开销还是检索效率上都远远优于后者,完全可适用于中大规模的各种检索应用。 展开更多
关键词 全文检索 科学文献导航 倒排文件 嵌入式数据库
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部