期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
面向Web的信息收集工具的设计与开发 被引量:14
1
作者 潘春华 常敏 武港山 《计算机应用研究》 CSCD 北大核心 2002年第6期144-147,共4页
随着互联网的发展以及网上信息的日益丰富 ,传统的信息处理已经延伸到互联网领域。在对互联网上的信息进行处理时 ,常常要将分布在互联网各处的Web页面下载到本地供进一步处理 ;这便是所讨论的Web页面收集工具的核心功能。该页面收集系... 随着互联网的发展以及网上信息的日益丰富 ,传统的信息处理已经延伸到互联网领域。在对互联网上的信息进行处理时 ,常常要将分布在互联网各处的Web页面下载到本地供进一步处理 ;这便是所讨论的Web页面收集工具的核心功能。该页面收集系统在综合使用Web页面间的链接关系和页面内容的基础上 ,增加了多层次的页面过滤模块 ,可用来收集特定领域内的Web页面 ;同时可采用多机并行收集的方法提高页面收集的效率 ;采用大型数据库存放元收集信息 ,并对收集到的页面进行压缩 ,能够支持海量数据的收集 ;动态更新机制的实施使得下载到本地的页面信息能够得到及时的更新。 展开更多
关键词 web 信息收集工具 设计 页面收集 信息处理 网络爬虫 万维网 INTERNET
在线阅读 下载PDF
WEB用户的视图 被引量:18
2
作者 阳小华 周龙骧 《软件学报》 EI CSCD 北大核心 1999年第7期690-693,共4页
视图不仅是数据库中的一个重要概念,也能够在Web 系统中发挥重要的作用.但是,Web 视图不能完全照搬数据库视图的概念,而应该体现出Web 特色.文章提出了浏览区域的概念,能较好地刻画Web 用户活动的特征.在此概念的基... 视图不仅是数据库中的一个重要概念,也能够在Web 系统中发挥重要的作用.但是,Web 视图不能完全照搬数据库视图的概念,而应该体现出Web 特色.文章提出了浏览区域的概念,能较好地刻画Web 用户活动的特征.在此概念的基础上,给出一个能体现Web 特色的用户视图的定义,初步探讨了Web 展开更多
关键词 web 视图 数据库 超文本信息系统
在线阅读 下载PDF
基于Web Log的数据预处理研究 被引量:4
3
作者 向坚持 陈晓红 +1 位作者 刘相滨 徐选华 《湖南师范大学自然科学学报》 EI CAS 北大核心 2004年第4期33-36,54,共5页
Web日志文件是进行Web挖掘的重要数据来源,对Web日志的数据预处理是Web挖掘过程中关键的一步.首先介绍了Web日志挖掘的体系结构,然后详细地分析了Web日志文件,并对基于Web日志文件的数据预处理进行了较深入的研究,提出了包括数据净化、... Web日志文件是进行Web挖掘的重要数据来源,对Web日志的数据预处理是Web挖掘过程中关键的一步.首先介绍了Web日志挖掘的体系结构,然后详细地分析了Web日志文件,并对基于Web日志文件的数据预处理进行了较深入的研究,提出了包括数据净化、数据抽取、数据转换和数据集成等过程的具有实际应用价值的数据预处理的实现方法. 展开更多
关键词 web日志挖掘 数据预处理 基于web web挖掘 日志文件 数据抽取 数据净化 过程 实际 实现方法
在线阅读 下载PDF
组合Web Service支撑系统的研究与实现 被引量:7
4
作者 杜宗霞 怀进鹏 +1 位作者 王勇 张煜 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2003年第10期889-892,共4页
为实现Internet环境下企业间的业务过程集成 ,分析、研究了业务过程集成的基本功能需求及Internet环境下业务过程集成的新需求 ,讨论了组合WebService支撑系统的原理及其体系结构 .该系统为组合WebService提供了定义、部署、运行及监控... 为实现Internet环境下企业间的业务过程集成 ,分析、研究了业务过程集成的基本功能需求及Internet环境下业务过程集成的新需求 ,讨论了组合WebService支撑系统的原理及其体系结构 .该系统为组合WebService提供了定义、部署、运行及监控管理等较完善的功能支持 。 展开更多
关键词 组合 动态性 网络服务 设计工具 执行引擎
在线阅读 下载PDF
层次化WebGIS构件系统的设计与实现 被引量:31
5
作者 罗英伟 汪小林 许卓群 《计算机学报》 EI CSCD 北大核心 2004年第2期177-185,共9页
给出了一个实用的WebGIS对象构件系统模型Geo Union .它由 4个层次组成 :存储层、服务层、构件层和应用层 ,其中服务层又可分为客户端和服务器两个层面 .详细论述了Geo Union各层的结构、对象组成以及相互之间的关系 ,并对Geo Union中... 给出了一个实用的WebGIS对象构件系统模型Geo Union .它由 4个层次组成 :存储层、服务层、构件层和应用层 ,其中服务层又可分为客户端和服务器两个层面 .详细论述了Geo Union各层的结构、对象组成以及相互之间的关系 ,并对Geo Union中所采取的关键技术———空间数据模型、ORDB、空间索引以及空间缓存等进行了总结和分析 ,同时还给出了Geo Union的Web应用模式 .最后 ,对WebGIS进一步的工作 ,如互操作问题、安全问题。 展开更多
关键词 webGIS 服务器 存储层 服务层 构件层 应用层 空间缓存 空间索引 地理信息系统
在线阅读 下载PDF
对象式Web技术研究 被引量:1
6
作者 郎波 李伟琴 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2001年第4期452-455,共4页
随着Internet技术的发展与普及 ,网上的资源日益丰富与多样化 .而与之相比 ,现有的Web技术具有很大的局限性 ,无法支持资源的更广泛、更深层的共享 .对象式Web(ObjectWeb)技术正是针对这一问题提出的 ,是Web技术发展的新阶段 .深入分析... 随着Internet技术的发展与普及 ,网上的资源日益丰富与多样化 .而与之相比 ,现有的Web技术具有很大的局限性 ,无法支持资源的更广泛、更深层的共享 .对象式Web(ObjectWeb)技术正是针对这一问题提出的 ,是Web技术发展的新阶段 .深入分析了对象式Web的核心技术 ,并论述对象式Web发展初期的以分布式对象技术为核心的几种框架结构 ,重点阐述了将分布式对象技术与代理。 展开更多
关键词 计算机网络 人工智能 信息处理 对象式web
在线阅读 下载PDF
Cache技术在万维网上的应用 被引量:4
7
作者 虞春宜 于苹 马范援 《计算机工程与应用》 CSCD 北大核心 2002年第2期147-149,共3页
虽然Cache技术是一种传统的技术,但是在应用到网络新环境时,就需要在原有的技术上进行改进。文中详细地介绍整个网络中各个节点(用户端、代理端、服务器端)对用户事件的网络行为,说明在WWW上使用Cache技术的原因和介绍了如何在网络的不... 虽然Cache技术是一种传统的技术,但是在应用到网络新环境时,就需要在原有的技术上进行改进。文中详细地介绍整个网络中各个节点(用户端、代理端、服务器端)对用户事件的网络行为,说明在WWW上使用Cache技术的原因和介绍了如何在网络的不同节点上应用该技术的问题,并比较了现有的主要的有关网络缓存的各种不同协议。还介绍了这一技术中两个重要的问题:缓存替换策略和如何使缓存中的动态对象和原始的Web服务器中相应的对象保持一致。 展开更多
关键词 缓存 万维网 替换策略 cache技术 代理服务器 计算机网络
在线阅读 下载PDF
数据广播中的UCL标引与传输机制 被引量:24
8
作者 马建国 邢玲 +1 位作者 李幼平 李在铭 《电子学报》 EI CAS CSCD 北大核心 2004年第10期1621-1624,1643,共5页
UCL(UniformContentLocator)是作者、编者和读者进行语义沟通的工具 ,是数据广播中解决接收端数据信息的快速选择、信息过滤、智能代理和信息的主动服务的基础 .本文系统地介绍了数据广播中UCL的概念 ,提出了在数据广播中进行UCL标引的... UCL(UniformContentLocator)是作者、编者和读者进行语义沟通的工具 ,是数据广播中解决接收端数据信息的快速选择、信息过滤、智能代理和信息的主动服务的基础 .本文系统地介绍了数据广播中UCL的概念 ,提出了在数据广播中进行UCL标引的方法和两级复用方法 ,研究了数据广播的UCL W标引方案 ,研究了多映射与复用技术 ,最后给出了在数据广播的传输过程中 ,发送端对数据信息进行采集、标引、映射、复用、格式转换和调制的工作流程 .实验验证了理论方案的正确性和有效性 . 展开更多
关键词 数据广播 UCL 信息标引 DVB
在线阅读 下载PDF
抄袭论文识别研究与进展 被引量:36
9
作者 史彦军 滕弘飞 金博 《大连理工大学学报》 EI CAS CSCD 北大核心 2005年第1期50-57,共8页
抄袭论文识别研究对于净化学术风气、保护知识产权具有重要意义.国外对于抄袭论文(英文)识别技术与系统的研究已有多年历史,并取得一定进展,而国内发表的相关文献尚少.综述了抄袭论文识别技术,如数字指纹和词频统计等技术;介绍了相关识... 抄袭论文识别研究对于净化学术风气、保护知识产权具有重要意义.国外对于抄袭论文(英文)识别技术与系统的研究已有多年历史,并取得一定进展,而国内发表的相关文献尚少.综述了抄袭论文识别技术,如数字指纹和词频统计等技术;介绍了相关识别系统,如siff、COPS、dSCAM、KOALA和Check等;分析了各抄袭识别技术特点及应用范围.最后结合中文学术论文的特点,从应用角度出发,讨论了若干待解决的关键问题及发展趋势. 展开更多
关键词 学术论文 知识产权 识别 数字指纹 词频 论文抄袭行为
在线阅读 下载PDF
一种基于词典的搜索引擎系统动态更新模型 被引量:13
10
作者 雷鸣 刘建国 +1 位作者 王建勇 陈葆珏 《计算机研究与发展》 EI CSCD 北大核心 2000年第10期1265-1270,共6页
基于词汇标注的特征项提取方法是中文信息处理的有效方法 ,但词汇的析取是基于词典的 ,词典的涵盖程度决定了词汇切分的准确率 .因而不断地学习新词汇、动态地维护词典 ,使整个中文信息处理系统具有自适应性和动态性就成了一个关键问题 ... 基于词汇标注的特征项提取方法是中文信息处理的有效方法 ,但词汇的析取是基于词典的 ,词典的涵盖程度决定了词汇切分的准确率 .因而不断地学习新词汇、动态地维护词典 ,使整个中文信息处理系统具有自适应性和动态性就成了一个关键问题 .以搜索引擎系统为例 ,提出了一种基于词典动态变化的搜索引擎系统更新理论模型和实现模型 .相关实验表明 ,该模型对缩短搜索引擎信息库的更新时间。 展开更多
关键词 万维网 词典 搜索引擎系统 中文信息处理
在线阅读 下载PDF
基于用户访问事务文法的序列关联规则发现 被引量:5
11
作者 王实 高文 李锦涛 《软件学报》 EI CSCD 北大核心 2001年第10期1503-1509,共7页
在 Web挖掘中 ,应用关联规则发现方法可以发现 Web页面之间用户访问的关联度 .由于 Web站点内含丰富的页面结构信息 ,也由于用户的访问总是要遵循一定的访问顺序 ,因此提出一种新的可以发现用户访问序列之间关联度的方法——序列关联规... 在 Web挖掘中 ,应用关联规则发现方法可以发现 Web页面之间用户访问的关联度 .由于 Web站点内含丰富的页面结构信息 ,也由于用户的访问总是要遵循一定的访问顺序 ,因此提出一种新的可以发现用户访问序列之间关联度的方法——序列关联规则发现方法 .该方法首先得到用户访问事务 ;然后根据正则文法 ,定义了一种新的用户访问事务文法 ,用于从用户访问事务中得到用户序列访问事务 ;最后应用关联规则发现算法进而发现序列关联规则 .为了进一步评价所发现的序列关联规则 ,引入了互信息的概念 .发现的序列关联规则可以帮助 Web站点的设计者更好地理解用户的访问 ,以用于调整 展开更多
关键词 web 数据挖掘 文法 序列关联规则 数据库
在线阅读 下载PDF
WWW分布数据源研究——数据模型和查询语言 被引量:11
12
作者 陈滢 徐宏炳 王能斌 《软件学报》 EI CSCD 北大核心 1998年第8期566-573,共8页
该文提出了分布式WWW(world-wideweb)数据源WWWDS(WWWdatasources)概念,详细介绍了WWWDS的数据模型.该数据模型包括节点、节点容器、节点图和链接点等,简单且具有扩展性,同时提出相应... 该文提出了分布式WWW(world-wideweb)数据源WWWDS(WWWdatasources)概念,详细介绍了WWWDS的数据模型.该数据模型包括节点、节点容器、节点图和链接点等,简单且具有扩展性,同时提出相应的查询能力强的查询语言WWWQL(WWWquerylanguage),并进一步探讨了查询处理和优化问题. 展开更多
关键词 WWW 分布数据源 数据模型 查询语言 INTERNET网
在线阅读 下载PDF
广播型网格的用户兴趣图谱 被引量:5
13
作者 马建国 邢玲 +1 位作者 李幼平 文丽 《电子学报》 EI CAS CSCD 北大核心 2005年第1期142-146,共5页
用户兴趣图谱是实现智能代理与主动服务的基本依据 .而广播型网格的用户兴趣图谱有其自身的特点 .本文研究了UCL(UniformContentLocator)在广播型网格中接收端的应用机制 ,建立了UCL解析、数据流控制和UCL应用机制 ,提出了建立基于UCL... 用户兴趣图谱是实现智能代理与主动服务的基本依据 .而广播型网格的用户兴趣图谱有其自身的特点 .本文研究了UCL(UniformContentLocator)在广播型网格中接收端的应用机制 ,建立了UCL解析、数据流控制和UCL应用机制 ,提出了建立基于UCL的用户兴趣图谱的方法 ,分析了信息的媒体结构与本体结构的特点 ,研究了相互间转换和在用户肖像模型建立过程中的作用 .利用实验建立的广播网格环境验证了该方法的有效性 . 展开更多
关键词 网格 广播 用户肖像模型 语义网 智能代理
在线阅读 下载PDF
自动定位彩色图像中的文本 被引量:5
14
作者 章东平 祝金标 刘济林 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2005年第2期229-233,共5页
提出一种适用于万维网搜索、彩色图像索引和视频索引等多种应用的彩色图像文本定位方法.算法采用多尺度图像分割方法把彩色图像分割为一系列可能包含文本的图像块,用连通区域方法确定每一个文本图像块中文本的精确位置和大小.采用多颜... 提出一种适用于万维网搜索、彩色图像索引和视频索引等多种应用的彩色图像文本定位方法.算法采用多尺度图像分割方法把彩色图像分割为一系列可能包含文本的图像块,用连通区域方法确定每一个文本图像块中文本的精确位置和大小.采用多颜色图像分解方法提取具有相似颜色的连通区域,通过聚类相邻的连通区域得到文本的位置和范围.利用一个图像数据库来测试本文算法,试验表明算法具有较高的正确率. 展开更多
关键词 高斯图像金字塔 颜色减少 图像分解 连通区域分析 排列分析
在线阅读 下载PDF
基于统计的中文文本主题自动提取研究 被引量:7
15
作者 张清军 朱才连 《四川大学学报(工程科学版)》 EI CAS CSCD 2004年第3期97-100,共4页
文本主题自动提取是一种很有实用价值的技术,它可以有效地浓缩整个web页面,解决无线网络终端由于显示屏太小而无法显示整个网页的难题。总结了目前有关文本主题提取方面的研究成果,设计了一个特征词加权函数,在此函数中考虑了词所跨的... 文本主题自动提取是一种很有实用价值的技术,它可以有效地浓缩整个web页面,解决无线网络终端由于显示屏太小而无法显示整个网页的难题。总结了目前有关文本主题提取方面的研究成果,设计了一个特征词加权函数,在此函数中考虑了词所跨的段落数因子,同时采用非线性函数描述词长因子和词所跨的段落数因子的作用,并将加权函数应用于主题自动提取。实现了一个中文主题自动提取系统原型,通过对文本集的测试验证了加权函数的有效性。 展开更多
关键词 主题自动提取 特征词 加权函数
在线阅读 下载PDF
基于浏览过程的LFU:一个新的WWW缓冲清理算法 被引量:2
16
作者 阳小华 刘振宇 《计算机工程与应用》 CSCD 北大核心 2000年第6期133-134,共2页
文章分析了WWW系统中用户活动的特点,提出了浏览过程的概念,并对传统的缓冲清理算法LFU进行了改进,提出了一个基于WWW浏览过程的LFU算法。
关键词 浏览过程 WWW 缓冲清理算法 LFU
在线阅读 下载PDF
基于WWW用户浏览模式的路径提示算法
17
作者 刘振宇 阳小华 《计算机工程》 CAS CSCD 北大核心 2000年第5期98-99,共2页
提出了基于WWW浏览模式而获得用户在当前文档中的超链相应于用户当前兴趣质量的思想。并给出了具体获得超链质量步骤和算法。将质量最好的超链推荐给用户就是简单高效的路径提示。
关键词 WWW 用户浏览模式 路径提示算法 web
在线阅读 下载PDF
WWW浏览导航与结构优化技术 被引量:1
18
作者 阳小华 周龙骧 《计算机科学》 CSCD 北大核心 2000年第9期78-81,共4页
In this paper,we introduce some typical WWW navigation systems and Web site optimizationsystems,analyse the properties of navigation and optimization techniques, present some key problemsand techniques that are valuab... In this paper,we introduce some typical WWW navigation systems and Web site optimizationsystems,analyse the properties of navigation and optimization techniques, present some key problemsand techniques that are valuable to pay special attention and discuss the future works. 展开更多
关键词 WWW 浏览 导航 结构优化 技术
全文增补中
基于WWW浏览过程的最近最少使用算法 被引量:2
19
作者 阳小华 刘振宇 《计算机应用》 CSCD 2000年第5期19-20,23,共3页
在本文中 ,我们分析了WWW系统中用户活动的特点 ,提出了浏览过程的概念 ,并对传统的缓冲清理算法LRU进行了改进 ,提出了一个基于WWW浏览过程的LRU算法。
关键词 缓冲 浏览过程 WWW LRU算法 INTERNET网
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部