-
题名基于DOM模型扩展的Web信息提取
被引量:21
- 1
-
-
作者
顾韵华
田伟
-
机构
南京信息工程大学计算机与软件学院
-
出处
《计算机科学》
CSCD
北大核心
2009年第11期235-237,289,共4页
-
基金
江苏省产业技术研究与开发基金项目(苏发改高技发[2006]1106号)资助
-
文摘
提出了一种基于DOM模型扩展的Web信息提取方法。将Web页面表示为DOM树结构,对DOM树结点进行语义扩展并计算其影响度因子,依据结点的影响度因子进行剪枝,进而提取Web页面信息内容。该方法不要求对网页的结构有预先认识,具有自动和通用的特点。提取结果除可以直接用于Web浏览外,还可用于互联网数据挖掘、基于主题的搜索引擎等应用中。
-
关键词
文档对象模型
WEB信息提取
影响度因子
dom树扩展
-
Keywords
dom, Extraction of information from Web pages, Influence degree, Extended dom tree
-
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]
-
-
题名基于网页DOM树比对的SQL注入漏洞检测
被引量:5
- 2
-
-
作者
张晨
汪永益
王雄
施凡
-
机构
电子工程学院网络工程系
-
出处
《计算机工程》
CAS
CSCD
2012年第18期111-115,共5页
-
文摘
针对传统SQL注入漏洞检测方法准确率不高的问题,提出一种基于网页文档对象模型(DOM)树比对结果的检测方法。通过简化基于节点序列的网页比对方法,减少节点比对次数,加快检测效率,并设计实现一个SQL注入漏洞检测原型系统。实验结果表明,该系统具有较高的SQL注入漏洞检测效率和准确率。
-
关键词
网页比对
SQL注入
注入漏洞检测
文档对象模型树
dom树快速比对
-
Keywords
Webpage comparison; SQL injection; injection vulnerability detection; Document Object Model(dom) tree; fast dom tree comparison
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名利用XML DOM创建强大的XML应用
被引量:13
- 3
-
-
作者
李京
庄成三
徐彧
陈华英
-
机构
青岛大学计算机学院
四川大学计算机学院
电子科技大学电子工程系
-
出处
《计算机应用研究》
CSCD
北大核心
2002年第2期62-64,共3页
-
文摘
介绍了DOM产生的背景和DOM规范 ,并讨论了利用XMLDOM技术来实现动态地创建文档 ,以及遍历文档结构 ,添加、修改、删除文档内容 ,改变文档的显示方式等方法。
-
关键词
dom
API
XML
dom对象模型
XML语法树
网页
-
Keywords
dom
API
XML dom
XML Syntax
-
分类号
TP393.092
[自动化与计算机技术—计算机应用技术]
-
-
题名异构环境下的CSCW模型研究与实现
被引量:7
- 4
-
-
作者
李军怀
周明全
耿国华
-
机构
西北大学计算机系
-
出处
《计算机科学》
CSCD
北大核心
2002年第10期104-106,共3页
-
基金
863(编号:2001AA411310)
国家自然基金(编号:60072044)
-
文摘
1引言
计算机支持的协同工作(CSCW)是指一组用户在一个共享的工作环境中协作地完成一个任务.CSCW系统允许多个用户对共同的对象(如协同文件、协作绘图系统中的像素等)同时进行操作,并且为多个用户协同工作完成一个共同的任务提供了计算机技术支持,尤其是为协作用户提供了虚拟的共享工作空间,使得地理上分布的用户进行协同工作成为可能.
-
关键词
CSCW
应用程序
计算机
线性模型
树模型
文件对象模型
异构环境
-
Keywords
CSCW, XML, Awareness,Database
-
分类号
TP317
[自动化与计算机技术—计算机软件与理论]
-
-
题名文件系统增量备份策略的形式化描述及实现
被引量:2
- 5
-
-
作者
肖克辉
倪德明
-
机构
华南农业大学信息学院
中山大学计算机软件研究所
-
出处
《计算机工程与设计》
CSCD
北大核心
2007年第10期2455-2457,共3页
-
文摘
文件系统备份和恢复过程中,需根据当前备份资源树和历史备份资源树进行合并等操作,这种操作在物理上表现为对目录树和资源树的处理。特别是增量备份时,它指明备份资源。恢复过程中,用户可以利用该策略根据时间点进行完全恢复和部分恢复。给出一种对备份资源树的解析算法,并进行分析,在算法的基础上对备份资源树进行了形式化描述。
-
关键词
文件系统
增量备份
备份资源树
目录树
文档对象模型
-
Keywords
file system
incremental backup
backup resource tree
catalog tree
document object model (dom)
-
分类号
TP309.3
[自动化与计算机技术—计算机系统结构]
-
-
题名基于Java/Swing的通用文件管理器设计模式
被引量:2
- 6
-
-
作者
綦宏伟
代亚非
李晓明
-
机构
北京大学计算机系
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第8期108-111,共4页
-
基金
国家863高科技发展计划资助项目(编号:2001AA111013)
-
文摘
文件管理器的设计必须考虑众多因素及其相互之间的关联,因此如何选择有效的设计模式是非常重要的。在燕星文件存储系统中,基于Java/Swing技术设计并实现了客户端文件管理器,它由三种设计模式组合而成:模型-视图-控制器模式(MVC)、对象树模式和主控者模式。文章分别讨论了这三种设计模式,它们共同构成了一种通用的文件管理器设计模式。
-
关键词
程序设计模式
文件管理器
模型-视图-控制器模式
对象树模式
主控者模式
-
Keywords
Design pattern,File manager,Model-View-Controller pattern,Object tree pattern,Main controller pattern
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种Deep Web查询结果的实体抽取方法
被引量:4
- 7
-
-
作者
赵海霞
李道申
刘勇
赵嘉诚
-
机构
河南科技大学电子信息工程学院
长春理工大学软件学院
-
出处
《计算机工程与应用》
CSCD
2012年第36期160-163,共4页
-
基金
国家自然科学基金(No.70671035)
-
文摘
Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结果页面的数据抽取工作。大量实验结果表明:该方法是可行的,并且能够提高Deep Web数据实体抽取的准确性和召回率。
-
关键词
深度网
数据抽取
文件对象模型(dom)树
索引
相似度
-
Keywords
Deep Web
data extraction
Document Object Model(dom) tree
index
similarity
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于结构相似网页聚类的正文提取算法研究
被引量:2
- 8
-
-
作者
王海涌
冯兆旭
杨海波
张津栋
-
机构
兰州交通大学电子与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2018年第11期122-127,139,共7页
-
基金
甘肃省自然科学基金(No.145RJZA086)
兰州交通大学科技支撑基金(No.ZC2014003)
兰州市科技计划项目(No.2013-3-79)
-
文摘
针对当前互联网网页越来越多样化、复杂化的特点,提出一种基于结构相似网页聚类的网页正文提取算法,首先,根据组成网页前端模板各"块"对模板的贡献赋以不同的权重,其次计算两个网页中对应块的相似度,将各块的相似度与权重乘积的总和作为两个网页的相似度。该算法充分考虑结构差别较大的网页对网页正文提取的影响,通过计算网页间相似度将网页聚类,使得同一簇中的网页正文提取结果更加准确。实验结果表明,该方法具有更高的准确率,各项评价指标均有所提高。
-
关键词
正文提取
相似性
文档对象模型(dom)树
层次聚类
-
Keywords
information extraction
similarity
Document Object Model(dom) tree
hierarchical clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名支持局部更新的双向内容适配策略
- 9
-
-
作者
吕红亮
王劲林
邓峰
-
机构
中国科学院研究生院
中国科学院声学研究所国家网络新媒体工程技术研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第33期6-8,共3页
-
基金
国家高技术研究发展计划(863)No.2009AA01A338~~
-
文摘
内容适配旨在解决融合环境下多种终端兼容问题,现有的内容适配策略在用户通过受限终端进行更新时会造成信息丢失。提出一种支持局部更新的双向内容适配策略,该策略基于DOM树建立统一的存储模型对元数据和适配实例进行存储,当受限终端发起更新时,通过比较DOM树中的节点对元数据进行局部更新。实验结果表明,相比现有策略,支持局部更新的内容适配策略在大部分情况下可以减少60%以上的信息丢失。
-
关键词
融合环境
双向内容适配
局部更新
元数据
文档对象模型(dom)树
-
Keywords
convergence environment
two-way content adaptation
partial update
metadata
Document Object Model(dom) tree
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-