期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
22
篇文章
<
1
2
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于DOM模型扩展的Web信息提取
被引量:
21
1
作者
顾韵华
田伟
《计算机科学》
CSCD
北大核心
2009年第11期235-237,289,共4页
提出了一种基于DOM模型扩展的Web信息提取方法。将Web页面表示为DOM树结构,对DOM树结点进行语义扩展并计算其影响度因子,依据结点的影响度因子进行剪枝,进而提取Web页面信息内容。该方法不要求对网页的结构有预先认识,具有自动和通用的...
提出了一种基于DOM模型扩展的Web信息提取方法。将Web页面表示为DOM树结构,对DOM树结点进行语义扩展并计算其影响度因子,依据结点的影响度因子进行剪枝,进而提取Web页面信息内容。该方法不要求对网页的结构有预先认识,具有自动和通用的特点。提取结果除可以直接用于Web浏览外,还可用于互联网数据挖掘、基于主题的搜索引擎等应用中。
展开更多
关键词
文档
对象
模型
WEB信息提取
影响度因子
dom
树
扩展
在线阅读
下载PDF
职称材料
利用DOM类库检索XML文档
被引量:
3
2
作者
洪志国
黄晓
《计算机工程与设计》
CSCD
2004年第6期968-970,共3页
文档对象模型(DOM)是一种与平台无关、语言无关的标准接口,是XML文档操作的基础。论述了XML的应用前景和应用现状,提出了用高级语言中封装的DOM类库检索和解析XML文档,以VB6.0为例,来完成XML文档的检索和数据提取等工作。
关键词
dom
类库
XML
文档
检索
文档
对象
模型
在线阅读
下载PDF
职称材料
基于网页DOM树比对的SQL注入漏洞检测
被引量:
5
3
作者
张晨
汪永益
+1 位作者
王雄
施凡
《计算机工程》
CAS
CSCD
2012年第18期111-115,共5页
针对传统SQL注入漏洞检测方法准确率不高的问题,提出一种基于网页文档对象模型(DOM)树比对结果的检测方法。通过简化基于节点序列的网页比对方法,减少节点比对次数,加快检测效率,并设计实现一个SQL注入漏洞检测原型系统。实验结果表明,...
针对传统SQL注入漏洞检测方法准确率不高的问题,提出一种基于网页文档对象模型(DOM)树比对结果的检测方法。通过简化基于节点序列的网页比对方法,减少节点比对次数,加快检测效率,并设计实现一个SQL注入漏洞检测原型系统。实验结果表明,该系统具有较高的SQL注入漏洞检测效率和准确率。
展开更多
关键词
网页比对
SQL注入
注入漏洞检测
文档
对象
模型
树
dom
树
快速比对
在线阅读
下载PDF
职称材料
基于DOM树和视觉特征的网页信息自动抽取
被引量:
6
4
作者
黄武冠
朱明
尹文科
《计算机工程》
CAS
CSCD
2013年第10期309-312,共4页
针对生活信息服务网站的列表式商户信息,提出一种基于文档对象模型(DOM)树和视觉特征的网页信息自动抽取方法。利用商户信息列表页面中数据区域的DOM树结构和视觉特征,搜索得到候选目标数据区域,再利用视觉特征识别真正目标数据区域,从...
针对生活信息服务网站的列表式商户信息,提出一种基于文档对象模型(DOM)树和视觉特征的网页信息自动抽取方法。利用商户信息列表页面中数据区域的DOM树结构和视觉特征,搜索得到候选目标数据区域,再利用视觉特征识别真正目标数据区域,从而抽取其中的数据记录。对10个生活信息服务网站进行测试,结果表明,有8个网站的召回率和准确率达到100%,取得了较好的结果。
展开更多
关键词
文档
对象
模型
树
视觉特征
自动抽取
数据记录
数据区域
挖掘算法
在线阅读
下载PDF
职称材料
利用XML DOM创建强大的XML应用
被引量:
13
5
作者
李京
庄成三
+1 位作者
徐彧
陈华英
《计算机应用研究》
CSCD
北大核心
2002年第2期62-64,共3页
介绍了DOM产生的背景和DOM规范 ,并讨论了利用XMLDOM技术来实现动态地创建文档 ,以及遍历文档结构 ,添加、修改、删除文档内容 ,改变文档的显示方式等方法。
关键词
dom
API
XML
dom
对象
模型
XML语法
树
网页
在线阅读
下载PDF
职称材料
基于DOM的Web信息提取
被引量:
102
6
作者
李效东
顾毓清
《计算机学报》
EI
CSCD
北大核心
2002年第5期526-533,共8页
当前 ,Web已经成为人们获取信息的主要渠道之一 .然而 ,用于表达 Web页面信息的 HTML语言存在着与生俱来的缺点 .HTML 的“标记”只是告诉浏览器软件如何显示所定义的信息 ,却不包含任何语义 .因此由HTML语言所表述的 Web页面经过浏览...
当前 ,Web已经成为人们获取信息的主要渠道之一 .然而 ,用于表达 Web页面信息的 HTML语言存在着与生俱来的缺点 .HTML 的“标记”只是告诉浏览器软件如何显示所定义的信息 ,却不包含任何语义 .因此由HTML语言所表述的 Web页面经过浏览器分析后只适合人们浏览 ,不适合作为一种数据交换的方式由机器处理 .该文以文档对象模型 DOM为基础 ,把所要提取的信息在 DOM层次结构中的路径作为信息抽取的“坐标”,并以这个基本原理为基础设计了一种归纳学习算法来半自动地生成提取规则 ,然后根据提取规则生成 Java类 .生成的 Ja-va类可以作为 Web数据源包装器组成的重要构件 .
展开更多
关键词
dom
Web
信息提取
归纳学习
文档
对象
模型
路径表达式
XML
INTERNET
在线阅读
下载PDF
职称材料
基于HTML树和模板的文献信息提取方法研究
被引量:
7
7
作者
李文立
王乐超
宋春雷
《计算机应用研究》
CSCD
北大核心
2010年第12期4615-4617,共3页
教师科研文献信息的自动搜集是科研成果有效管理的重要手段,将网页信息的提取方法用于网络数据库中文献信息的自动搜集有广大的应用前景。提出基于DOM树和模板的文献信息提取方法,利用HTML标记间的嵌套关系将Web网页表示成一棵DOM树,将...
教师科研文献信息的自动搜集是科研成果有效管理的重要手段,将网页信息的提取方法用于网络数据库中文献信息的自动搜集有广大的应用前景。提出基于DOM树和模板的文献信息提取方法,利用HTML标记间的嵌套关系将Web网页表示成一棵DOM树,将DOM树结构用于网页相似度的度量和自动分类,相似度高的网页应用同一模板进行信息提取。实验结果表明该方法在提取网络数据库中文献信息的准确率在94%以上。
展开更多
关键词
网页信息提取
文档
对象
模型
树
模板
文献信息搜集
在线阅读
下载PDF
职称材料
XML DOM技术应用于网络课件点播的研究
被引量:
1
8
作者
熊江
《计算机工程与设计》
CSCD
北大核心
2007年第2期362-364,共3页
网上教育课件以XML文档的形式存储在服务器端,服务器端采用ASP技术,调用DOM接口,对XML文档进行解析,管理。用户在客户端实时点播,通过浏览器得到所需的课件相关信息,达到学生按需学习和老师按需教学的目的。从学习XML的基本知识入手,通...
网上教育课件以XML文档的形式存储在服务器端,服务器端采用ASP技术,调用DOM接口,对XML文档进行解析,管理。用户在客户端实时点播,通过浏览器得到所需的课件相关信息,达到学生按需学习和老师按需教学的目的。从学习XML的基本知识入手,通过对XML文档显示技术的比较分析,指出CSS和XSL在显示XML文档上存在着一些不足,然后详细研究了XML DOM技术,利用XML DOM技术实现网上教育课件的点播和显示。
展开更多
关键词
网上教育点播
课件
XML解析器
文档
对象
模型
可扩展样式语言
XML
dom
在线阅读
下载PDF
职称材料
基于DOM中间件技术在数字图书馆资源发现中的应用
9
作者
李欣荣
《现代情报》
北大核心
2007年第2期85-86,89,共3页
在网络环境中,有效的资源发现机制对于系统的性能有着重要意义。当前网格资源发现方式大都是集中式的、基于句法进行资源——请求的匹配,功能有限。本文提出了一种基于DOM中间件技术的数字图书馆XML文档资源发现模型。即以w3C的文档对...
在网络环境中,有效的资源发现机制对于系统的性能有着重要意义。当前网格资源发现方式大都是集中式的、基于句法进行资源——请求的匹配,功能有限。本文提出了一种基于DOM中间件技术的数字图书馆XML文档资源发现模型。即以w3C的文档对象模型DOM(Document Object Mode1)为基础,把所要提取的信息在DOM树状层次结构中进行数据关联的资源发现模式。
展开更多
关键词
数字图书馆
dom
文档
对象
模型
XML
资源发现
网格
在线阅读
下载PDF
职称材料
基于DOM状态转换检测XSS漏洞
被引量:
2
10
作者
王丹
刘立家
+2 位作者
林九川
赵文兵
杜晓林
《北京工业大学学报》
CAS
CSCD
北大核心
2018年第9期1208-1216,共9页
为提升跨站脚本(cross site scripting,XSS)漏洞检测中对隐藏注入点的扫描覆盖率,有效判定是否存在XSS漏洞攻击,提出构建Web应用文档对象模型(document object model,DOM)状态转换图搜索XSS漏洞注入点的方法.该方法以DOM状态为节点,以...
为提升跨站脚本(cross site scripting,XSS)漏洞检测中对隐藏注入点的扫描覆盖率,有效判定是否存在XSS漏洞攻击,提出构建Web应用文档对象模型(document object model,DOM)状态转换图搜索XSS漏洞注入点的方法.该方法以DOM状态为节点,以浏览器事件为边对Web应用建模,结合页面分析和代理技术来识别漏洞注入点,提高XSS漏洞注入点判定准确率.首先分析页面中带参数的统一资源定位符(uniform resource locator,URL)和Form表单,并尝试触发页面元素的浏览器事件来检测其是否含有数据请求,以判定Web页面是否有疑似漏洞注入点;进一步利用探子向量进行测试,并根据探子向量的输出位置,对注入点进行分类并保存.之后,基于变异操作和过滤逃逸技术对XSS过滤逃避欺骗备忘单进行转换来设计攻击向量,对已发现的漏洞注入点进行测试,并设计多种方法对不同响应结果进行分析.最后,通过实验对比,验证了其有效性.
展开更多
关键词
跨站脚本(XSS)漏洞
文档
对象
模型
(
dom
)
状态转换图
爬虫
Selenium
在线阅读
下载PDF
职称材料
一种Deep Web查询结果的实体抽取方法
被引量:
4
11
作者
赵海霞
李道申
+1 位作者
刘勇
赵嘉诚
《计算机工程与应用》
CSCD
2012年第36期160-163,共4页
Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结...
Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结果页面的数据抽取工作。大量实验结果表明:该方法是可行的,并且能够提高Deep Web数据实体抽取的准确性和召回率。
展开更多
关键词
深度网
数据抽取
文件
对象
模型
(
dom
)
树
索引
相似度
在线阅读
下载PDF
职称材料
节点频度和语义距离相结合的网页正文信息抽取
被引量:
3
12
作者
孟军
刘秋水
王秀坤
《计算机工程与应用》
CSCD
北大核心
2009年第1期140-143,共4页
提出了一种带有节点频度的扩展DOM树模型—BF-DOM树模型(Block node Frequency-Document Object Module),并基于此模型进行网页正文信息的抽取。该方法通过向DOM树的某些节点上添加频度和相关度属性来构造文中新的模型,再结合语义距离...
提出了一种带有节点频度的扩展DOM树模型—BF-DOM树模型(Block node Frequency-Document Object Module),并基于此模型进行网页正文信息的抽取。该方法通过向DOM树的某些节点上添加频度和相关度属性来构造文中新的模型,再结合语义距离抽取网页正文信息。方法主要基于以下三点考虑:在同源的网页集合内噪音节点的频度值很高;正文信息一般由非链接文字组成;与正文相关的链接和文章标题有较近的语义距离。针对8个网站的实验表明,该方法能有效地抽取正文信息,召回率和准确率都在96%以上,优于基于信息熵的抽取方法。
展开更多
关键词
信息提取
带有节点频度的
文档
对象
模型
树
节点频度
语义距离
在线阅读
下载PDF
职称材料
基于结构相似网页聚类的正文提取算法研究
被引量:
2
13
作者
王海涌
冯兆旭
+1 位作者
杨海波
张津栋
《计算机工程与应用》
CSCD
北大核心
2018年第11期122-127,139,共7页
针对当前互联网网页越来越多样化、复杂化的特点,提出一种基于结构相似网页聚类的网页正文提取算法,首先,根据组成网页前端模板各"块"对模板的贡献赋以不同的权重,其次计算两个网页中对应块的相似度,将各块的相似度与权重乘...
针对当前互联网网页越来越多样化、复杂化的特点,提出一种基于结构相似网页聚类的网页正文提取算法,首先,根据组成网页前端模板各"块"对模板的贡献赋以不同的权重,其次计算两个网页中对应块的相似度,将各块的相似度与权重乘积的总和作为两个网页的相似度。该算法充分考虑结构差别较大的网页对网页正文提取的影响,通过计算网页间相似度将网页聚类,使得同一簇中的网页正文提取结果更加准确。实验结果表明,该方法具有更高的准确率,各项评价指标均有所提高。
展开更多
关键词
正文提取
相似性
文档
对象
模型
(
dom
)
树
层次聚类
在线阅读
下载PDF
职称材料
文件系统增量备份策略的形式化描述及实现
被引量:
2
14
作者
肖克辉
倪德明
《计算机工程与设计》
CSCD
北大核心
2007年第10期2455-2457,共3页
文件系统备份和恢复过程中,需根据当前备份资源树和历史备份资源树进行合并等操作,这种操作在物理上表现为对目录树和资源树的处理。特别是增量备份时,它指明备份资源。恢复过程中,用户可以利用该策略根据时间点进行完全恢复和部分恢复...
文件系统备份和恢复过程中,需根据当前备份资源树和历史备份资源树进行合并等操作,这种操作在物理上表现为对目录树和资源树的处理。特别是增量备份时,它指明备份资源。恢复过程中,用户可以利用该策略根据时间点进行完全恢复和部分恢复。给出一种对备份资源树的解析算法,并进行分析,在算法的基础上对备份资源树进行了形式化描述。
展开更多
关键词
文件系统
增量备份
备份资源
树
目录
树
文档
对象
模型
在线阅读
下载PDF
职称材料
基于WebKit内核的焦点查询策略研究与优化
被引量:
1
15
作者
肖伟民
孙鹏
+1 位作者
郭志川
胡琳琳
《计算机应用与软件》
CSCD
2016年第10期77-81,共5页
为解决智能电视平台上带内联框架的网页存在焦点查询不友好的问题,对基于WebKit内核的嵌入式浏览器焦点查询策略进行研究,详细说明该策略对焦点查询的执行过程,并针对带内联框架的网页存在的焦点查询不友好问题进行查询算法的优化。在...
为解决智能电视平台上带内联框架的网页存在焦点查询不友好的问题,对基于WebKit内核的嵌入式浏览器焦点查询策略进行研究,详细说明该策略对焦点查询的执行过程,并针对带内联框架的网页存在的焦点查询不友好问题进行查询算法的优化。在智能电视平台上根据操控特征进行针对性优化,修正了焦点查询错误,大大提升了用户体验。实验结果表明,使用优化后的焦点查询策略在智能电视上可有效解决基于WebKit内核的嵌入式浏览器焦点查询错误问题。
展开更多
关键词
WebKit内核
内联框架
文档
对象
模型
树
焦点查询
优化
在线阅读
下载PDF
职称材料
基于XML中间件的分布式异构数据库的数据分片策略研究
被引量:
1
16
作者
蒋勇
谭怀亮
李光文
《计算机应用与软件》
CSCD
2009年第11期144-146,共3页
主要研究XML中间件的分布式异构数据库的数据分片策略,以便能够并行处理XML查询。为了描述XML数据分片,提出了对象树、子树的概念,将一棵XML数据树分割成对象树和子树,对象树在各个站点上复制,子树标签化后均匀分片到各个站点上。为了...
主要研究XML中间件的分布式异构数据库的数据分片策略,以便能够并行处理XML查询。为了描述XML数据分片,提出了对象树、子树的概念,将一棵XML数据树分割成对象树和子树,对象树在各个站点上复制,子树标签化后均匀分片到各个站点上。为了实现用户数据分片查询工作量的均衡,对最大树深的子树采用减治法策略,减治法策略后的子树又分配到一个新的站点上。基于这一思想,提出并实现其算法。实验结果证明:在分布式异构数据库的检索、查询和访问中,基于对象树、子树的数据分片算法的性能要比PSPIB算法性能优越。
展开更多
关键词
分布式异构数据库
文档
对象
模型
文档
中间件
数据分片
对象
树
算法
在线阅读
下载PDF
职称材料
一种Web应用跨浏览器兼容性测试方法
被引量:
6
17
作者
韦庆杰
刘淑坤
《计算机工程与应用》
CSCD
北大核心
2019年第5期55-59,共5页
随着Web应用的日益普及,及可执行此类应用程序的浏览器越来越多,版本也在不断更新,Web应用的跨浏览器不兼容(Cross Browser Incompatibilities,XBI)已成为Web应用开发者面临的严重问题。提出一种结合DOM(Document Object Model)结构分...
随着Web应用的日益普及,及可执行此类应用程序的浏览器越来越多,版本也在不断更新,Web应用的跨浏览器不兼容(Cross Browser Incompatibilities,XBI)已成为Web应用开发者面临的严重问题。提出一种结合DOM(Document Object Model)结构分析和页面元素(Screen Element)的计算机视觉分析方法,实现Web应用的跨浏览器兼容性测试XBCT(Cross-Browser Compatibility Testing),和现有的测试方法比较,实验结果表明了所提方法能够提高测试结果的准确性。
展开更多
关键词
跨浏览器兼容性
WEB应用
文档
对象
模型
(
dom
)
测试
在线阅读
下载PDF
职称材料
基于B/S架构的Web网页结构检测应用研究
被引量:
2
18
作者
陈圣俭
孙明涛
《现代电子技术》
2009年第2期135-138,共4页
随着互联网的普及,大型的跨国公司要求公司对内对外的所有网站都遵循统一的框架结构,因此为了判断网页结构是否符合标准,需要对网页结构进行检测。Web结构分析是指从Web文档中自动分析网页结构的过程,检测不符合标准的网页。依据W3C Mar...
随着互联网的普及,大型的跨国公司要求公司对内对外的所有网站都遵循统一的框架结构,因此为了判断网页结构是否符合标准,需要对网页结构进行检测。Web结构分析是指从Web文档中自动分析网页结构的过程,检测不符合标准的网页。依据W3C Markup Validation Service的设计理念,基于DOM结构树和正则表达式的操作,以分析Web网页结构为基础,提出了Web页面结构检测的设计思想。在解析Html和CSS代码的基础上,网页结构检测正确率达到80%以上。
展开更多
关键词
正则表达式
网页结构
树
检测
文档
对象
模型
属性元素
在线阅读
下载PDF
职称材料
支持局部更新的双向内容适配策略
19
作者
吕红亮
王劲林
邓峰
《计算机工程与应用》
CSCD
北大核心
2010年第33期6-8,共3页
内容适配旨在解决融合环境下多种终端兼容问题,现有的内容适配策略在用户通过受限终端进行更新时会造成信息丢失。提出一种支持局部更新的双向内容适配策略,该策略基于DOM树建立统一的存储模型对元数据和适配实例进行存储,当受限终端发...
内容适配旨在解决融合环境下多种终端兼容问题,现有的内容适配策略在用户通过受限终端进行更新时会造成信息丢失。提出一种支持局部更新的双向内容适配策略,该策略基于DOM树建立统一的存储模型对元数据和适配实例进行存储,当受限终端发起更新时,通过比较DOM树中的节点对元数据进行局部更新。实验结果表明,相比现有策略,支持局部更新的内容适配策略在大部分情况下可以减少60%以上的信息丢失。
展开更多
关键词
融合环境
双向内容适配
局部更新
元数据
文档
对象
模型
(
dom
)
树
在线阅读
下载PDF
职称材料
基于Webkit内核焦点查询算法的研究与优化
20
作者
刘秀秀
潘梁
+1 位作者
郭志川
胡琳琳
《计算机工程与设计》
北大核心
2016年第2期450-453,486,共5页
为解决智能电视用户操控网页时存在焦点移动不友好的问题,研究基于Webkit内核的嵌入式浏览器的焦点查询算法。对该算法查询焦点的执行过程进行详细说明,针对不同位置的节点间的距离计算方法进行特别描述,在智能电视上根据电视特征对该...
为解决智能电视用户操控网页时存在焦点移动不友好的问题,研究基于Webkit内核的嵌入式浏览器的焦点查询算法。对该算法查询焦点的执行过程进行详细说明,针对不同位置的节点间的距离计算方法进行特别描述,在智能电视上根据电视特征对该算法进行优化。通过设置焦点移动的步长和改变DOM节点间距离计算等方法,提升用户体验。实验结果表明,在智能电视上使用优化后的方法可更快选择合适的目标节点,改善了人机交互体验。
展开更多
关键词
Webkit内核
文档
对象
模型
树
渲染
树
焦点查询算法
优化
在线阅读
下载PDF
职称材料
题名
基于DOM模型扩展的Web信息提取
被引量:
21
1
作者
顾韵华
田伟
机构
南京信息工程大学计算机与软件学院
出处
《计算机科学》
CSCD
北大核心
2009年第11期235-237,289,共4页
基金
江苏省产业技术研究与开发基金项目(苏发改高技发[2006]1106号)资助
文摘
提出了一种基于DOM模型扩展的Web信息提取方法。将Web页面表示为DOM树结构,对DOM树结点进行语义扩展并计算其影响度因子,依据结点的影响度因子进行剪枝,进而提取Web页面信息内容。该方法不要求对网页的结构有预先认识,具有自动和通用的特点。提取结果除可以直接用于Web浏览外,还可用于互联网数据挖掘、基于主题的搜索引擎等应用中。
关键词
文档
对象
模型
WEB信息提取
影响度因子
dom
树
扩展
Keywords
dom
, Extraction of information from Web pages, Influence degree, Extended
dom
tree
分类号
TP309.2 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
利用DOM类库检索XML文档
被引量:
3
2
作者
洪志国
黄晓
机构
武汉大学计算机学院
出处
《计算机工程与设计》
CSCD
2004年第6期968-970,共3页
文摘
文档对象模型(DOM)是一种与平台无关、语言无关的标准接口,是XML文档操作的基础。论述了XML的应用前景和应用现状,提出了用高级语言中封装的DOM类库检索和解析XML文档,以VB6.0为例,来完成XML文档的检索和数据提取等工作。
关键词
dom
类库
XML
文档
检索
文档
对象
模型
Keywords
dom
retrieve
XML
分类号
TP311.12 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于网页DOM树比对的SQL注入漏洞检测
被引量:
5
3
作者
张晨
汪永益
王雄
施凡
机构
电子工程学院网络工程系
出处
《计算机工程》
CAS
CSCD
2012年第18期111-115,共5页
文摘
针对传统SQL注入漏洞检测方法准确率不高的问题,提出一种基于网页文档对象模型(DOM)树比对结果的检测方法。通过简化基于节点序列的网页比对方法,减少节点比对次数,加快检测效率,并设计实现一个SQL注入漏洞检测原型系统。实验结果表明,该系统具有较高的SQL注入漏洞检测效率和准确率。
关键词
网页比对
SQL注入
注入漏洞检测
文档
对象
模型
树
dom
树
快速比对
Keywords
Webpage comparison; SQL injection; injection vulnerability detection; Document Object Model(
dom
) tree; fast
dom
tree comparison
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于DOM树和视觉特征的网页信息自动抽取
被引量:
6
4
作者
黄武冠
朱明
尹文科
机构
中国科学技术大学自动化系
出处
《计算机工程》
CAS
CSCD
2013年第10期309-312,共4页
基金
国家科技支撑计划基金资助项目(2011BAH11B01)
中国科学院重点部署基金资助项目(KGZD-EW-103-(5))
文摘
针对生活信息服务网站的列表式商户信息,提出一种基于文档对象模型(DOM)树和视觉特征的网页信息自动抽取方法。利用商户信息列表页面中数据区域的DOM树结构和视觉特征,搜索得到候选目标数据区域,再利用视觉特征识别真正目标数据区域,从而抽取其中的数据记录。对10个生活信息服务网站进行测试,结果表明,有8个网站的召回率和准确率达到100%,取得了较好的结果。
关键词
文档
对象
模型
树
视觉特征
自动抽取
数据记录
数据区域
挖掘算法
Keywords
Document Object Model(
dom
) tree
visual feature
automatic extraction
data recording
data region
mining algorithm
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
利用XML DOM创建强大的XML应用
被引量:
13
5
作者
李京
庄成三
徐彧
陈华英
机构
青岛大学计算机学院
四川大学计算机学院
电子科技大学电子工程系
出处
《计算机应用研究》
CSCD
北大核心
2002年第2期62-64,共3页
文摘
介绍了DOM产生的背景和DOM规范 ,并讨论了利用XMLDOM技术来实现动态地创建文档 ,以及遍历文档结构 ,添加、修改、删除文档内容 ,改变文档的显示方式等方法。
关键词
dom
API
XML
dom
对象
模型
XML语法
树
网页
Keywords
dom
API
XML
dom
XML Syntax
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于DOM的Web信息提取
被引量:
102
6
作者
李效东
顾毓清
机构
中国科学院软件研究所
出处
《计算机学报》
EI
CSCD
北大核心
2002年第5期526-533,共8页
文摘
当前 ,Web已经成为人们获取信息的主要渠道之一 .然而 ,用于表达 Web页面信息的 HTML语言存在着与生俱来的缺点 .HTML 的“标记”只是告诉浏览器软件如何显示所定义的信息 ,却不包含任何语义 .因此由HTML语言所表述的 Web页面经过浏览器分析后只适合人们浏览 ,不适合作为一种数据交换的方式由机器处理 .该文以文档对象模型 DOM为基础 ,把所要提取的信息在 DOM层次结构中的路径作为信息抽取的“坐标”,并以这个基本原理为基础设计了一种归纳学习算法来半自动地生成提取规则 ,然后根据提取规则生成 Java类 .生成的 Ja-va类可以作为 Web数据源包装器组成的重要构件 .
关键词
dom
Web
信息提取
归纳学习
文档
对象
模型
路径表达式
XML
INTERNET
Keywords
inductive learning, document object model, path expression, XML
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于HTML树和模板的文献信息提取方法研究
被引量:
7
7
作者
李文立
王乐超
宋春雷
机构
大连理工大学管理学院系统工程研究所
出处
《计算机应用研究》
CSCD
北大核心
2010年第12期4615-4617,共3页
基金
国家自然科学基金资助项目(70572099)
辽宁省自然科学基金资助项目(1050349)
文摘
教师科研文献信息的自动搜集是科研成果有效管理的重要手段,将网页信息的提取方法用于网络数据库中文献信息的自动搜集有广大的应用前景。提出基于DOM树和模板的文献信息提取方法,利用HTML标记间的嵌套关系将Web网页表示成一棵DOM树,将DOM树结构用于网页相似度的度量和自动分类,相似度高的网页应用同一模板进行信息提取。实验结果表明该方法在提取网络数据库中文献信息的准确率在94%以上。
关键词
网页信息提取
文档
对象
模型
树
模板
文献信息搜集
Keywords
Web information extraction
dom
tree
template
document information extraction
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
XML DOM技术应用于网络课件点播的研究
被引量:
1
8
作者
熊江
机构
重庆三峡学院计算机科学系
出处
《计算机工程与设计》
CSCD
北大核心
2007年第2期362-364,共3页
基金
重庆市教委科研基金项目(KJ061107)
重庆三峡学院校级科研基金项目(2005-sxxyyb-002)
文摘
网上教育课件以XML文档的形式存储在服务器端,服务器端采用ASP技术,调用DOM接口,对XML文档进行解析,管理。用户在客户端实时点播,通过浏览器得到所需的课件相关信息,达到学生按需学习和老师按需教学的目的。从学习XML的基本知识入手,通过对XML文档显示技术的比较分析,指出CSS和XSL在显示XML文档上存在着一些不足,然后详细研究了XML DOM技术,利用XML DOM技术实现网上教育课件的点播和显示。
关键词
网上教育点播
课件
XML解析器
文档
对象
模型
可扩展样式语言
XML
dom
Keywords
education on demand
courseware
XML parser
document object model
extensible markup language
XML document object model
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于DOM中间件技术在数字图书馆资源发现中的应用
9
作者
李欣荣
机构
西华大学
出处
《现代情报》
北大核心
2007年第2期85-86,89,共3页
文摘
在网络环境中,有效的资源发现机制对于系统的性能有着重要意义。当前网格资源发现方式大都是集中式的、基于句法进行资源——请求的匹配,功能有限。本文提出了一种基于DOM中间件技术的数字图书馆XML文档资源发现模型。即以w3C的文档对象模型DOM(Document Object Mode1)为基础,把所要提取的信息在DOM树状层次结构中进行数据关联的资源发现模式。
关键词
数字图书馆
dom
文档
对象
模型
XML
资源发现
网格
Keywords
digital library
document object model
resource exploration
grid
分类号
G250.76 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
基于DOM状态转换检测XSS漏洞
被引量:
2
10
作者
王丹
刘立家
林九川
赵文兵
杜晓林
机构
北京工业大学信息学部
公安部第三研究所信息网络安全公安部重点实验室
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2018年第9期1208-1216,共9页
基金
北京市自然科学基金资助项目(4173072)
信息网络安全公安部重点实验室开放课题资助项目(C17613)
文摘
为提升跨站脚本(cross site scripting,XSS)漏洞检测中对隐藏注入点的扫描覆盖率,有效判定是否存在XSS漏洞攻击,提出构建Web应用文档对象模型(document object model,DOM)状态转换图搜索XSS漏洞注入点的方法.该方法以DOM状态为节点,以浏览器事件为边对Web应用建模,结合页面分析和代理技术来识别漏洞注入点,提高XSS漏洞注入点判定准确率.首先分析页面中带参数的统一资源定位符(uniform resource locator,URL)和Form表单,并尝试触发页面元素的浏览器事件来检测其是否含有数据请求,以判定Web页面是否有疑似漏洞注入点;进一步利用探子向量进行测试,并根据探子向量的输出位置,对注入点进行分类并保存.之后,基于变异操作和过滤逃逸技术对XSS过滤逃避欺骗备忘单进行转换来设计攻击向量,对已发现的漏洞注入点进行测试,并设计多种方法对不同响应结果进行分析.最后,通过实验对比,验证了其有效性.
关键词
跨站脚本(XSS)漏洞
文档
对象
模型
(
dom
)
状态转换图
爬虫
Selenium
Keywords
cross site scriping(XSS)
document object model(
dom
)
state transition diagram
crawler
Selenium
分类号
TP308 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
一种Deep Web查询结果的实体抽取方法
被引量:
4
11
作者
赵海霞
李道申
刘勇
赵嘉诚
机构
河南科技大学电子信息工程学院
长春理工大学软件学院
出处
《计算机工程与应用》
CSCD
2012年第36期160-163,共4页
基金
国家自然科学基金(No.70671035)
文摘
Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结果页面的数据抽取工作。大量实验结果表明:该方法是可行的,并且能够提高Deep Web数据实体抽取的准确性和召回率。
关键词
深度网
数据抽取
文件
对象
模型
(
dom
)
树
索引
相似度
Keywords
Deep Web
data extraction
Document Object Model(
dom
) tree
index
similarity
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
节点频度和语义距离相结合的网页正文信息抽取
被引量:
3
12
作者
孟军
刘秋水
王秀坤
机构
大连理工大学计算机科学与工程系
出处
《计算机工程与应用》
CSCD
北大核心
2009年第1期140-143,共4页
基金
国家自然科学基金~~
文摘
提出了一种带有节点频度的扩展DOM树模型—BF-DOM树模型(Block node Frequency-Document Object Module),并基于此模型进行网页正文信息的抽取。该方法通过向DOM树的某些节点上添加频度和相关度属性来构造文中新的模型,再结合语义距离抽取网页正文信息。方法主要基于以下三点考虑:在同源的网页集合内噪音节点的频度值很高;正文信息一般由非链接文字组成;与正文相关的链接和文章标题有较近的语义距离。针对8个网站的实验表明,该方法能有效地抽取正文信息,召回率和准确率都在96%以上,优于基于信息熵的抽取方法。
关键词
信息提取
带有节点频度的
文档
对象
模型
树
节点频度
语义距离
Keywords
information extraction
Block node Frequency-Document Object Module(BF-
dom
) tree
node frequency
semantic distance
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于结构相似网页聚类的正文提取算法研究
被引量:
2
13
作者
王海涌
冯兆旭
杨海波
张津栋
机构
兰州交通大学电子与信息工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2018年第11期122-127,139,共7页
基金
甘肃省自然科学基金(No.145RJZA086)
兰州交通大学科技支撑基金(No.ZC2014003)
兰州市科技计划项目(No.2013-3-79)
文摘
针对当前互联网网页越来越多样化、复杂化的特点,提出一种基于结构相似网页聚类的网页正文提取算法,首先,根据组成网页前端模板各"块"对模板的贡献赋以不同的权重,其次计算两个网页中对应块的相似度,将各块的相似度与权重乘积的总和作为两个网页的相似度。该算法充分考虑结构差别较大的网页对网页正文提取的影响,通过计算网页间相似度将网页聚类,使得同一簇中的网页正文提取结果更加准确。实验结果表明,该方法具有更高的准确率,各项评价指标均有所提高。
关键词
正文提取
相似性
文档
对象
模型
(
dom
)
树
层次聚类
Keywords
information extraction
similarity
Document Object Model(
dom
) tree
hierarchical clustering
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
文件系统增量备份策略的形式化描述及实现
被引量:
2
14
作者
肖克辉
倪德明
机构
华南农业大学信息学院
中山大学计算机软件研究所
出处
《计算机工程与设计》
CSCD
北大核心
2007年第10期2455-2457,共3页
文摘
文件系统备份和恢复过程中,需根据当前备份资源树和历史备份资源树进行合并等操作,这种操作在物理上表现为对目录树和资源树的处理。特别是增量备份时,它指明备份资源。恢复过程中,用户可以利用该策略根据时间点进行完全恢复和部分恢复。给出一种对备份资源树的解析算法,并进行分析,在算法的基础上对备份资源树进行了形式化描述。
关键词
文件系统
增量备份
备份资源
树
目录
树
文档
对象
模型
Keywords
file system
incremental backup
backup resource tree
catalog tree
document object model (
dom
)
分类号
TP309.3 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于WebKit内核的焦点查询策略研究与优化
被引量:
1
15
作者
肖伟民
孙鹏
郭志川
胡琳琳
机构
中国科学院声学研究所国家网络新媒体工程技术研究中心
中国科学院大学
出处
《计算机应用与软件》
CSCD
2016年第10期77-81,共5页
基金
国家高技术研究发展计划项目(2015AA015802)
文摘
为解决智能电视平台上带内联框架的网页存在焦点查询不友好的问题,对基于WebKit内核的嵌入式浏览器焦点查询策略进行研究,详细说明该策略对焦点查询的执行过程,并针对带内联框架的网页存在的焦点查询不友好问题进行查询算法的优化。在智能电视平台上根据操控特征进行针对性优化,修正了焦点查询错误,大大提升了用户体验。实验结果表明,使用优化后的焦点查询策略在智能电视上可有效解决基于WebKit内核的嵌入式浏览器焦点查询错误问题。
关键词
WebKit内核
内联框架
文档
对象
模型
树
焦点查询
优化
Keywords
WebKit kernel iframe;
dom
tree;Focus query ;Optimisation
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
基于XML中间件的分布式异构数据库的数据分片策略研究
被引量:
1
16
作者
蒋勇
谭怀亮
李光文
机构
湖南化工职业技术学院信息系
湖南大学计算机与通信学院
出处
《计算机应用与软件》
CSCD
2009年第11期144-146,共3页
文摘
主要研究XML中间件的分布式异构数据库的数据分片策略,以便能够并行处理XML查询。为了描述XML数据分片,提出了对象树、子树的概念,将一棵XML数据树分割成对象树和子树,对象树在各个站点上复制,子树标签化后均匀分片到各个站点上。为了实现用户数据分片查询工作量的均衡,对最大树深的子树采用减治法策略,减治法策略后的子树又分配到一个新的站点上。基于这一思想,提出并实现其算法。实验结果证明:在分布式异构数据库的检索、查询和访问中,基于对象树、子树的数据分片算法的性能要比PSPIB算法性能优越。
关键词
分布式异构数据库
文档
对象
模型
文档
中间件
数据分片
对象
树
算法
Keywords
Distributed heterogeneous database
dom
document Middleware Data partitioning Object tree Algorithm
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
一种Web应用跨浏览器兼容性测试方法
被引量:
6
17
作者
韦庆杰
刘淑坤
机构
重庆邮电大学计算机科学与技术学院
重庆邮电大学软件工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2019年第5期55-59,共5页
文摘
随着Web应用的日益普及,及可执行此类应用程序的浏览器越来越多,版本也在不断更新,Web应用的跨浏览器不兼容(Cross Browser Incompatibilities,XBI)已成为Web应用开发者面临的严重问题。提出一种结合DOM(Document Object Model)结构分析和页面元素(Screen Element)的计算机视觉分析方法,实现Web应用的跨浏览器兼容性测试XBCT(Cross-Browser Compatibility Testing),和现有的测试方法比较,实验结果表明了所提方法能够提高测试结果的准确性。
关键词
跨浏览器兼容性
WEB应用
文档
对象
模型
(
dom
)
测试
Keywords
cross-browser compatibilities
Web application
Document Object Mode(
dom
)
testing
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于B/S架构的Web网页结构检测应用研究
被引量:
2
18
作者
陈圣俭
孙明涛
机构
华北电力大学计算机科学与技术学院
出处
《现代电子技术》
2009年第2期135-138,共4页
文摘
随着互联网的普及,大型的跨国公司要求公司对内对外的所有网站都遵循统一的框架结构,因此为了判断网页结构是否符合标准,需要对网页结构进行检测。Web结构分析是指从Web文档中自动分析网页结构的过程,检测不符合标准的网页。依据W3C Markup Validation Service的设计理念,基于DOM结构树和正则表达式的操作,以分析Web网页结构为基础,提出了Web页面结构检测的设计思想。在解析Html和CSS代码的基础上,网页结构检测正确率达到80%以上。
关键词
正则表达式
网页结构
树
检测
文档
对象
模型
属性元素
Keywords
regular expression
web page structure tree
inspection
document object model
attribute element
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
支持局部更新的双向内容适配策略
19
作者
吕红亮
王劲林
邓峰
机构
中国科学院研究生院
中国科学院声学研究所国家网络新媒体工程技术研究中心
出处
《计算机工程与应用》
CSCD
北大核心
2010年第33期6-8,共3页
基金
国家高技术研究发展计划(863)No.2009AA01A338~~
文摘
内容适配旨在解决融合环境下多种终端兼容问题,现有的内容适配策略在用户通过受限终端进行更新时会造成信息丢失。提出一种支持局部更新的双向内容适配策略,该策略基于DOM树建立统一的存储模型对元数据和适配实例进行存储,当受限终端发起更新时,通过比较DOM树中的节点对元数据进行局部更新。实验结果表明,相比现有策略,支持局部更新的内容适配策略在大部分情况下可以减少60%以上的信息丢失。
关键词
融合环境
双向内容适配
局部更新
元数据
文档
对象
模型
(
dom
)
树
Keywords
convergence environment
two-way content adaptation
partial update
metadata
Document Object Model(
dom
) tree
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于Webkit内核焦点查询算法的研究与优化
20
作者
刘秀秀
潘梁
郭志川
胡琳琳
机构
中国科学院大学
中国科学院声学研究所国家网络新媒体工程技术研究中心
出处
《计算机工程与设计》
北大核心
2016年第2期450-453,486,共5页
基金
中国科学院战略性先导科技专项基金项目(XDA06040501)
文摘
为解决智能电视用户操控网页时存在焦点移动不友好的问题,研究基于Webkit内核的嵌入式浏览器的焦点查询算法。对该算法查询焦点的执行过程进行详细说明,针对不同位置的节点间的距离计算方法进行特别描述,在智能电视上根据电视特征对该算法进行优化。通过设置焦点移动的步长和改变DOM节点间距离计算等方法,提升用户体验。实验结果表明,在智能电视上使用优化后的方法可更快选择合适的目标节点,改善了人机交互体验。
关键词
Webkit内核
文档
对象
模型
树
渲染
树
焦点查询算法
优化
Keywords
Webkit
dom
tree
render tree
focus query algorithm
optimization
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于DOM模型扩展的Web信息提取
顾韵华
田伟
《计算机科学》
CSCD
北大核心
2009
21
在线阅读
下载PDF
职称材料
2
利用DOM类库检索XML文档
洪志国
黄晓
《计算机工程与设计》
CSCD
2004
3
在线阅读
下载PDF
职称材料
3
基于网页DOM树比对的SQL注入漏洞检测
张晨
汪永益
王雄
施凡
《计算机工程》
CAS
CSCD
2012
5
在线阅读
下载PDF
职称材料
4
基于DOM树和视觉特征的网页信息自动抽取
黄武冠
朱明
尹文科
《计算机工程》
CAS
CSCD
2013
6
在线阅读
下载PDF
职称材料
5
利用XML DOM创建强大的XML应用
李京
庄成三
徐彧
陈华英
《计算机应用研究》
CSCD
北大核心
2002
13
在线阅读
下载PDF
职称材料
6
基于DOM的Web信息提取
李效东
顾毓清
《计算机学报》
EI
CSCD
北大核心
2002
102
在线阅读
下载PDF
职称材料
7
基于HTML树和模板的文献信息提取方法研究
李文立
王乐超
宋春雷
《计算机应用研究》
CSCD
北大核心
2010
7
在线阅读
下载PDF
职称材料
8
XML DOM技术应用于网络课件点播的研究
熊江
《计算机工程与设计》
CSCD
北大核心
2007
1
在线阅读
下载PDF
职称材料
9
基于DOM中间件技术在数字图书馆资源发现中的应用
李欣荣
《现代情报》
北大核心
2007
0
在线阅读
下载PDF
职称材料
10
基于DOM状态转换检测XSS漏洞
王丹
刘立家
林九川
赵文兵
杜晓林
《北京工业大学学报》
CAS
CSCD
北大核心
2018
2
在线阅读
下载PDF
职称材料
11
一种Deep Web查询结果的实体抽取方法
赵海霞
李道申
刘勇
赵嘉诚
《计算机工程与应用》
CSCD
2012
4
在线阅读
下载PDF
职称材料
12
节点频度和语义距离相结合的网页正文信息抽取
孟军
刘秋水
王秀坤
《计算机工程与应用》
CSCD
北大核心
2009
3
在线阅读
下载PDF
职称材料
13
基于结构相似网页聚类的正文提取算法研究
王海涌
冯兆旭
杨海波
张津栋
《计算机工程与应用》
CSCD
北大核心
2018
2
在线阅读
下载PDF
职称材料
14
文件系统增量备份策略的形式化描述及实现
肖克辉
倪德明
《计算机工程与设计》
CSCD
北大核心
2007
2
在线阅读
下载PDF
职称材料
15
基于WebKit内核的焦点查询策略研究与优化
肖伟民
孙鹏
郭志川
胡琳琳
《计算机应用与软件》
CSCD
2016
1
在线阅读
下载PDF
职称材料
16
基于XML中间件的分布式异构数据库的数据分片策略研究
蒋勇
谭怀亮
李光文
《计算机应用与软件》
CSCD
2009
1
在线阅读
下载PDF
职称材料
17
一种Web应用跨浏览器兼容性测试方法
韦庆杰
刘淑坤
《计算机工程与应用》
CSCD
北大核心
2019
6
在线阅读
下载PDF
职称材料
18
基于B/S架构的Web网页结构检测应用研究
陈圣俭
孙明涛
《现代电子技术》
2009
2
在线阅读
下载PDF
职称材料
19
支持局部更新的双向内容适配策略
吕红亮
王劲林
邓峰
《计算机工程与应用》
CSCD
北大核心
2010
0
在线阅读
下载PDF
职称材料
20
基于Webkit内核焦点查询算法的研究与优化
刘秀秀
潘梁
郭志川
胡琳琳
《计算机工程与设计》
北大核心
2016
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部