期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于DOM模型扩展的Web信息提取 被引量:21
1
作者 顾韵华 田伟 《计算机科学》 CSCD 北大核心 2009年第11期235-237,289,共4页
提出了一种基于DOM模型扩展的Web信息提取方法。将Web页面表示为DOM树结构,对DOM树结点进行语义扩展并计算其影响度因子,依据结点的影响度因子进行剪枝,进而提取Web页面信息内容。该方法不要求对网页的结构有预先认识,具有自动和通用的... 提出了一种基于DOM模型扩展的Web信息提取方法。将Web页面表示为DOM树结构,对DOM树结点进行语义扩展并计算其影响度因子,依据结点的影响度因子进行剪枝,进而提取Web页面信息内容。该方法不要求对网页的结构有预先认识,具有自动和通用的特点。提取结果除可以直接用于Web浏览外,还可用于互联网数据挖掘、基于主题的搜索引擎等应用中。 展开更多
关键词 文档对象模型 WEB信息提取 影响度因子 dom扩展
在线阅读 下载PDF
利用DOM类库检索XML文档 被引量:3
2
作者 洪志国 黄晓 《计算机工程与设计》 CSCD 2004年第6期968-970,共3页
文档对象模型(DOM)是一种与平台无关、语言无关的标准接口,是XML文档操作的基础。论述了XML的应用前景和应用现状,提出了用高级语言中封装的DOM类库检索和解析XML文档,以VB6.0为例,来完成XML文档的检索和数据提取等工作。
关键词 dom类库 XML文档 检索 文档对象模型
在线阅读 下载PDF
基于网页DOM树比对的SQL注入漏洞检测 被引量:5
3
作者 张晨 汪永益 +1 位作者 王雄 施凡 《计算机工程》 CAS CSCD 2012年第18期111-115,共5页
针对传统SQL注入漏洞检测方法准确率不高的问题,提出一种基于网页文档对象模型(DOM)树比对结果的检测方法。通过简化基于节点序列的网页比对方法,减少节点比对次数,加快检测效率,并设计实现一个SQL注入漏洞检测原型系统。实验结果表明,... 针对传统SQL注入漏洞检测方法准确率不高的问题,提出一种基于网页文档对象模型(DOM)树比对结果的检测方法。通过简化基于节点序列的网页比对方法,减少节点比对次数,加快检测效率,并设计实现一个SQL注入漏洞检测原型系统。实验结果表明,该系统具有较高的SQL注入漏洞检测效率和准确率。 展开更多
关键词 网页比对 SQL注入 注入漏洞检测 文档对象模型 dom快速比对
在线阅读 下载PDF
基于DOM树和视觉特征的网页信息自动抽取 被引量:6
4
作者 黄武冠 朱明 尹文科 《计算机工程》 CAS CSCD 2013年第10期309-312,共4页
针对生活信息服务网站的列表式商户信息,提出一种基于文档对象模型(DOM)树和视觉特征的网页信息自动抽取方法。利用商户信息列表页面中数据区域的DOM树结构和视觉特征,搜索得到候选目标数据区域,再利用视觉特征识别真正目标数据区域,从... 针对生活信息服务网站的列表式商户信息,提出一种基于文档对象模型(DOM)树和视觉特征的网页信息自动抽取方法。利用商户信息列表页面中数据区域的DOM树结构和视觉特征,搜索得到候选目标数据区域,再利用视觉特征识别真正目标数据区域,从而抽取其中的数据记录。对10个生活信息服务网站进行测试,结果表明,有8个网站的召回率和准确率达到100%,取得了较好的结果。 展开更多
关键词 文档对象模型 视觉特征 自动抽取 数据记录 数据区域 挖掘算法
在线阅读 下载PDF
利用XML DOM创建强大的XML应用 被引量:13
5
作者 李京 庄成三 +1 位作者 徐彧 陈华英 《计算机应用研究》 CSCD 北大核心 2002年第2期62-64,共3页
介绍了DOM产生的背景和DOM规范 ,并讨论了利用XMLDOM技术来实现动态地创建文档 ,以及遍历文档结构 ,添加、修改、删除文档内容 ,改变文档的显示方式等方法。
关键词 dom API XML dom对象模型 XML语法 网页
在线阅读 下载PDF
基于DOM的Web信息提取 被引量:102
6
作者 李效东 顾毓清 《计算机学报》 EI CSCD 北大核心 2002年第5期526-533,共8页
当前 ,Web已经成为人们获取信息的主要渠道之一 .然而 ,用于表达 Web页面信息的 HTML语言存在着与生俱来的缺点 .HTML 的“标记”只是告诉浏览器软件如何显示所定义的信息 ,却不包含任何语义 .因此由HTML语言所表述的 Web页面经过浏览... 当前 ,Web已经成为人们获取信息的主要渠道之一 .然而 ,用于表达 Web页面信息的 HTML语言存在着与生俱来的缺点 .HTML 的“标记”只是告诉浏览器软件如何显示所定义的信息 ,却不包含任何语义 .因此由HTML语言所表述的 Web页面经过浏览器分析后只适合人们浏览 ,不适合作为一种数据交换的方式由机器处理 .该文以文档对象模型 DOM为基础 ,把所要提取的信息在 DOM层次结构中的路径作为信息抽取的“坐标”,并以这个基本原理为基础设计了一种归纳学习算法来半自动地生成提取规则 ,然后根据提取规则生成 Java类 .生成的 Ja-va类可以作为 Web数据源包装器组成的重要构件 . 展开更多
关键词 dom Web 信息提取 归纳学习 文档对象模型 路径表达式 XML INTERNET
在线阅读 下载PDF
基于HTML树和模板的文献信息提取方法研究 被引量:7
7
作者 李文立 王乐超 宋春雷 《计算机应用研究》 CSCD 北大核心 2010年第12期4615-4617,共3页
教师科研文献信息的自动搜集是科研成果有效管理的重要手段,将网页信息的提取方法用于网络数据库中文献信息的自动搜集有广大的应用前景。提出基于DOM树和模板的文献信息提取方法,利用HTML标记间的嵌套关系将Web网页表示成一棵DOM树,将... 教师科研文献信息的自动搜集是科研成果有效管理的重要手段,将网页信息的提取方法用于网络数据库中文献信息的自动搜集有广大的应用前景。提出基于DOM树和模板的文献信息提取方法,利用HTML标记间的嵌套关系将Web网页表示成一棵DOM树,将DOM树结构用于网页相似度的度量和自动分类,相似度高的网页应用同一模板进行信息提取。实验结果表明该方法在提取网络数据库中文献信息的准确率在94%以上。 展开更多
关键词 网页信息提取 文档对象模型 模板 文献信息搜集
在线阅读 下载PDF
XML DOM技术应用于网络课件点播的研究 被引量:1
8
作者 熊江 《计算机工程与设计》 CSCD 北大核心 2007年第2期362-364,共3页
网上教育课件以XML文档的形式存储在服务器端,服务器端采用ASP技术,调用DOM接口,对XML文档进行解析,管理。用户在客户端实时点播,通过浏览器得到所需的课件相关信息,达到学生按需学习和老师按需教学的目的。从学习XML的基本知识入手,通... 网上教育课件以XML文档的形式存储在服务器端,服务器端采用ASP技术,调用DOM接口,对XML文档进行解析,管理。用户在客户端实时点播,通过浏览器得到所需的课件相关信息,达到学生按需学习和老师按需教学的目的。从学习XML的基本知识入手,通过对XML文档显示技术的比较分析,指出CSS和XSL在显示XML文档上存在着一些不足,然后详细研究了XML DOM技术,利用XML DOM技术实现网上教育课件的点播和显示。 展开更多
关键词 网上教育点播 课件 XML解析器 文档对象模型 可扩展样式语言 XML dom
在线阅读 下载PDF
基于DOM中间件技术在数字图书馆资源发现中的应用
9
作者 李欣荣 《现代情报》 北大核心 2007年第2期85-86,89,共3页
在网络环境中,有效的资源发现机制对于系统的性能有着重要意义。当前网格资源发现方式大都是集中式的、基于句法进行资源——请求的匹配,功能有限。本文提出了一种基于DOM中间件技术的数字图书馆XML文档资源发现模型。即以w3C的文档对... 在网络环境中,有效的资源发现机制对于系统的性能有着重要意义。当前网格资源发现方式大都是集中式的、基于句法进行资源——请求的匹配,功能有限。本文提出了一种基于DOM中间件技术的数字图书馆XML文档资源发现模型。即以w3C的文档对象模型DOM(Document Object Mode1)为基础,把所要提取的信息在DOM树状层次结构中进行数据关联的资源发现模式。 展开更多
关键词 数字图书馆 dom 文档对象模型 XML 资源发现 网格
在线阅读 下载PDF
基于DOM状态转换检测XSS漏洞 被引量:2
10
作者 王丹 刘立家 +2 位作者 林九川 赵文兵 杜晓林 《北京工业大学学报》 CAS CSCD 北大核心 2018年第9期1208-1216,共9页
为提升跨站脚本(cross site scripting,XSS)漏洞检测中对隐藏注入点的扫描覆盖率,有效判定是否存在XSS漏洞攻击,提出构建Web应用文档对象模型(document object model,DOM)状态转换图搜索XSS漏洞注入点的方法.该方法以DOM状态为节点,以... 为提升跨站脚本(cross site scripting,XSS)漏洞检测中对隐藏注入点的扫描覆盖率,有效判定是否存在XSS漏洞攻击,提出构建Web应用文档对象模型(document object model,DOM)状态转换图搜索XSS漏洞注入点的方法.该方法以DOM状态为节点,以浏览器事件为边对Web应用建模,结合页面分析和代理技术来识别漏洞注入点,提高XSS漏洞注入点判定准确率.首先分析页面中带参数的统一资源定位符(uniform resource locator,URL)和Form表单,并尝试触发页面元素的浏览器事件来检测其是否含有数据请求,以判定Web页面是否有疑似漏洞注入点;进一步利用探子向量进行测试,并根据探子向量的输出位置,对注入点进行分类并保存.之后,基于变异操作和过滤逃逸技术对XSS过滤逃避欺骗备忘单进行转换来设计攻击向量,对已发现的漏洞注入点进行测试,并设计多种方法对不同响应结果进行分析.最后,通过实验对比,验证了其有效性. 展开更多
关键词 跨站脚本(XSS)漏洞 文档对象模型(dom) 状态转换图 爬虫 Selenium
在线阅读 下载PDF
一种Deep Web查询结果的实体抽取方法 被引量:4
11
作者 赵海霞 李道申 +1 位作者 刘勇 赵嘉诚 《计算机工程与应用》 CSCD 2012年第36期160-163,共4页
Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结... Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结果页面的数据抽取工作。大量实验结果表明:该方法是可行的,并且能够提高Deep Web数据实体抽取的准确性和召回率。 展开更多
关键词 深度网 数据抽取 文件对象模型(dom) 索引 相似度
在线阅读 下载PDF
节点频度和语义距离相结合的网页正文信息抽取 被引量:3
12
作者 孟军 刘秋水 王秀坤 《计算机工程与应用》 CSCD 北大核心 2009年第1期140-143,共4页
提出了一种带有节点频度的扩展DOM树模型—BF-DOM树模型(Block node Frequency-Document Object Module),并基于此模型进行网页正文信息的抽取。该方法通过向DOM树的某些节点上添加频度和相关度属性来构造文中新的模型,再结合语义距离... 提出了一种带有节点频度的扩展DOM树模型—BF-DOM树模型(Block node Frequency-Document Object Module),并基于此模型进行网页正文信息的抽取。该方法通过向DOM树的某些节点上添加频度和相关度属性来构造文中新的模型,再结合语义距离抽取网页正文信息。方法主要基于以下三点考虑:在同源的网页集合内噪音节点的频度值很高;正文信息一般由非链接文字组成;与正文相关的链接和文章标题有较近的语义距离。针对8个网站的实验表明,该方法能有效地抽取正文信息,召回率和准确率都在96%以上,优于基于信息熵的抽取方法。 展开更多
关键词 信息提取 带有节点频度的文档对象模型 节点频度 语义距离
在线阅读 下载PDF
基于结构相似网页聚类的正文提取算法研究 被引量:2
13
作者 王海涌 冯兆旭 +1 位作者 杨海波 张津栋 《计算机工程与应用》 CSCD 北大核心 2018年第11期122-127,139,共7页
针对当前互联网网页越来越多样化、复杂化的特点,提出一种基于结构相似网页聚类的网页正文提取算法,首先,根据组成网页前端模板各"块"对模板的贡献赋以不同的权重,其次计算两个网页中对应块的相似度,将各块的相似度与权重乘... 针对当前互联网网页越来越多样化、复杂化的特点,提出一种基于结构相似网页聚类的网页正文提取算法,首先,根据组成网页前端模板各"块"对模板的贡献赋以不同的权重,其次计算两个网页中对应块的相似度,将各块的相似度与权重乘积的总和作为两个网页的相似度。该算法充分考虑结构差别较大的网页对网页正文提取的影响,通过计算网页间相似度将网页聚类,使得同一簇中的网页正文提取结果更加准确。实验结果表明,该方法具有更高的准确率,各项评价指标均有所提高。 展开更多
关键词 正文提取 相似性 文档对象模型(dom) 层次聚类
在线阅读 下载PDF
文件系统增量备份策略的形式化描述及实现 被引量:2
14
作者 肖克辉 倪德明 《计算机工程与设计》 CSCD 北大核心 2007年第10期2455-2457,共3页
文件系统备份和恢复过程中,需根据当前备份资源树和历史备份资源树进行合并等操作,这种操作在物理上表现为对目录树和资源树的处理。特别是增量备份时,它指明备份资源。恢复过程中,用户可以利用该策略根据时间点进行完全恢复和部分恢复... 文件系统备份和恢复过程中,需根据当前备份资源树和历史备份资源树进行合并等操作,这种操作在物理上表现为对目录树和资源树的处理。特别是增量备份时,它指明备份资源。恢复过程中,用户可以利用该策略根据时间点进行完全恢复和部分恢复。给出一种对备份资源树的解析算法,并进行分析,在算法的基础上对备份资源树进行了形式化描述。 展开更多
关键词 文件系统 增量备份 备份资源 目录 文档对象模型
在线阅读 下载PDF
基于WebKit内核的焦点查询策略研究与优化 被引量:1
15
作者 肖伟民 孙鹏 +1 位作者 郭志川 胡琳琳 《计算机应用与软件》 CSCD 2016年第10期77-81,共5页
为解决智能电视平台上带内联框架的网页存在焦点查询不友好的问题,对基于WebKit内核的嵌入式浏览器焦点查询策略进行研究,详细说明该策略对焦点查询的执行过程,并针对带内联框架的网页存在的焦点查询不友好问题进行查询算法的优化。在... 为解决智能电视平台上带内联框架的网页存在焦点查询不友好的问题,对基于WebKit内核的嵌入式浏览器焦点查询策略进行研究,详细说明该策略对焦点查询的执行过程,并针对带内联框架的网页存在的焦点查询不友好问题进行查询算法的优化。在智能电视平台上根据操控特征进行针对性优化,修正了焦点查询错误,大大提升了用户体验。实验结果表明,使用优化后的焦点查询策略在智能电视上可有效解决基于WebKit内核的嵌入式浏览器焦点查询错误问题。 展开更多
关键词 WebKit内核 内联框架 文档对象模型 焦点查询 优化
在线阅读 下载PDF
基于XML中间件的分布式异构数据库的数据分片策略研究 被引量:1
16
作者 蒋勇 谭怀亮 李光文 《计算机应用与软件》 CSCD 2009年第11期144-146,共3页
主要研究XML中间件的分布式异构数据库的数据分片策略,以便能够并行处理XML查询。为了描述XML数据分片,提出了对象树、子树的概念,将一棵XML数据树分割成对象树和子树,对象树在各个站点上复制,子树标签化后均匀分片到各个站点上。为了... 主要研究XML中间件的分布式异构数据库的数据分片策略,以便能够并行处理XML查询。为了描述XML数据分片,提出了对象树、子树的概念,将一棵XML数据树分割成对象树和子树,对象树在各个站点上复制,子树标签化后均匀分片到各个站点上。为了实现用户数据分片查询工作量的均衡,对最大树深的子树采用减治法策略,减治法策略后的子树又分配到一个新的站点上。基于这一思想,提出并实现其算法。实验结果证明:在分布式异构数据库的检索、查询和访问中,基于对象树、子树的数据分片算法的性能要比PSPIB算法性能优越。 展开更多
关键词 分布式异构数据库 文档对象模型文档 中间件 数据分片 对象 算法
在线阅读 下载PDF
一种Web应用跨浏览器兼容性测试方法 被引量:6
17
作者 韦庆杰 刘淑坤 《计算机工程与应用》 CSCD 北大核心 2019年第5期55-59,共5页
随着Web应用的日益普及,及可执行此类应用程序的浏览器越来越多,版本也在不断更新,Web应用的跨浏览器不兼容(Cross Browser Incompatibilities,XBI)已成为Web应用开发者面临的严重问题。提出一种结合DOM(Document Object Model)结构分... 随着Web应用的日益普及,及可执行此类应用程序的浏览器越来越多,版本也在不断更新,Web应用的跨浏览器不兼容(Cross Browser Incompatibilities,XBI)已成为Web应用开发者面临的严重问题。提出一种结合DOM(Document Object Model)结构分析和页面元素(Screen Element)的计算机视觉分析方法,实现Web应用的跨浏览器兼容性测试XBCT(Cross-Browser Compatibility Testing),和现有的测试方法比较,实验结果表明了所提方法能够提高测试结果的准确性。 展开更多
关键词 跨浏览器兼容性 WEB应用 文档对象模型(dom) 测试
在线阅读 下载PDF
基于B/S架构的Web网页结构检测应用研究 被引量:2
18
作者 陈圣俭 孙明涛 《现代电子技术》 2009年第2期135-138,共4页
随着互联网的普及,大型的跨国公司要求公司对内对外的所有网站都遵循统一的框架结构,因此为了判断网页结构是否符合标准,需要对网页结构进行检测。Web结构分析是指从Web文档中自动分析网页结构的过程,检测不符合标准的网页。依据W3C Mar... 随着互联网的普及,大型的跨国公司要求公司对内对外的所有网站都遵循统一的框架结构,因此为了判断网页结构是否符合标准,需要对网页结构进行检测。Web结构分析是指从Web文档中自动分析网页结构的过程,检测不符合标准的网页。依据W3C Markup Validation Service的设计理念,基于DOM结构树和正则表达式的操作,以分析Web网页结构为基础,提出了Web页面结构检测的设计思想。在解析Html和CSS代码的基础上,网页结构检测正确率达到80%以上。 展开更多
关键词 正则表达式 网页结构 检测 文档对象模型 属性元素
在线阅读 下载PDF
支持局部更新的双向内容适配策略
19
作者 吕红亮 王劲林 邓峰 《计算机工程与应用》 CSCD 北大核心 2010年第33期6-8,共3页
内容适配旨在解决融合环境下多种终端兼容问题,现有的内容适配策略在用户通过受限终端进行更新时会造成信息丢失。提出一种支持局部更新的双向内容适配策略,该策略基于DOM树建立统一的存储模型对元数据和适配实例进行存储,当受限终端发... 内容适配旨在解决融合环境下多种终端兼容问题,现有的内容适配策略在用户通过受限终端进行更新时会造成信息丢失。提出一种支持局部更新的双向内容适配策略,该策略基于DOM树建立统一的存储模型对元数据和适配实例进行存储,当受限终端发起更新时,通过比较DOM树中的节点对元数据进行局部更新。实验结果表明,相比现有策略,支持局部更新的内容适配策略在大部分情况下可以减少60%以上的信息丢失。 展开更多
关键词 融合环境 双向内容适配 局部更新 元数据 文档对象模型(dom)
在线阅读 下载PDF
基于Webkit内核焦点查询算法的研究与优化
20
作者 刘秀秀 潘梁 +1 位作者 郭志川 胡琳琳 《计算机工程与设计》 北大核心 2016年第2期450-453,486,共5页
为解决智能电视用户操控网页时存在焦点移动不友好的问题,研究基于Webkit内核的嵌入式浏览器的焦点查询算法。对该算法查询焦点的执行过程进行详细说明,针对不同位置的节点间的距离计算方法进行特别描述,在智能电视上根据电视特征对该... 为解决智能电视用户操控网页时存在焦点移动不友好的问题,研究基于Webkit内核的嵌入式浏览器的焦点查询算法。对该算法查询焦点的执行过程进行详细说明,针对不同位置的节点间的距离计算方法进行特别描述,在智能电视上根据电视特征对该算法进行优化。通过设置焦点移动的步长和改变DOM节点间距离计算等方法,提升用户体验。实验结果表明,在智能电视上使用优化后的方法可更快选择合适的目标节点,改善了人机交互体验。 展开更多
关键词 Webkit内核 文档对象模型 渲染 焦点查询算法 优化
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部