期刊文献+
共找到63篇文章
< 1 2 4 >
每页显示 20 50 100
基于DOM的Web信息提取 被引量:102
1
作者 李效东 顾毓清 《计算机学报》 EI CSCD 北大核心 2002年第5期526-533,共8页
当前 ,Web已经成为人们获取信息的主要渠道之一 .然而 ,用于表达 Web页面信息的 HTML语言存在着与生俱来的缺点 .HTML 的“标记”只是告诉浏览器软件如何显示所定义的信息 ,却不包含任何语义 .因此由HTML语言所表述的 Web页面经过浏览... 当前 ,Web已经成为人们获取信息的主要渠道之一 .然而 ,用于表达 Web页面信息的 HTML语言存在着与生俱来的缺点 .HTML 的“标记”只是告诉浏览器软件如何显示所定义的信息 ,却不包含任何语义 .因此由HTML语言所表述的 Web页面经过浏览器分析后只适合人们浏览 ,不适合作为一种数据交换的方式由机器处理 .该文以文档对象模型 DOM为基础 ,把所要提取的信息在 DOM层次结构中的路径作为信息抽取的“坐标”,并以这个基本原理为基础设计了一种归纳学习算法来半自动地生成提取规则 ,然后根据提取规则生成 Java类 .生成的 Ja-va类可以作为 Web数据源包装器组成的重要构件 . 展开更多
关键词 DOM Web 信息提取 归纳学习 文档对象模型 路径表达式 XML INTERNET
在线阅读 下载PDF
基于自动生成模板的Web信息抽取技术 被引量:13
2
作者 张彦超 刘云 +1 位作者 李勇 沈波 《北京交通大学学报》 CAS CSCD 北大核心 2009年第5期40-45,共6页
在网络舆情分析中,人们迫切需要自动化的工具在海量信息中抽取所需要的信息,以供进一步分析利用.针对此问题,提出了基于自动生成模板的Web信息抽取方法,可以消除网页噪声,快速有效地抽取所需的网页信息.该方法通过解析器将Web文档解析... 在网络舆情分析中,人们迫切需要自动化的工具在海量信息中抽取所需要的信息,以供进一步分析利用.针对此问题,提出了基于自动生成模板的Web信息抽取方法,可以消除网页噪声,快速有效地抽取所需的网页信息.该方法通过解析器将Web文档解析成文档对象模型,根据用户需求建立抽取规则,采用自动生成模板机制,并依据模板的抽取规则对网页信息进行抽取.实验证明,该抽取方法具有较高的召回率和准确率. 展开更多
关键词 信息抽取 模板 文档对象模型 XPATH 网络舆情
在线阅读 下载PDF
基于XML的表单设计器构件的设计与实现 被引量:19
3
作者 王瑞霞 隋宏伟 刘弘 《计算机应用研究》 CSCD 北大核心 2007年第7期183-185,共3页
针对Web应用系统中用户对表单的需求不断变化的普遍现象,设计了基于XML的表单设计器构件,实现了Web应用系统中用户对表单的动态管理。
关键词 可扩展标记语言 表单 构件 文档对象模型
在线阅读 下载PDF
SVG和Ajax技术在电网分析与辅助决策支持系统中的应用 被引量:18
4
作者 郭挺 谢敏 +1 位作者 刘明波 林辉 《电力系统保护与控制》 EI CSCD 北大核心 2012年第4期83-89,共7页
电网分析与辅助决策系统的各个子系统与实时数据平台之间需要进行复杂而频繁的数据交互。基于oracle的实时数据平台中的数据存储位置和组织形式复杂且不具有直观性。良好的图形界面将大大提高电网分析与辅助决策系统的易用性和用户友好... 电网分析与辅助决策系统的各个子系统与实时数据平台之间需要进行复杂而频繁的数据交互。基于oracle的实时数据平台中的数据存储位置和组织形式复杂且不具有直观性。良好的图形界面将大大提高电网分析与辅助决策系统的易用性和用户友好性。在简要介绍电力图形系统研究现状的基础上,探讨了电力系统中广泛应用的可缩放矢量图形(Scalable Vector Graphics,SVG)技术;通过基于文档对象模型(Document Object Model,DOM)的脚本编程实现了SVG图形与用户的良好交互;通过建立Ajax(Asynchronous JavaScript and XML)引擎,实现了电气模型图形信息与实时数据的关联动态刷新。该方案在电网分析与辅助决策支持系统的应用中取得了良好的效果。 展开更多
关键词 电网分析与辅助决策系统 图形系统 SVG DOM AJAX
在线阅读 下载PDF
基于链式结构XML文档的生成方法 被引量:5
5
作者 陈再良 徐德智 +1 位作者 陈学工 沈海澜 《计算机工程》 EI CAS CSCD 北大核心 2006年第20期59-61,共3页
提出了一种基于链式结构的XML文档生成方法,设计了一个利用Java中的streamtokenizer类实现HTML文档解析的算法,将解析得到的元素内容及文本内容生成的结点插入到相应的位置上,同步生成DOM解析树,对DOM解析树进行遍历,将遍历得到的信息... 提出了一种基于链式结构的XML文档生成方法,设计了一个利用Java中的streamtokenizer类实现HTML文档解析的算法,将解析得到的元素内容及文本内容生成的结点插入到相应的位置上,同步生成DOM解析树,对DOM解析树进行遍历,将遍历得到的信息以二叉链表的形式存储,采用改进的先根遍历算法对该二叉链表遍历,提取相应的信息构建DTD,完成整个转换生成的过程。 展开更多
关键词 HTML XML DOM 解析
在线阅读 下载PDF
一种改进的基于本体的Web信息抽取 被引量:7
6
作者 柳佳刚 陈山 黄樱 《计算机工程》 CAS CSCD 北大核心 2010年第4期39-41,44,共4页
以Web页面信息项本体定义为基础,对单个样本页面信息项路径进行启发式学习,对所有样本页面集中信息块路径进行归纳学习,识别结构相似的信息块子树位置,以准确划定信息抽取区域,降低页面噪声。将经过噪声处理的样本页面自动解析成页面的... 以Web页面信息项本体定义为基础,对单个样本页面信息项路径进行启发式学习,对所有样本页面集中信息块路径进行归纳学习,识别结构相似的信息块子树位置,以准确划定信息抽取区域,降低页面噪声。将经过噪声处理的样本页面自动解析成页面的结构本体。比较Web页面信息项本体和页面的结构本体,通过归纳学习算法生成抽取规则,提高Web信息的抽准率。 展开更多
关键词 信息抽取 本体 归纳学习 文档对象模型
在线阅读 下载PDF
基于三层网络架构及DOM的XML系统模型 被引量:20
7
作者 刘芳珠 潘亦 潘金贵 《小型微型计算机系统》 CSCD 北大核心 2001年第12期1512-1515,共4页
本文阐述如何在三层网络架构上运用 XML以构筑 XML文档支持系统 .提出了基于三层网络架构及 DOM的XML 系统的模型 .该系统与传统的客户 /服务器应用或是采用一般的数据传输方式如 HTML 等系统相比具有减少了网络流量、更有利于检索、可... 本文阐述如何在三层网络架构上运用 XML以构筑 XML文档支持系统 .提出了基于三层网络架构及 DOM的XML 系统的模型 .该系统与传统的客户 /服务器应用或是采用一般的数据传输方式如 HTML 等系统相比具有减少了网络流量、更有利于检索、可从多种不同的数据源集成数据、开放性、可扩充性。 展开更多
关键词 可扩展标记语言 文档类型定义 三层网络架构 文档对象模型 计算机网络
在线阅读 下载PDF
可缩放矢量图形技术在电力系统故障诊断软件包中的应用 被引量:7
8
作者 董泰福 文福拴 廖志伟 《华北电力大学学报(自然科学版)》 CAS 北大核心 2007年第4期38-42,共5页
图形是电力系统在线故障诊断软件的重要组成部分。设计良好的图形可以增强电力系统故障诊断软件包的易用性和互操作性。在分析现代电力系统高级应用软件图形功能发展方向的基础上,介绍了具有广泛应用前景的可缩放矢量图形(SVG)技术和文... 图形是电力系统在线故障诊断软件的重要组成部分。设计良好的图形可以增强电力系统故障诊断软件包的易用性和互操作性。在分析现代电力系统高级应用软件图形功能发展方向的基础上,介绍了具有广泛应用前景的可缩放矢量图形(SVG)技术和文档对象模型(DOM)技术,探讨了SVG和DOM技术在电力系统软件图形化中的具体应用,并在所开发的电力系统故障诊断软件包中进行了实现,取得了很好的效果。 展开更多
关键词 可缩放矢量图形 文档对象模型 电力系统故障诊断系统 互操作
在线阅读 下载PDF
一种Deep Web查询结果的实体抽取方法 被引量:4
9
作者 赵海霞 李道申 +1 位作者 刘勇 赵嘉诚 《计算机工程与应用》 CSCD 2012年第36期160-163,共4页
Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结... Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结果页面的数据抽取工作。大量实验结果表明:该方法是可行的,并且能够提高Deep Web数据实体抽取的准确性和召回率。 展开更多
关键词 深度网 数据抽取 文件对象模型(DOM)树 索引 相似度
在线阅读 下载PDF
嵌入式浏览器中JavaSCript和DOM的支持 被引量:8
10
作者 周林 步丰林 《计算机工程》 CAS CSCD 北大核心 2004年第B12期114-117,共4页
近几年,嵌入式系统的网络化已经成为嵌入式系统的主要发展趋势,为了使嵌入式浏览器能支持动态页面,可通过在浏览器中支持 JavaScript和DOM来实现。该文在一个实际嵌入式浏览器开发项目的基础上简要阐述了如何在嵌入式浏览器中实现对Java... 近几年,嵌入式系统的网络化已经成为嵌入式系统的主要发展趋势,为了使嵌入式浏览器能支持动态页面,可通过在浏览器中支持 JavaScript和DOM来实现。该文在一个实际嵌入式浏览器开发项目的基础上简要阐述了如何在嵌入式浏览器中实现对JavaScript和DOM的 支持。 展开更多
关键词 嵌入式浏览器 JAVASCRIPT DOM HTML
在线阅读 下载PDF
ActiveX技术在工程图档管理中的应用 被引量:12
11
作者 王欣 魏生民 《中国机械工程》 EI CAS CSCD 北大核心 2001年第9期1056-1059,共4页
剖析了 Active X技术和 Auto CAD R1 4新提供的 Active X Au-tomation编程接口 ,并在此基础上介绍了基于 Active X automation技术从Auto CAD的 DWG文件中自动提取标题栏和明细栏信息的方法和基于 Ac-tive X控件的图纸浏览技术。据此技... 剖析了 Active X技术和 Auto CAD R1 4新提供的 Active X Au-tomation编程接口 ,并在此基础上介绍了基于 Active X automation技术从Auto CAD的 DWG文件中自动提取标题栏和明细栏信息的方法和基于 Ac-tive X控件的图纸浏览技术。据此技术开发出的软件包在实践中得到了较好的应用 。 展开更多
关键词 工程图档 ACTIVEX 对象模型 软件构件 AUTOCAD
在线阅读 下载PDF
矿山遥感监测解译记录表自动生成方法研究与实现 被引量:4
12
作者 刁明光 刘芳 +2 位作者 谭专条 薛涛 王彦佐 《国土资源遥感》 CSCD 北大核心 2018年第4期212-217,共6页
矿山遥感监测过程中,技术人员会利用Arc Map软件提取矿山开采区遥感监测成果数据中的相关信息制作解译记录表,以实现对矿山开采状况的遥感监测。手工制作解译记录表存在制作成本高、专业性强、工作量大、制表格式不一致、数据准确性低... 矿山遥感监测过程中,技术人员会利用Arc Map软件提取矿山开采区遥感监测成果数据中的相关信息制作解译记录表,以实现对矿山开采状况的遥感监测。手工制作解译记录表存在制作成本高、专业性强、工作量大、制表格式不一致、数据准确性低等问题。本研究提出基于AE(Arc GIS Engine)进行插件式设计的矿山解译记录表自动生成方法,自动提取矿山开采区域遥感监测成果数据的属性信息和空间信息,结合文档对象模型(document object model,DOM)自动编辑文档,完成解译记录表的自动生成工作。 展开更多
关键词 AE 矿山监测 文档对象模型 解译记录表 遥感影像
在线阅读 下载PDF
城市GML文档三维特征的快速获取与可视化 被引量:2
13
作者 赵伶俐 朱建军 +1 位作者 刘帅 马力 《计算机工程与应用》 CSCD 北大核心 2009年第26期226-229,共4页
随着网络技术的发展,对城市三维数据的需求愈益增加,然而众多的城市三维数据缺乏统一的模型,使数据不能有效地进行共享与交互。开放式地理信息系统协会(Open GIS Consortium,OGC)提出了地理标记语言(Geography Markup Language,GML),城... 随着网络技术的发展,对城市三维数据的需求愈益增加,然而众多的城市三维数据缺乏统一的模型,使数据不能有效地进行共享与交互。开放式地理信息系统协会(Open GIS Consortium,OGC)提出了地理标记语言(Geography Markup Language,GML),城市GML规范定义了城市空间信息模型的标准,有利于三维数据在网络上进行传输、共享。通过分析城市GML文件的结构,提出一种适合一般城市GML文件的数据结构集合,使得在采用DOM接口解析文件后,能够快速获取城市GML文件的3D信息。实验部分使用Java3D编程显示快速获取的3D信息,证明了提出的数据结构集合的有效性。 展开更多
关键词 城市地理标记语言GML 开放式地理信息系统协会 3D特征 可视化
在线阅读 下载PDF
基于本体的高校毕业生就业综合服务系统研究 被引量:2
14
作者 金智勇 李天健 吕何新 《计算机应用研究》 CSCD 北大核心 2007年第12期235-237,252,共4页
讨论采用TOVE方法论,以OWL作为元数据的描述语言,利用Protégé应用程序创建就业领域共享的本体。在.NET集成开发环境下,利用基于XML文档对象模型的编程接口实现对本体实例数据的加载,为本体操作提供了友好的人机交互界面。就... 讨论采用TOVE方法论,以OWL作为元数据的描述语言,利用Protégé应用程序创建就业领域共享的本体。在.NET集成开发环境下,利用基于XML文档对象模型的编程接口实现对本体实例数据的加载,为本体操作提供了友好的人机交互界面。就业系统中,企事业单位与高校毕业生之间需求的相容匹配机制借助于Rac-erPro推理机和JBuilder集成环境。 展开更多
关键词 文档对象模型 本体 WEB本体语言 推理机
在线阅读 下载PDF
基于工作流技术的OA系统模型 被引量:56
15
作者 叶立新 陈闳中 +1 位作者 郑航 罗成平 《计算机工程与应用》 CSCD 北大核心 2000年第6期90-92,128,共4页
工作流技术是工作流管理系统(WFMS)中的核心技术,它是提高业务过程效率和生产率的关键技术。文章研究了工作流技术在办公室自动化系统中的应用,提出并建立了基于工作流管理的办公自动化系统模型及其工作流的数学模型表示。
关键词 工作流技术 工作项 系统模型 办公自动化系统
在线阅读 下载PDF
XML数据更新算法研究 被引量:5
16
作者 鲍培明 吉根林 《计算机工程》 CAS CSCD 北大核心 2008年第4期101-103,共3页
为了实现对XML文档的数据更新,提出一组实用算法。该算法利用简单应用编程接口扩展标记语言(SAX)解析和文件对象模型(DOM)解析,使其优势互补。应用SAX解析器将大XML文档编码成线性数据结构存储,该线性数据结构与原XML文档具有同构特性,... 为了实现对XML文档的数据更新,提出一组实用算法。该算法利用简单应用编程接口扩展标记语言(SAX)解析和文件对象模型(DOM)解析,使其优势互补。应用SAX解析器将大XML文档编码成线性数据结构存储,该线性数据结构与原XML文档具有同构特性,因此,线性结构存储的数据可以无损还原为原XML文档。线性数据结构支持Xpath查询,在查询得到的局部数据上应用DOM方法进行数据更新。更新后的数据再转换为XML文档。该组算法对大XML文档的数据更新实用且有效,而且对大XML文档的其他数据处理也有一定的实用价值。 展开更多
关键词 扩展标记语言 数据更新 SAX解析 DOM解析
在线阅读 下载PDF
在线富文本公式编辑器的设计与实现 被引量:3
17
作者 郑斌 沈明霞 《计算机工程》 CAS CSCD 北大核心 2011年第18期287-289,共3页
在研究ASCIIMathML转换文档的基础上,提出基于ASCIIMathML的富文本公式编辑器设计方案。运用JavaScript和DOM技术,结合XHTML实现火狐浏览器下公式的所见即所得编辑,并将公式编辑页面应用到文本编辑器中,实现公式的显示、复编辑、保存、... 在研究ASCIIMathML转换文档的基础上,提出基于ASCIIMathML的富文本公式编辑器设计方案。运用JavaScript和DOM技术,结合XHTML实现火狐浏览器下公式的所见即所得编辑,并将公式编辑页面应用到文本编辑器中,实现公式的显示、复编辑、保存、载入等功能,有利于公式的在线编辑和传输。 展开更多
关键词 文档对象模型 数学标记语言 公式编辑 富文本编辑 ASCIIMathML文档
在线阅读 下载PDF
基于XML和Script组件的指标在线计算模型研究 被引量:1
18
作者 王雷 徐治皋 +1 位作者 司风琪 崔彦锋 《电力自动化设备》 EI CSCD 北大核心 2006年第1期33-37,共5页
针对目前电站指标在线计算系统在灵活性、可扩展性等方面的不足,建立了一种新的指标在线计算模型。利用文档对象模型DOM(DocumentObjectModel)建立指标算法文档,将复杂的指标算法从实时运算程序中分离,当指标算法改动时,只需对指标算法... 针对目前电站指标在线计算系统在灵活性、可扩展性等方面的不足,建立了一种新的指标在线计算模型。利用文档对象模型DOM(DocumentObjectModel)建立指标算法文档,将复杂的指标算法从实时运算程序中分离,当指标算法改动时,只需对指标算法文档重新组态,而不需对实时运算程序代码进行改动,实现了复杂算法与计算过程的分离,提高了算法可移植性和灵活性。算法更新过程采用“非重启模式”,实现了算法文件集的在线更新,避免了程序重启过程所带来的数据损失,提高了运算的精确度。同时,基于Microsoft(R)Script组件建立了具有“黑箱”特性的指标在线运算模块,作为与算法无关的纯计算程序,其在线计算量小,提高了对数据的分析能力和可操作性。 展开更多
关键词 指标 算法 XML文档对象模型 Script组件
在线阅读 下载PDF
基于文档类型定义的实现一致性声明文稿及生成方法 被引量:1
19
作者 董文莉 孟洛明 +1 位作者 邱雪松 林巍 《通信学报》 EI CSCD 北大核心 2005年第2期38-44,共7页
以DTD元素为核心,由XML DTD 结构分析入手,借鉴ITU-T 的ICS 文稿设计方法,参考ITU-T的MOCS、MRCS和MICS文稿,结合基于XML的网络管理接口一致性测试,提出了基于DTD的ICS文稿,该文稿包括元素支持文稿、属性支持文稿和子元素支持文稿,提出... 以DTD元素为核心,由XML DTD 结构分析入手,借鉴ITU-T 的ICS 文稿设计方法,参考ITU-T的MOCS、MRCS和MICS文稿,结合基于XML的网络管理接口一致性测试,提出了基于DTD的ICS文稿,该文稿包括元素支持文稿、属性支持文稿和子元素支持文稿,提出了该文稿的生成方法,研制了应用于基于XML网络管理接口一致性测试的基于DTD的ICS文稿自动生成系统。 展开更多
关键词 网络管理 实现一致性声明 文档对象模型 文档类型定义
在线阅读 下载PDF
文件系统增量备份策略的形式化描述及实现 被引量:2
20
作者 肖克辉 倪德明 《计算机工程与设计》 CSCD 北大核心 2007年第10期2455-2457,共3页
文件系统备份和恢复过程中,需根据当前备份资源树和历史备份资源树进行合并等操作,这种操作在物理上表现为对目录树和资源树的处理。特别是增量备份时,它指明备份资源。恢复过程中,用户可以利用该策略根据时间点进行完全恢复和部分恢复... 文件系统备份和恢复过程中,需根据当前备份资源树和历史备份资源树进行合并等操作,这种操作在物理上表现为对目录树和资源树的处理。特别是增量备份时,它指明备份资源。恢复过程中,用户可以利用该策略根据时间点进行完全恢复和部分恢复。给出一种对备份资源树的解析算法,并进行分析,在算法的基础上对备份资源树进行了形式化描述。 展开更多
关键词 文件系统 增量备份 备份资源树 目录树 文档对象模型
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部