期刊文献+
共找到252篇文章
< 1 2 13 >
每页显示 20 50 100
非结构化数据处理技术在投资大数据审计中的应用研究 被引量:3
1
作者 郭红建 庄名驹 李嘉豪 《中国注册会计师》 北大核心 2025年第2期73-77,共5页
大数据环境下,投资审计的对象和内容都发生了根本性变化,以文本、图像、音频和视频为代表的非结构化数据逐渐成为了投资审计线索的主要来源,传统面向结构化数据的审计数据处理方法面临巨大挑战,严重影响了审计数据利用的质量和效率。本... 大数据环境下,投资审计的对象和内容都发生了根本性变化,以文本、图像、音频和视频为代表的非结构化数据逐渐成为了投资审计线索的主要来源,传统面向结构化数据的审计数据处理方法面临巨大挑战,严重影响了审计数据利用的质量和效率。本文基于投资审计领域数据利用现存问题,探究非结构化数据处理技术在投资大数据审计中的应用模式,以利于有效提高非结构化审计数据的采集、清洗、处理与分析挖掘的工作能力,助力投资审计技术方法创新,推进投资审计数字化转型与高质量发展。 展开更多
关键词 投资审计 数据审计 结构化数据 数据处理技术
在线阅读 下载PDF
基于结构化数据的区域保障调度模型研究
2
作者 胡志刚 楼京俊 +1 位作者 史跃东 胡俊波 《系统工程与电子技术》 北大核心 2025年第2期544-554,共11页
在区域任务中,装备保障调度实质是装备体系和保障体系在保障资源上的匹配。因此,体系资源的精确匹配成为提升区域保障能力的关键。以体系的模块化分层结构为基础,融合体系节点的特征和结构信息,构建基于结构化数据的区域保障调度最优传... 在区域任务中,装备保障调度实质是装备体系和保障体系在保障资源上的匹配。因此,体系资源的精确匹配成为提升区域保障能力的关键。以体系的模块化分层结构为基础,融合体系节点的特征和结构信息,构建基于结构化数据的区域保障调度最优传输(optimal transmission, OT)的资源匹配模型。考虑决策层级,将其拓展为多分辨率模型,基于结构化OT算法,将保障调度概率方案转换为多分辨率模型的保障调度方案求解算法。所提基于结构化数据的区域保障调度模型,解决区域保障资源体系匹配中的层级结构一致性问题。案例分析结果表明,在树形结构和复杂规模下,所提保障调度方案具有鲁棒性。 展开更多
关键词 装备保障 结构化数据 保障调度 最优传输
在线阅读 下载PDF
国际标准《信息与文献 结构化数据环境下文件(档案)管理的问题及应对》解读
3
作者 白文琳 安小米 肖雨馨 《中国档案》 北大核心 2024年第5期60-61,共2页
ISO/TR 8344:2024是一项由国际标准化组织(ISO)制定的技术报告标准,其全称为“Information and documentation-Issues and considerations for managing records in structured data environments”,即《信息与文献结构化数据环境下文件... ISO/TR 8344:2024是一项由国际标准化组织(ISO)制定的技术报告标准,其全称为“Information and documentation-Issues and considerations for managing records in structured data environments”,即《信息与文献结构化数据环境下文件(档案)管理的问题及应对》。该标准的目的是为揭示在结构化数据环境下管理文件(档案)的问题,并提供相应指导,以帮助组织更有效地管理和利用文件(档案)。标准于2024年4月15日全球正式发布。 展开更多
关键词 结构化数据 管理文件 信息与文献 ISO/TR 档案
在线阅读 下载PDF
半结构化数据到结构化数据的模式抽取 被引量:3
4
作者 潘顺 金远平 《计算机工程》 CAS CSCD 北大核心 2002年第5期57-58,280,共3页
在分析现有的半结构化数据的存储方式及存在的问题基础上,引入了小集合属性、集合属性、聚类集合、模板集合、父属性序列等概念,借助映射表达语言,提出了一种基于数据挖掘的半结构化数据到结构化数据的模式抽取的方法。
关键词 结构化数据 结构化数据 模式抽取 数据挖掘 数据
在线阅读 下载PDF
非结构化数据的ETL设计 被引量:3
5
作者 曹金山 张泽滨 《现代电子技术》 2011年第10期48-50,共3页
为了实现非结构化数据的ETL处理,分析了数据整合的发展现状和业务需求,描述了目前国际流行的公共仓库元模型(CWM)以及在ETL实现中的作用,详细分析了结构化数据和非结构化数据的不同特点。针对两种数据的差异,提出了解决非结构化数据的... 为了实现非结构化数据的ETL处理,分析了数据整合的发展现状和业务需求,描述了目前国际流行的公共仓库元模型(CWM)以及在ETL实现中的作用,详细分析了结构化数据和非结构化数据的不同特点。针对两种数据的差异,提出了解决非结构化数据的属性提取和数据打包的方法,为非结构化数据形成元数据奠定了基础,从而实现了非结构化数据的ETL设计,设计完全满足标准的数据整合要求。 展开更多
关键词 结构化数据 结构化数据 CWM ETL
在线阅读 下载PDF
半结构化数据查询重写 被引量:16
6
作者 高军 唐世渭 +1 位作者 杨冬青 王腾蛟 《计算机研究与发展》 EI CSCD 北大核心 2002年第2期165-171,共7页
查询重写是数据库研究的一个基本问题 ,它和查询优化 ,数据仓库 ,信息集成 ,语义缓存等问题紧密相关 .目前 Internet上存在海量的半结构化数据 ,在信息集成过程中产生了大量半结构化视图 ,如何利用物化半结构化视图来重写用户查询 ,减... 查询重写是数据库研究的一个基本问题 ,它和查询优化 ,数据仓库 ,信息集成 ,语义缓存等问题紧密相关 .目前 Internet上存在海量的半结构化数据 ,在信息集成过程中产生了大量半结构化视图 ,如何利用物化半结构化视图来重写用户查询 ,减少响应时间成为研究热点问题 .上述问题本质上是 NP问题 ,提出了一种半结构化查询重写的新方法 ,该方法在保证算法正确性和完备性的基础上 ,利用半结构化数据特点和查询子目标之间的关系 ,减少了指数空间的查询重写候选方案生成 .理论分析表明 。 展开更多
关键词 查询重写 OEM 查询包含 结构化数据 数据
在线阅读 下载PDF
基于主体行为的非结构化数据模型 被引量:12
7
作者 韩晶 鄂海红 +1 位作者 宋美娜 宋俊德 《计算机工程与设计》 CSCD 北大核心 2013年第3期904-908,共5页
为满足用户的复杂检索需求,对用户行为特性进行分析,提出一种非结构化数据的星系数据模型。基于对文件系统中属性使用情况的统计结果,通过优化文件属性、增加用户行为特性属性等方法,形成非结构化数据属性集。在此基础上,使用一个数据... 为满足用户的复杂检索需求,对用户行为特性进行分析,提出一种非结构化数据的星系数据模型。基于对文件系统中属性使用情况的统计结果,通过优化文件属性、增加用户行为特性属性等方法,形成非结构化数据属性集。在此基础上,使用一个数据对象和基本类、内容类、特征类、行为类、环境类等5个属性类表示一个非结构化数据,构建非结构化数据模型。对模型进行了仿真分析,分析结果表明了模型有效且可行,具有轻量级、支持复杂检索、检索结果准确度高等优势,为大数据管理提供支撑。 展开更多
关键词 结构化数据 数据管理 用户行为 数据模型 属性
在线阅读 下载PDF
用电信息采集系统非结构化数据管理设计 被引量:21
8
作者 祝恩国 刘宣 葛磊蛟 《电力系统及其自动化学报》 CSCD 北大核心 2016年第10期123-128,共6页
针对用电信息采集系统的非结构化数据具有海量、接入点多而分散等特点,本文提出一种用电信息采集系统非结构化数据管理设计方案。首先,对用电信息采集系统的非结构化数据进行分类。其次,提出了数据采集、数据存储和数据挖掘等3部分的管... 针对用电信息采集系统的非结构化数据具有海量、接入点多而分散等特点,本文提出一种用电信息采集系统非结构化数据管理设计方案。首先,对用电信息采集系统的非结构化数据进行分类。其次,提出了数据采集、数据存储和数据挖掘等3部分的管理设计方案:数据采集主要实现非结构化数据的收集;数据存储包括数据预处理和Hadoop两部分,完成海量数据的快速存储;数据挖掘按照文本、视频、音频3种类别分类处理,实现海量数据挖掘应用。该方案对用电信息采集系统的海量非结构化数据管理,有一定的参考价值。 展开更多
关键词 用电信息采集系统 结构化数据 框架设计 海量数据 数据挖掘
在线阅读 下载PDF
面向海量非结构化数据的非关系型存储管理机制 被引量:8
9
作者 刘超 胡成玉 +2 位作者 姚宏 梁庆中 颜雪松 《计算机应用》 CSCD 北大核心 2016年第3期670-674,共5页
针对传统的关系数据存储系统性能不足、容错性差,无法适应海量非结构化数据管理的问题,提出一种高性能、高可用非关系型存储管理机制。首先,设计了良好的用户访问服务接口,通过高效的一致性哈希算法支持数据分发到多个存储节点;其次,采... 针对传统的关系数据存储系统性能不足、容错性差,无法适应海量非结构化数据管理的问题,提出一种高性能、高可用非关系型存储管理机制。首先,设计了良好的用户访问服务接口,通过高效的一致性哈希算法支持数据分发到多个存储节点;其次,采用可配置的数据副本机制改善存储系统的可用性;最后,提出查询故障处理机制,用以提升存储系统的容错性,避免节点失效导致服务中断问题。实验结果表明,在不同规模用户负载下,新的存储系统的并发访问请求能力和传统的文件系统、关系数据库相比,分别提升了30%和50%;同时,在合理响应时间内,故障状态下的存储系统的可用性损失小于14%。因此,该机制适用于海量非结构化数据的高效存储管理。 展开更多
关键词 结构化数据 海量数据存储 非关系型存储管理 一致性哈希 故障处理
在线阅读 下载PDF
MongoDB索引的用电信息非结构化数据存储方法 被引量:12
10
作者 徐英辉 祝恩国 +1 位作者 赵睿 杨挺 《电力系统及其自动化学报》 CSCD 北大核心 2017年第9期93-97,共5页
随着用电信息采集系统的健全,双向互动化功能的需求增加,系统所承载的用电信息由最初的规整结构化数据演变成结构化数据和多类型非结构化数据的混杂,且数据量也日益聚增。本文对用电信息采集系统的非结构化数据组成进行了梳理,从数据源... 随着用电信息采集系统的健全,双向互动化功能的需求增加,系统所承载的用电信息由最初的规整结构化数据演变成结构化数据和多类型非结构化数据的混杂,且数据量也日益聚增。本文对用电信息采集系统的非结构化数据组成进行了梳理,从数据源角度出发,按照客户用电信息数据和客户数据两大类别,分别对用电信息采集系统涉及的A、B、C、D、E 5类用户进行了非结构化数据特征分析。本文提出采用MongoDB索引Hadoop分布式文件系统的新型用电信息采集系统非结构化数据存储方法,实现对系统中混杂非结构化数据的分类存储和准确实时读写,为双向互动化功能提供了良好底层泛在数据支撑。 展开更多
关键词 结构化数据 用电信息数据 HADOOP分布式文件系统 MONGODB
在线阅读 下载PDF
E-learning非结构化数据管理系统的构建与实现 被引量:10
11
作者 韦琳 袁泉 +1 位作者 霍剑青 王晓蒲 《中国科学技术大学学报》 CAS CSCD 北大核心 2010年第6期623-628,共6页
针对e-learning教学系统非结构化数据管理中存在着文件系统和数据库记录的不一致性和非结构化文件信息不能直接提取的问题,提出了在数据库和文件系统相结合的管理模式基础上加入文件控制模块和元数据提取模块,构建了基于元数据的e-learn... 针对e-learning教学系统非结构化数据管理中存在着文件系统和数据库记录的不一致性和非结构化文件信息不能直接提取的问题,提出了在数据库和文件系统相结合的管理模式基础上加入文件控制模块和元数据提取模块,构建了基于元数据的e-learning教学非结构化数据管理系统,实现了对e-learning教学系统中非结构化文件的统一管理和信息直接提取,减少了人工输入,提高了效率. 展开更多
关键词 结构化数据 E-LEARNING 数据
在线阅读 下载PDF
面向云存储的非结构化数据存取 被引量:50
12
作者 谢华成 陈向东 《计算机应用》 CSCD 北大核心 2012年第7期1924-1928,1942,共6页
非结构化数据呈爆炸态势增长,现有存储技术在I/O吞吐能力、可扩展性及易管理性等方面亟待改进。存储系统以云存储和可靠性理论为基础,建立了非结构化数据的分布式存储模型,并设计了可靠度函数。采用分布式关系数据库管理系统(RDBMS)作... 非结构化数据呈爆炸态势增长,现有存储技术在I/O吞吐能力、可扩展性及易管理性等方面亟待改进。存储系统以云存储和可靠性理论为基础,建立了非结构化数据的分布式存储模型,并设计了可靠度函数。采用分布式关系数据库管理系统(RDBMS)作为存储底层,将非结构化数据直接存储于数据表中,实现了非结构化数据和元数据的分离式存储和统一管理,进而提升了存储系统性能。相对于集中式存储,新系统具有较高的可用性。仿真结果显示,存储系统可靠度高且易于扩展。该分布式存储系统可应用于动态开放计算环境,提供效能较高的云存储服务。 展开更多
关键词 云存储 结构化数据存储 可靠度函数 数据分离存储 存储仿真
在线阅读 下载PDF
半结构化数据模型及查询语言 被引量:14
13
作者 许学标 顾宁 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 1998年第10期896-901,共6页
在传统数据库中要求查询处理时数据的结构模式已知且固定,这在WWW和异构信息源集成等半结构化数据情形下很难满足.为此,文中给出了一个无模式的自描述简单对象模型SDOM和相应的查询语言SDOQL,很好地解决了上述问题.文... 在传统数据库中要求查询处理时数据的结构模式已知且固定,这在WWW和异构信息源集成等半结构化数据情形下很难满足.为此,文中给出了一个无模式的自描述简单对象模型SDOM和相应的查询语言SDOQL,很好地解决了上述问题.文中同时给出了与查询处理相关的若干问题. 展开更多
关键词 结构化数据 数据模型 查询语言 数据
在线阅读 下载PDF
含有丰富结构化数据的Web页面分类技术的研究 被引量:5
14
作者 赵志滨 贾岩峰 +1 位作者 姚兰 鲍玉斌 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期53-60,共8页
Web页面的主题识别和分类是垂直搜索引擎的核心,是结构化数据抽取的前提,具有重要的学术价值,工程应用也非常广泛.以往的工作多以定向爬虫技术来解决垂直搜索引擎数据采集的专业化问题,而Web页面的主题识别和分类也多采用传统的文本分... Web页面的主题识别和分类是垂直搜索引擎的核心,是结构化数据抽取的前提,具有重要的学术价值,工程应用也非常广泛.以往的工作多以定向爬虫技术来解决垂直搜索引擎数据采集的专业化问题,而Web页面的主题识别和分类也多采用传统的文本分类方法.针对含有丰富结构化数据的Web页面,提出了复用结构化数据抽取模板来进行Web页面主题识别的分类框架.该框架首先解析Web页面的组织结构,通过属性探测算法,获得Web页面所包含的主题关键词.进一步通过计算主题关键词与结构化抽取模板的相似性来判定Web页面的主题并按照领域进行分类.该方法避免了主题爬虫对URL格式严重依赖的问题,分类准确率也高于传统的文本分类方法.通过实验证明了框架在含有丰富结构化数据的Web页面分类方面的有效性. 展开更多
关键词 垂直搜索 结构化数据 网页分类 模板 相似性计算
在线阅读 下载PDF
基于本体的半结构化数据的柔性查询 被引量:7
15
作者 王真星 顾宁 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2003年第11期1571-1578,共8页
半结构化数据库没有固定的库模式,用户对其结构难以产生清晰的认识,从而无法有效地查询所需的内容.提出了一种基于本体的柔性查询,用户通过了解数据库本体语义信息而发出的查询不必遵循严格的数据库模式也能得出结果.由于在半结构化数... 半结构化数据库没有固定的库模式,用户对其结构难以产生清晰的认识,从而无法有效地查询所需的内容.提出了一种基于本体的柔性查询,用户通过了解数据库本体语义信息而发出的查询不必遵循严格的数据库模式也能得出结果.由于在半结构化数据库上直接查找效率很低,故在其上生成描述结构模式的概念本体库.查询模块先在本体库上评估能否得出查询结果,再在数据库上执行查询.然而由于本体库可能是图的形式,其查询代价仍然很高,本质上是NP问题,进一步研究了将图转化为树的方法,并给出了相应的算法. 展开更多
关键词 本体 结构化数据 XML 柔性查询
在线阅读 下载PDF
网际网上半结构化数据抽取与知识发现方法及其实现 被引量:7
16
作者 陈恩红 范焱 +1 位作者 王行甫 蔡庆生 《计算机科学》 CSCD 北大核心 1999年第10期49-52,共4页
1.引言在信息化程度日益提高的今天,半结构化信息已遍及社会的各个领域。例如,网际网(World WideWeb,又称WWW)已成为一个巨大的信息源,然而WWW上的信息并不能以一种通用的方式进行查询及操纵,大量的信息是以静态的HTML文本形式存储并只... 1.引言在信息化程度日益提高的今天,半结构化信息已遍及社会的各个领域。例如,网际网(World WideWeb,又称WWW)已成为一个巨大的信息源,然而WWW上的信息并不能以一种通用的方式进行查询及操纵,大量的信息是以静态的HTML文本形式存储并只能通过浏览器来浏览,因此如何有效利用这类信息显得尤为重要。 展开更多
关键词 网际网 数据抽取 知识发现 结构化数据
在线阅读 下载PDF
半结构化数据的模式研究综述 被引量:22
17
作者 王静 孟小峰 《计算机科学》 CSCD 北大核心 2001年第2期6-10,共5页
1 引言 近年来,Internet的飞速发展已经给人类的生活带来了翻天覆地的变化,网络迅速成为一种重要的信息传播和交换的手段.在Internet上,存在着大量的各种形式的数据,如文本文件,HTML文档,各种数据库等,如何快速准确地在网上查找所需的信... 1 引言 近年来,Internet的飞速发展已经给人类的生活带来了翻天覆地的变化,网络迅速成为一种重要的信息传播和交换的手段.在Internet上,存在着大量的各种形式的数据,如文本文件,HTML文档,各种数据库等,如何快速准确地在网上查找所需的信息,成为一个重要的问题.为了解决这个问题,各种搜索引擎维护了大量网站和网页的索引信息,主要采用关键字匹配的方法为用户提供查询服务,但关键字匹配技术存在一些很明显的缺陷,如返回的结果集过大,不能对语义内容和结构进行查询等,这些缺陷决定了搜索引擎所能提供的查询能力是极其有限的.为了更好地对Internet上的数据资源进行管理和查询,数据库界的研究人员开始考虑将数据库的概念和技术引入到该领域.数据库中已有的许多比较成熟的思想和技术,在WWW的新环境下,需要进行扩展和调整,以适应其特点. 展开更多
关键词 结构化数据 数据 数据模型 INTERNET
在线阅读 下载PDF
基于半结构化数据的新型产品结构模式研究 被引量:8
18
作者 董峥 徐晓飞 战德臣 《计算机集成制造系统-CIMS》 EI CSCD 北大核心 2003年第1期15-19,共5页
针对二维表父子关系存储结构的不足,提出基于XML半结构化数据的新型产品结构解决方案。设计了基于XML的可重用构件库,以提高产品设计效益;同时提出以踪迹树为核心的产品结构树动态联接思想,以平衡系统的存储与计算能力;给出了踪迹树向... 针对二维表父子关系存储结构的不足,提出基于XML半结构化数据的新型产品结构解决方案。设计了基于XML的可重用构件库,以提高产品设计效益;同时提出以踪迹树为核心的产品结构树动态联接思想,以平衡系统的存储与计算能力;给出了踪迹树向产品结构树的映射算法,并提出了可屏蔽系统复杂性的产品结构服务模型。 展开更多
关键词 结构化数据 产品结构模式 可扩展标记语言 踪迹树 产品数据管理 制造业
在线阅读 下载PDF
一种基于XML的半结构化数据存储方法 被引量:11
19
作者 吴共庆 陈恩红 《计算机工程》 CAS CSCD 北大核心 2004年第10期57-59,共3页
提出了一种基于XML存储半结构化数据的方法,设计并实现了相应存储与解析算法。鉴于OEM模型是一种图状模型,而通常的XML数据模型是树状模型,为此需解决图状模型数据映射为树状模型数据这一关键问题,利用XML元素和属性的语义信息可从... 提出了一种基于XML存储半结构化数据的方法,设计并实现了相应存储与解析算法。鉴于OEM模型是一种图状模型,而通常的XML数据模型是树状模型,为此需解决图状模型数据映射为树状模型数据这一关键问题,利用XML元素和属性的语义信息可从语义级别解决该问题。 展开更多
关键词 结构化数据 OEM模型 XML DOM
在线阅读 下载PDF
半结构化数据查询的处理和优化 被引量:12
20
作者 陈滢 王能斌 《软件学报》 EI CSCD 北大核心 1999年第8期883-890,共8页
半结构化数据的特点是数据的结构不规则或不完整,其模型都基于带根有向图,因此,查询处理过程本质上是对图的搜索过程.另外,通配路径使查询处理更加复杂化.文章详细介绍了异构数据源集成系统Versatile中采取的半结构数据OIM(model... 半结构化数据的特点是数据的结构不规则或不完整,其模型都基于带根有向图,因此,查询处理过程本质上是对图的搜索过程.另外,通配路径使查询处理更加复杂化.文章详细介绍了异构数据源集成系统Versatile中采取的半结构数据OIM(modelforobjectintegration)对象的查询和优化策略,包括查询计划的生成、路径扩展和路径索引、层次索引和基于数据源知识这3种查询优化方法.文章介绍的方法同样适用于其他的半结构化数据模型. 展开更多
关键词 结构化数据 查询处理 优化 数据结构
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部