期刊文献+
共找到103篇文章
< 1 2 6 >
每页显示 20 50 100
非结构化数据处理技术在投资大数据审计中的应用研究 被引量:3
1
作者 郭红建 庄名驹 李嘉豪 《中国注册会计师》 北大核心 2025年第2期73-77,共5页
大数据环境下,投资审计的对象和内容都发生了根本性变化,以文本、图像、音频和视频为代表的非结构化数据逐渐成为了投资审计线索的主要来源,传统面向结构化数据的审计数据处理方法面临巨大挑战,严重影响了审计数据利用的质量和效率。本... 大数据环境下,投资审计的对象和内容都发生了根本性变化,以文本、图像、音频和视频为代表的非结构化数据逐渐成为了投资审计线索的主要来源,传统面向结构化数据的审计数据处理方法面临巨大挑战,严重影响了审计数据利用的质量和效率。本文基于投资审计领域数据利用现存问题,探究非结构化数据处理技术在投资大数据审计中的应用模式,以利于有效提高非结构化审计数据的采集、清洗、处理与分析挖掘的工作能力,助力投资审计技术方法创新,推进投资审计数字化转型与高质量发展。 展开更多
关键词 投资审计 数据审计 非结构化数据 数据处理技术
在线阅读 下载PDF
基于主体行为的非结构化数据模型 被引量:12
2
作者 韩晶 鄂海红 +1 位作者 宋美娜 宋俊德 《计算机工程与设计》 CSCD 北大核心 2013年第3期904-908,共5页
为满足用户的复杂检索需求,对用户行为特性进行分析,提出一种非结构化数据的星系数据模型。基于对文件系统中属性使用情况的统计结果,通过优化文件属性、增加用户行为特性属性等方法,形成非结构化数据属性集。在此基础上,使用一个数据... 为满足用户的复杂检索需求,对用户行为特性进行分析,提出一种非结构化数据的星系数据模型。基于对文件系统中属性使用情况的统计结果,通过优化文件属性、增加用户行为特性属性等方法,形成非结构化数据属性集。在此基础上,使用一个数据对象和基本类、内容类、特征类、行为类、环境类等5个属性类表示一个非结构化数据,构建非结构化数据模型。对模型进行了仿真分析,分析结果表明了模型有效且可行,具有轻量级、支持复杂检索、检索结果准确度高等优势,为大数据管理提供支撑。 展开更多
关键词 非结构化数据 数据管理 用户行为 数据模型 属性
在线阅读 下载PDF
用电信息采集系统非结构化数据管理设计 被引量:21
3
作者 祝恩国 刘宣 葛磊蛟 《电力系统及其自动化学报》 CSCD 北大核心 2016年第10期123-128,共6页
针对用电信息采集系统的非结构化数据具有海量、接入点多而分散等特点,本文提出一种用电信息采集系统非结构化数据管理设计方案。首先,对用电信息采集系统的非结构化数据进行分类。其次,提出了数据采集、数据存储和数据挖掘等3部分的管... 针对用电信息采集系统的非结构化数据具有海量、接入点多而分散等特点,本文提出一种用电信息采集系统非结构化数据管理设计方案。首先,对用电信息采集系统的非结构化数据进行分类。其次,提出了数据采集、数据存储和数据挖掘等3部分的管理设计方案:数据采集主要实现非结构化数据的收集;数据存储包括数据预处理和Hadoop两部分,完成海量数据的快速存储;数据挖掘按照文本、视频、音频3种类别分类处理,实现海量数据挖掘应用。该方案对用电信息采集系统的海量非结构化数据管理,有一定的参考价值。 展开更多
关键词 用电信息采集系统 非结构化数据 框架设计 海量数据 数据挖掘
在线阅读 下载PDF
面向海量非结构化数据的非关系型存储管理机制 被引量:8
4
作者 刘超 胡成玉 +2 位作者 姚宏 梁庆中 颜雪松 《计算机应用》 CSCD 北大核心 2016年第3期670-674,共5页
针对传统的关系数据存储系统性能不足、容错性差,无法适应海量非结构化数据管理的问题,提出一种高性能、高可用非关系型存储管理机制。首先,设计了良好的用户访问服务接口,通过高效的一致性哈希算法支持数据分发到多个存储节点;其次,采... 针对传统的关系数据存储系统性能不足、容错性差,无法适应海量非结构化数据管理的问题,提出一种高性能、高可用非关系型存储管理机制。首先,设计了良好的用户访问服务接口,通过高效的一致性哈希算法支持数据分发到多个存储节点;其次,采用可配置的数据副本机制改善存储系统的可用性;最后,提出查询故障处理机制,用以提升存储系统的容错性,避免节点失效导致服务中断问题。实验结果表明,在不同规模用户负载下,新的存储系统的并发访问请求能力和传统的文件系统、关系数据库相比,分别提升了30%和50%;同时,在合理响应时间内,故障状态下的存储系统的可用性损失小于14%。因此,该机制适用于海量非结构化数据的高效存储管理。 展开更多
关键词 非结构化数据 海量数据存储 关系型存储管理 一致性哈希 故障处理
在线阅读 下载PDF
MongoDB索引的用电信息非结构化数据存储方法 被引量:12
5
作者 徐英辉 祝恩国 +1 位作者 赵睿 杨挺 《电力系统及其自动化学报》 CSCD 北大核心 2017年第9期93-97,共5页
随着用电信息采集系统的健全,双向互动化功能的需求增加,系统所承载的用电信息由最初的规整结构化数据演变成结构化数据和多类型非结构化数据的混杂,且数据量也日益聚增。本文对用电信息采集系统的非结构化数据组成进行了梳理,从数据源... 随着用电信息采集系统的健全,双向互动化功能的需求增加,系统所承载的用电信息由最初的规整结构化数据演变成结构化数据和多类型非结构化数据的混杂,且数据量也日益聚增。本文对用电信息采集系统的非结构化数据组成进行了梳理,从数据源角度出发,按照客户用电信息数据和客户数据两大类别,分别对用电信息采集系统涉及的A、B、C、D、E 5类用户进行了非结构化数据特征分析。本文提出采用MongoDB索引Hadoop分布式文件系统的新型用电信息采集系统非结构化数据存储方法,实现对系统中混杂非结构化数据的分类存储和准确实时读写,为双向互动化功能提供了良好底层泛在数据支撑。 展开更多
关键词 非结构化数据 用电信息数据 HADOOP分布式文件系统 MONGODB
在线阅读 下载PDF
面向云存储的非结构化数据存取 被引量:50
6
作者 谢华成 陈向东 《计算机应用》 CSCD 北大核心 2012年第7期1924-1928,1942,共6页
非结构化数据呈爆炸态势增长,现有存储技术在I/O吞吐能力、可扩展性及易管理性等方面亟待改进。存储系统以云存储和可靠性理论为基础,建立了非结构化数据的分布式存储模型,并设计了可靠度函数。采用分布式关系数据库管理系统(RDBMS)作... 非结构化数据呈爆炸态势增长,现有存储技术在I/O吞吐能力、可扩展性及易管理性等方面亟待改进。存储系统以云存储和可靠性理论为基础,建立了非结构化数据的分布式存储模型,并设计了可靠度函数。采用分布式关系数据库管理系统(RDBMS)作为存储底层,将非结构化数据直接存储于数据表中,实现了非结构化数据和元数据的分离式存储和统一管理,进而提升了存储系统性能。相对于集中式存储,新系统具有较高的可用性。仿真结果显示,存储系统可靠度高且易于扩展。该分布式存储系统可应用于动态开放计算环境,提供效能较高的云存储服务。 展开更多
关键词 云存储 非结构化数据存储 可靠度函数 数据分离存储 存储仿真
在线阅读 下载PDF
E-learning非结构化数据管理系统的构建与实现 被引量:10
7
作者 韦琳 袁泉 +1 位作者 霍剑青 王晓蒲 《中国科学技术大学学报》 CAS CSCD 北大核心 2010年第6期623-628,共6页
针对e-learning教学系统非结构化数据管理中存在着文件系统和数据库记录的不一致性和非结构化文件信息不能直接提取的问题,提出了在数据库和文件系统相结合的管理模式基础上加入文件控制模块和元数据提取模块,构建了基于元数据的e-learn... 针对e-learning教学系统非结构化数据管理中存在着文件系统和数据库记录的不一致性和非结构化文件信息不能直接提取的问题,提出了在数据库和文件系统相结合的管理模式基础上加入文件控制模块和元数据提取模块,构建了基于元数据的e-learning教学非结构化数据管理系统,实现了对e-learning教学系统中非结构化文件的统一管理和信息直接提取,减少了人工输入,提高了效率. 展开更多
关键词 非结构化数据 E-LEARNING 数据
在线阅读 下载PDF
非结构化数据特征建模关键技术研究 被引量:6
8
作者 蔡宇翔 付婷 +2 位作者 倪时龙 苏江文 刘心 《电网与清洁能源》 北大核心 2017年第1期13-17,23,共6页
在智能电网大数据中,非结构化数据占据比例最大,且增速是结构化数据的10~50倍,已成为智能电网大数据处理的关键技术。针对非结构化数据存在数量巨大、模式滞后问题,基于现实数据存在的诸多特征,提出来非结构化数据特征模型建模。文中重... 在智能电网大数据中,非结构化数据占据比例最大,且增速是结构化数据的10~50倍,已成为智能电网大数据处理的关键技术。针对非结构化数据存在数量巨大、模式滞后问题,基于现实数据存在的诸多特征,提出来非结构化数据特征模型建模。文中重点论述了基于智能电网大数据的非结构化数据特征建模的关键技术,包括原始数据以及特征数据的存储、查询以及数据可视化、特征空间的选取等。 展开更多
关键词 智能电网大数据 非结构化数据 特征建模 关键技术
在线阅读 下载PDF
HotRank:热度敏感的非结构化数据检索排名算法 被引量:3
9
作者 韩晶 宋美娜 +1 位作者 鄂海红 宋俊德 《计算机应用研究》 CSCD 北大核心 2013年第5期1306-1308,共3页
为满足用户对非结构化数据检索的需求,分析用户对数据的操作行为,提出一种新型的数据热度敏感的非结构化数据检索排名算法HotRank。通过对数据操作情况(任务、访问次数、编辑时长等)进行日志记录,形成非结构化数据检索数据集。在此基础... 为满足用户对非结构化数据检索的需求,分析用户对数据的操作行为,提出一种新型的数据热度敏感的非结构化数据检索排名算法HotRank。通过对数据操作情况(任务、访问次数、编辑时长等)进行日志记录,形成非结构化数据检索数据集。在此基础上,定义数据的任务相似度和数据热度计算方法实现该算法。结合实例仿真,对算法进行评估,并将仿真结果与其他算法进行比较,证明了该排名算法的准确率优于其他算法。 展开更多
关键词 非结构化数据 检索 排名 热度
在线阅读 下载PDF
面向大数据的城市轨道交通非结构化数据管理 被引量:5
10
作者 顾伟华 黄天印 郭鹏 《城市轨道交通研究》 北大核心 2016年第11期77-80,共4页
针对城市轨道交通大数据,分析了城市轨道交通非结构化数据的来源、类型和产生方式,讨论了非结构化数据的获取方式和组织策略,结合上海城市轨道交通实际情况提出了适用的城市轨道交通非结构化数据存储架构。
关键词 城市轨道交通 非结构化数据 数据管理 存储架构
在线阅读 下载PDF
非结构化数据的ETL设计 被引量:3
11
作者 曹金山 张泽滨 《现代电子技术》 2011年第10期48-50,共3页
为了实现非结构化数据的ETL处理,分析了数据整合的发展现状和业务需求,描述了目前国际流行的公共仓库元模型(CWM)以及在ETL实现中的作用,详细分析了结构化数据和非结构化数据的不同特点。针对两种数据的差异,提出了解决非结构化数据的... 为了实现非结构化数据的ETL处理,分析了数据整合的发展现状和业务需求,描述了目前国际流行的公共仓库元模型(CWM)以及在ETL实现中的作用,详细分析了结构化数据和非结构化数据的不同特点。针对两种数据的差异,提出了解决非结构化数据的属性提取和数据打包的方法,为非结构化数据形成元数据奠定了基础,从而实现了非结构化数据的ETL设计,设计完全满足标准的数据整合要求。 展开更多
关键词 非结构化数据 结构化数据 CWM ETL
在线阅读 下载PDF
大数据环境下微信公众平台非结构化数据融合研究 被引量:8
12
作者 郭春霞 《现代情报》 CSSCI 北大核心 2015年第8期141-143,150,共4页
微信公众平台具有开源、发布及时的特点,目前它已经成为各机构发布信息的重要渠道。但这类数据又具有非结构化、无语义描述的特点,如何将微信公众平台从非结构化数据转化为可分析、判断的结构化数据,成为一个亟须解决的问题。针对该问题... 微信公众平台具有开源、发布及时的特点,目前它已经成为各机构发布信息的重要渠道。但这类数据又具有非结构化、无语义描述的特点,如何将微信公众平台从非结构化数据转化为可分析、判断的结构化数据,成为一个亟须解决的问题。针对该问题,本文提出一个对微信公众平台结构化数据监测的层次体系。这一方法将通过数据融合方式,从平台资源中抽取数据,构建结构化数据库,进行权重比较,判断情报价值,进而实现对研究领域的态势监测。 展开更多
关键词 微信公众平台 非结构化数据 同型异源数据 异型异源数据 同型同源数据 数据融合 态势监测
在线阅读 下载PDF
基于非结构化数据中台的高校档案数字化转型路径探索 被引量:13
13
作者 李娜 《中国档案》 北大核心 2022年第12期64-66,共3页
近年来,随着以云计算、大数据和人工智能为代表的新一代信息技术的飞速发展和“互联网+”行动的推进,各行业都开始加快数字化转型进程,高校信息化建设也从以“管理信息系统、统一门户”为代表的数据管理、数据整合阶段全面迈向以“流程... 近年来,随着以云计算、大数据和人工智能为代表的新一代信息技术的飞速发展和“互联网+”行动的推进,各行业都开始加快数字化转型进程,高校信息化建设也从以“管理信息系统、统一门户”为代表的数据管理、数据整合阶段全面迈向以“流程再造、数据治理”为代表的信息协同、知识共享阶段,信息技术与教育教学主体功能深入融合. 展开更多
关键词 非结构化数据 管理信息系统 数据治理 数据整合 统一门户 人工智能 数据管理 云计算
在线阅读 下载PDF
地质非结构化数据研究战略——以JPG图件为例 被引量:1
14
作者 崔宁 陈建平 《地质通报》 CAS CSCD 北大核心 2015年第7期1365-1368,共4页
从大数据时代背景出发,提出研究地质非结构化数据的战略意义。通过分析地质数据的特点,发现其大数据性。以JPG图件为例,展开国内外研究现状分析和行业应用分析。最后通过分析地质JPG图件数据的使用情况,提出地质JPG图件数据战略规划。
关键词 数据时代 非结构化数据 JPG图件 战略规划
在线阅读 下载PDF
非结构化数据的可视化编辑系统 被引量:3
15
作者 戴弘宁 文贵华 +1 位作者 丁月华 范崇贵 《计算机应用研究》 CSCD 北大核心 2003年第6期75-76,共2页
在创新计算中碰到大量的非结构化数据,采用超图模型实现非结构化数据在计算机中的存储与表示,并实现了一个非结构化数据的编辑系统,通过图形界面,用户可以交互式的编辑非结构化数据。
关键词 非结构化数据 超图 创新设计 可视化
在线阅读 下载PDF
基于非结构化数据的LLE-WOA-LSSVR碳价格组合预测模型 被引量:6
16
作者 周熠烜 陈华友 +1 位作者 周礼刚 朱家明 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2022年第4期570-576,共7页
在传统的组合预测模型中,利用的数据大多为结构化数据,然而在网络环境下,非结构化数据广泛存在,因此充分利用非结构化数据所提供的有效信息是预测中要解决的关键问题之一。针对上述问题,文章构建了基于非结构化数据的局部线性嵌入和鲸... 在传统的组合预测模型中,利用的数据大多为结构化数据,然而在网络环境下,非结构化数据广泛存在,因此充分利用非结构化数据所提供的有效信息是预测中要解决的关键问题之一。针对上述问题,文章构建了基于非结构化数据的局部线性嵌入和鲸鱼优化算法的最小二乘支持向量回归(locally linear embedding-whale optimization algorithm-least squares support vector regression,LLE-WOA-LSSVR)碳价格组合预测模型,通过LLE算法对非结构化的高维数据进行降维处理,并利用LSSVR进行预测。考虑到LSSVR模型中参数的选取会对预测结果产生影响,引入WOA算法优化模型中的参数。碳价格预测的实例结果表明,LLE-WOA-LSSVR预测模型可行且有效。 展开更多
关键词 非结构化数据 局部线性嵌入(LLE)算法 最小二乘支持向量回归(LSSVR) 鲸鱼优化算法(WOA) 组合预测
在线阅读 下载PDF
面向文本非结构化数据的输变电系统故障诊断方法 被引量:13
17
作者 黄良 王佳丽 +3 位作者 赵立进 吕黔苏 杨涛 林刚 《电力科学与技术学报》 CAS 北大核心 2017年第3期153-161,共9页
从非结构化数据中提取信息,有效诊断输电系统故障对于精确确定设备的运行状态具有重要意义。提出基于深度学习网络的输变电系统故障诊断方法;面向非结构化数据处理问题,提出非结构化数据特征提取、深度神经网络构建、深度神经网络训练... 从非结构化数据中提取信息,有效诊断输电系统故障对于精确确定设备的运行状态具有重要意义。提出基于深度学习网络的输变电系统故障诊断方法;面向非结构化数据处理问题,提出非结构化数据特征提取、深度神经网络构建、深度神经网络训练、故障诊断等一系列深度学习处理方式;构建并改进循环神经网络RNN,将长短时记忆模型(LSTM)添加到神经网络中的记忆单元,并提出相应的神经网络训练策略。以南方电网故障巡检报告作为数据源,仿真分析结果验证了该方法的有效性。 展开更多
关键词 输变电系统 故障诊断 非结构化数据 深度学习
在线阅读 下载PDF
智能电网中非结构化数据可视化技术研究 被引量:10
18
作者 付婷 蔡宇翔 +2 位作者 李宏发 周晟 张垚 《电网与清洁能源》 2019年第1期44-48,61,共6页
非结构化数据大量存在于智能电网的大数据中,其增长速度是结构化数据的25倍。然而,非结构化数据缺乏连续性,数据信息量大,不利于系统数据的可视化处理和分析。为了有效解决此问题,文章针对智能电网的实际需求,总结非结构化数据可视化处... 非结构化数据大量存在于智能电网的大数据中,其增长速度是结构化数据的25倍。然而,非结构化数据缺乏连续性,数据信息量大,不利于系统数据的可视化处理和分析。为了有效解决此问题,文章针对智能电网的实际需求,总结非结构化数据可视化处理存在的问题,利用节点链接技术获取数据、Hbase技术存储数据、分割式技术处理数据、四面体技术进行标识、建立Map Reduce检索模型,并进行显示程序编辑,旨在对智能电网的性能进行优化,从而解决智能电网中非结构化数据可视化难的问题,以及海量数据难以进行批量化处理的问题。 展开更多
关键词 智能电网 非结构化数据 可视化技术
在线阅读 下载PDF
微服务下DRC非结构化数据注册引擎设计 被引量:3
19
作者 黄安琪 杨文晖 苗放 《计算机工程与设计》 北大核心 2022年第12期3570-3579,共10页
为更好解决非结构化数据注册的问题,采用面向数据的体系架构(DOA)的思想和相关技术,结合DOA的数据注册中心(DRC)与微服务设计理念,设计并实现一个基于微服务的非结构化数据注册引擎,实现非结构化数据的自动注册与实时监听。实验结果表明... 为更好解决非结构化数据注册的问题,采用面向数据的体系架构(DOA)的思想和相关技术,结合DOA的数据注册中心(DRC)与微服务设计理念,设计并实现一个基于微服务的非结构化数据注册引擎,实现非结构化数据的自动注册与实时监听。实验结果表明,注册引擎能够实现零重复注册且高效的将数据注册信息采集并写入DRC中,具有高扩展性、高稳定性等特点。 展开更多
关键词 数据 面向数据的体系架构 数据注册中心 微服务 非结构化数据 注册引擎
在线阅读 下载PDF
一种基于XML的非结构化数据转换方法 被引量:25
20
作者 杨晶 周双娥 《计算机科学》 CSCD 北大核心 2017年第B11期414-417,共4页
XML作为半结构化的语言,因其能预先定义标记等优势被普遍应用于非结构化到结构化信息的转换中。利用POI技术把网络上繁杂的非结构化数据转化为XML半结构化数据,把半结构化数据转化为结构化数据,使用户能够简便地查询所需信息。通过实验... XML作为半结构化的语言,因其能预先定义标记等优势被普遍应用于非结构化到结构化信息的转换中。利用POI技术把网络上繁杂的非结构化数据转化为XML半结构化数据,把半结构化数据转化为结构化数据,使用户能够简便地查询所需信息。通过实验对SAX,DOM的解析效率进行了对比,实验表明解析相同大小的XML文件,SAX比DOM效率更高,而且此种差距会随着XML文件的增大而逐渐增大。 展开更多
关键词 数据 非结构化数据 可扩展标记语言 文档解析技术
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部