期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
异构集群中非结构化大数据检测方法 被引量:1
1
作者 李亚红 龚喜平 冯庆华 《重庆理工大学学报(自然科学)》 CAS 北大核心 2020年第7期170-175,共6页
传统的非结构化大数据检测方法只分析数据的统计特征、缺少对其中模糊闭频繁项集特征的识别,易出现监测结果不理想的问题。为了提高对异构集群中非结构化大数据的检索识别能力,提出一种基于模糊闭频繁项集特征挖掘的异构集群中非结构化... 传统的非结构化大数据检测方法只分析数据的统计特征、缺少对其中模糊闭频繁项集特征的识别,易出现监测结果不理想的问题。为了提高对异构集群中非结构化大数据的检索识别能力,提出一种基于模糊闭频繁项集特征挖掘的异构集群中非结构化大数据检测方法。分析异构集群中非结构化大数据的统计特征信息,并采用大数据信息融合方法对其进行状态监测和特征识别,从中提取非结构化大数据的模糊闭频繁项集特征量;利用支持向量机模型对非结构化大数据检测进行分类处理,根据不同大数据的分类属性进行自动检测识别,提高对异构集群中非结构化大数据检测的准确率和监测过程抗干扰能力。实验结果表明:采用该方法对异构集群中非结构化大数据检测的准确性和检测精度较高,具有很强的应用优势。 展开更多
关键词 异构集群 非结构化大数据 检测识别 特征提取 模糊闭频繁项集特征量
在线阅读 下载PDF
非结构化大数据云存储稳定性优化评定--评《大数据技术原理与应用》 被引量:2
2
作者 雷振江 《现代雷达》 CSCD 北大核心 2021年第2期I0016-I0016,共1页
非结构化数据作为与结构化数据相对的一种数据,存在数据本身与预定义数据模型不匹配,用数据库的二维逻辑难以表述的现象。换而言之,即这种数据存在结构是不规则或者不完整的。然而非结构数据也是公众日常生活中接触最多的数据类型,比如... 非结构化数据作为与结构化数据相对的一种数据,存在数据本身与预定义数据模型不匹配,用数据库的二维逻辑难以表述的现象。换而言之,即这种数据存在结构是不规则或者不完整的。然而非结构数据也是公众日常生活中接触最多的数据类型,比如办公文档、文本、报表、图像、音频、视频信息等等都是非结构数据。随着人们的日常生活以及工作中对于非结构数据的运用日趋频繁,接触愈发紧密,对非结构化大数据存储也提出了更高的要求。只有能保证数据存储的稳定了,才能够让公众对于大数据的创建以及应用加工提供保障。特别是云存储技术的发展,进一步让公众摆脱了原先存储硬件不足的束缚,为非机构大数据的存储开辟了更广阔的空间。本文就将借用《大数据技术原理与应用》一书,对非结构化大数据云存储稳定性进行优化评定,深入发掘云存储带给公众的便捷以及可靠。 展开更多
关键词 非结构化大数据 结构化数据 结构数据 大数据技术 数据类型 定义数据 办公文档 视频信息
在线阅读 下载PDF
基于可伸缩l-多样性的大数据发布隐私保护 被引量:11
3
作者 邹劲松 李芳 《计算机应用研究》 CSCD 北大核心 2021年第2期564-566,571,共4页
针对非结构化大数据发布中的隐私保护问题,提出了一种基于改进的可伸缩l-多样性(improved scalable l-diversity,Im SLD)大数据发布隐私保护方法。该算法采用基于两阶段条件随机场的命名实体识别(named entity recognition,NER)方法将... 针对非结构化大数据发布中的隐私保护问题,提出了一种基于改进的可伸缩l-多样性(improved scalable l-diversity,Im SLD)大数据发布隐私保护方法。该算法采用基于两阶段条件随机场的命名实体识别(named entity recognition,NER)方法将非结构化数据表示为结构化形式,设计一种改进的可伸缩l-多样性算法来对表现良好的非结构化数据进行匿名化,实现保护非结构化大数据发布的隐私,通过Apache Pig实现Im SLD算法来使其具有可伸缩性。实验表明与MRA和SKA算法相比,改进的Im SLD算法在不同数据集上提供相同级别的隐私时信息损失均优于对比的另外两种算法。 展开更多
关键词 大数据发布隐私保护 l-多样性 K-匿名 非结构化大数据 命名实体识别
在线阅读 下载PDF
文本分析在金融研究中的应用:文献综述与使用范式
4
作者 尹振涛 王振 《农村金融研究》 北大核心 2024年第11期68-80,共13页
在当前大数据和人工智能时代,以文本为代表的非结构化数据引起了学者们的广泛关注,而这其中文本数据在社会科学尤其在金融研究中发挥着越来越重要的作用。文本分析通过研究文本的情感情绪、政策不确定性、语义相似性等非传统主题正创造... 在当前大数据和人工智能时代,以文本为代表的非结构化数据引起了学者们的广泛关注,而这其中文本数据在社会科学尤其在金融研究中发挥着越来越重要的作用。文本分析通过研究文本的情感情绪、政策不确定性、语义相似性等非传统主题正创造着新的金融研究范式。论文聚焦于文本分析在金融研究中的应用这一主题,通过梳理国内外相关文献,首先对文本数据在金融研究中的使用流程与范式进行了总结,详细描述了金融文本的获取方法、金融文本的处理方式、金融文本的表示模型以及金融文本指标的构建这四个关键流程;之后论文结合大语言模型盛行的背景重点分析了大语言模型在金融研究中的潜在应用,并探讨了大语言模型可能带来的风险和挑战,如数据隐私、模型偏见等问题;最后论文对文本分析在金融研究中的应用进行了总结,反思了当前学术界对文本分析的批判,并对大语言模型在金融研究中的使用进行了展望。 展开更多
关键词 文本分析 金融研究 非结构化大数据 深度学习 大语言模型
在线阅读 下载PDF
基于文本挖掘的专业人才技能需求分析——以电子商务专业为例 被引量:41
5
作者 詹川 《图书馆论坛》 CSSCI 北大核心 2017年第5期116-123,共8页
回顾近年来人才技能需求分析的相关研究,设计一个从非结构化招聘大数据中快速智能挖掘专业技能需求的分析系统。以电子商务专业为例,分别构建了该分析系统中的电商岗位体系、电商技能指标体系和电商技能词典。再利用该分析系统对采集的6... 回顾近年来人才技能需求分析的相关研究,设计一个从非结构化招聘大数据中快速智能挖掘专业技能需求的分析系统。以电子商务专业为例,分别构建了该分析系统中的电商岗位体系、电商技能指标体系和电商技能词典。再利用该分析系统对采集的66925条电商行业招聘信息进行文本挖掘,分析了电商各岗位的需求、技能整体需求和各个岗位特别需求的技能。通过对电商专业技能需求分析显示,该分析系统具有快速准确、扩展性强、适合非结构化大数据的特点。 展开更多
关键词 文本挖掘 技能 需求分析 非结构化大数据
在线阅读 下载PDF
基于网络外包的专业技能关联知识库构建 被引量:4
6
作者 马天翼 张朋柱 刘景方 《系统管理学报》 CSSCI CSCD 北大核心 2017年第6期1007-1014,1021,共9页
使用中文文本挖掘方法来分析中国高校网页中各专业培养方案和培养目标的非结构化数据集。以K-means文本聚类算法和聚类结果归纳的各专业类别的技能关键词为基础,在集成了所有专业领域的专有特征和专家审核并结合了频率计算方法后,定义... 使用中文文本挖掘方法来分析中国高校网页中各专业培养方案和培养目标的非结构化数据集。以K-means文本聚类算法和聚类结果归纳的各专业类别的技能关键词为基础,在集成了所有专业领域的专有特征和专家审核并结合了频率计算方法后,定义了技能指标与相应各个专业的重要性程度。最后,建立了专业和技能之间的关联知识库,为构建网络化创新外包人才技能模型建立了基础。通过实验评估发现,与基于基本中文语料库的分词方法相比较,在中文分词过程中引入专业专有特征的方法能够提供更加精确和合理的聚类结果。因此,本文提出的方法能够高效地构建专业技能关联知识库。 展开更多
关键词 非结构化大数据 技能结构模型 关联知识库 领域特征 文本聚类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部