期刊文献+
共找到63篇文章
< 1 2 4 >
每页显示 20 50 100
基于类内空间夹角约束和小样本采样的错误标签数据识别方法
1
作者 张亦翔 虞佳淼 +3 位作者 王慧芳 费正明 罗华峰 宣佳卓 《电力自动化设备》 北大核心 2025年第4期169-176,185,共9页
在电力专业领域的文本分类样本集中,常存在比例难以掌握的错误标签数据,导致基于神经网络训练的分类模型的准确率难以通过改进算法获得突破,亟需高效准确的高质量数据集构建方法。为此,引入加性角度边距惩罚,提出基于类内空间夹角约束... 在电力专业领域的文本分类样本集中,常存在比例难以掌握的错误标签数据,导致基于神经网络训练的分类模型的准确率难以通过改进算法获得突破,亟需高效准确的高质量数据集构建方法。为此,引入加性角度边距惩罚,提出基于类内空间夹角约束与小样本采样的错误标签识别方法,用于识别错误标签数据。该方法提出了特征向量类内空间夹角的概念,并将其作为模型预测结果置信度的评价标准,使得置信度具备较强的几何特性,增强了样本间的区分度;分析错误标签数据对特征向量类内空间夹角分布的影响,向类内空间夹角添加加性角度边距约束实现对错误标签数据的分离,并提出了置信度阈值的自动选取方法;提出小样本采样方法进一步提升错误标签数据的识别效果。分别采用公开的THUCNews样本集和电力现场作业文本数据集进行实验,结果验证了所提方法的有效性。 展开更多
关键词 电力领域文本分类 错误标签数据识别 类内空间夹角 加性角度边距惩罚 小样本采样
在线阅读 下载PDF
利用最近邻信息快速分类多标签数据 被引量:3
2
作者 乔健 田庆 《计算机工程与应用》 CSCD 北大核心 2011年第32期138-140,190,共4页
为克服ML-KNN在分类效率方面的局限性,提出了一种基于KNN的快速多标签数据分类算法FKMC,利用待分类实例的k个最近邻的局部信息进行排序分类。从已分类数据实例集中选择待分类数据实例的k个最近邻;根据每个最近邻拥有的标签数和每个标签... 为克服ML-KNN在分类效率方面的局限性,提出了一种基于KNN的快速多标签数据分类算法FKMC,利用待分类实例的k个最近邻的局部信息进行排序分类。从已分类数据实例集中选择待分类数据实例的k个最近邻;根据每个最近邻拥有的标签数和每个标签归属的最近邻数对待分类实例进行排序分类。仿真结果表明,最近邻的选择方法对分类器性能有显著的影响;在分类效果上FKMC与ML-KNN相当,有时甚至优于后者;而在分类效率上FKMC则显著优于ML-KNN。 展开更多
关键词 最近邻 快速分类 标签数据 快速多标签数据分类算法(FKMC)
在线阅读 下载PDF
电信行业客户行为标签数据对外经营模式研究 被引量:2
3
作者 姚晓辉 胡源 张宇翔 《电信科学》 北大核心 2013年第11期17-22,共6页
对电信行业客户行为标签进行了研究,分析了当前数据及信息系统现状,并结合国内外数据经营基础,重点剖析了数据分散、数据安全性及对外经营模式缺失等问题,提出了数据运营系统的构建方案,以实现数据统一汇聚、统一管控,开拓了对外经营服... 对电信行业客户行为标签进行了研究,分析了当前数据及信息系统现状,并结合国内外数据经营基础,重点剖析了数据分散、数据安全性及对外经营模式缺失等问题,提出了数据运营系统的构建方案,以实现数据统一汇聚、统一管控,开拓了对外经营服务局面。同时,以CTNET用户鉴权计费和超人MR项目为研究案例,充分论证了建立数据运营系统的可行性,证实了对提升电信运营商数据价值的重要意义。 展开更多
关键词 数据运营 数据安全 标签数据
在线阅读 下载PDF
一种适合弱标签数据集的图像语义标注方法 被引量:3
4
作者 田枫 沈旭昆 《软件学报》 EI CSCD 北大核心 2013年第10期2405-2418,共14页
真实环境下数据集中广泛存在着标签噪声问题,数据集的弱标签性已严重阻碍了图像语义标注的实用化进程.针对弱标签数据集中的标签不准确、不完整和语义分布失衡现象,提出了一种适用于弱标签数据集的图像语义标注方法.首先,在视觉内容与... 真实环境下数据集中广泛存在着标签噪声问题,数据集的弱标签性已严重阻碍了图像语义标注的实用化进程.针对弱标签数据集中的标签不准确、不完整和语义分布失衡现象,提出了一种适用于弱标签数据集的图像语义标注方法.首先,在视觉内容与标签语义的一致性约束、标签相关性约束和语义稀疏性约束下,通过直推式学习填充样本标签,构建样本的近似语义平衡邻域.鉴于邻域中存在噪声干扰,通过多标签语义嵌入的邻域最大边际学习获得距离测度和图像语义的一致性,使得近邻处于同一语义子空间.然后,以近邻为局部坐标基,通过邻域非负稀疏编码获得目标图像和近邻的部分相关性,并构建局部语义一致邻域.以邻域内的语义近邻为指导并结合语境相关信息,进行迭代式降噪与标签预测.实验结果表明了方法的有效性. 展开更多
关键词 图像语义标注 标签数据 测度学习 非负稀疏编码 语义近邻
在线阅读 下载PDF
基于支持向量数据描述的无标签数据多类分类 被引量:3
5
作者 朱帮助 林健 《智能系统学报》 2009年第2期131-136,共6页
为解决支持向量机(SVM)在处理无标签数据多类分类上的难题,提出了一种基于支持向量数据描述(SVDD)的无标签数据多类分类算法.该方法只需要建立一个分类模型就可以实现多类聚类分类.首先采用主成分分析作数据预处理,提取输入数据的统计... 为解决支持向量机(SVM)在处理无标签数据多类分类上的难题,提出了一种基于支持向量数据描述(SVDD)的无标签数据多类分类算法.该方法只需要建立一个分类模型就可以实现多类聚类分类.首先采用主成分分析作数据预处理,提取输入数据的统计特征值,得到主成分特征指标输入到SVDD分类器进行多类聚类分类.以珠三角地区物流中心城市分类评价为研究对象,实证结果表明,采用主成分分析降低了数据维度,有效浓缩了评估信息,SVDD分类器很好地区分了各中心城市,实现了多类分类的目的. 展开更多
关键词 多类分类 标签数据 支持向量数据描述 主成分分析
在线阅读 下载PDF
利用带无标签数据的双支持向量机对恒星光谱分类 被引量:2
6
作者 刘忠宝 雷宇飞 +3 位作者 宋文爱 张静 王杰 屠良平 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2019年第3期948-952,共5页
恒星光谱分类是天文技术与方法领域一直关注的热点问题之一。随着观测设备持续运行和不断改进,人类获得的光谱数量与日俱增。这些海量光谱为人工处理带来了极大挑战。鉴于此,研究人员开始关注数据挖掘算法,并尝试对这些光谱进行数据挖... 恒星光谱分类是天文技术与方法领域一直关注的热点问题之一。随着观测设备持续运行和不断改进,人类获得的光谱数量与日俱增。这些海量光谱为人工处理带来了极大挑战。鉴于此,研究人员开始关注数据挖掘算法,并尝试对这些光谱进行数据挖掘。近年来,神经网络、自组织映射、关联规则等数据挖掘方法广泛应用于恒星光谱分类。在这些方法中,支持向量机(SVM)以其强大的学习能力和高效的分类性能而备受推崇。SVM的基本思想是试图在两类样本之间找到一个最优分类面将两类分开。SVM在求解时,通过将其最优化问题转化为具有(QP)形式的凸问题,进而得到全局最优解。尽管该方法在实际应用中表现优良,但为了进一步提高其分类能力,有的学者提出双支持向量机(TSVM)。该方法通过构造两个非平行的分类面将两类分开,每一类靠近某个分类面,而远离另一个分类面。TSVM的计算效率较之传统SVM提高近4倍,因此,自TSVM提出后便受到研究人员的持续关注,并出现若干改进算法。在恒星光谱分类中,一般分类算法都是根据历史观测光谱来建立分类模型,其中最关键的是对光谱进行人工标注,这项工作极为繁琐,且容易犯错。如何利用已标记的光谱以及部分无标签的光谱来建立分类模型显得尤为重要。因此,提出带无标签数据的双支持向量机(TSVMUD)用以实现对恒星光谱智能分类的目的。该方法首先将光谱分为训练数据集和测试数据集两部分;然后,在训练集上进行学习,得到分类依据;最后利用分类依据对测试集上的光谱进行验证。继承了双支持向量机的优势,更重要的是,在训练集上学习分类模型过程中,不仅考虑有标记的训练样本,也考虑部分未标记的样本。一方面提高了学习效率,另一方面得到更优的分类模型。在SDSS DR8恒星光谱数据集上的比较实验表明,与支持向量机SVM、双支持向量机TSVM以及K近邻(KNN)等传统分类方法相比,带无标签数据的双支持向量机TSVMUD具有更优的分类能力。然而,该方法亦存在一定的局限性,其中一大难题是其无法处理海量光谱数据。该工作将借鉴海量数据随机采样思想,利用大数据处理技术,来对所提方法在大数据环境下的适应性展开进一步研究。 展开更多
关键词 恒星光谱 智能分类 双支持向量机 标签数据
在线阅读 下载PDF
基于部分标签数据和经验分布的命名实体识别 被引量:2
7
作者 宋晔璇 陈钊 武刚 《中文信息学报》 CSCD 北大核心 2021年第4期51-57,共7页
近年来,基于数据驱动的命名实体识别方法在新闻、生物医疗等领域上取得了很大的成功,然而许多领域缺少标签,且人工标注成本高昂。为了降低标注成本,该文尝试使用含有噪声的部分标签数据进行命名实体识别,提出了一种基于部分标签数据和... 近年来,基于数据驱动的命名实体识别方法在新闻、生物医疗等领域上取得了很大的成功,然而许多领域缺少标签,且人工标注成本高昂。为了降低标注成本,该文尝试使用含有噪声的部分标签数据进行命名实体识别,提出了一种基于部分标签数据和经验分布的方法。首先介绍基于部分标签数据的建模方法,然后引入标签经验分布的假设,通过将经验分布加入模型,有效降低了数据中的噪声。最后分别在植物病虫害数据集和优酷视频数据集上进行测试,结果表明,该方法优于其他方法。 展开更多
关键词 部分标签数据 经验分布 命名实体识别
在线阅读 下载PDF
融合地理标签数据的个性化信息服务应用研究 被引量:2
8
作者 陈氢 冯进杰 《现代情报》 CSSCI 2019年第10期24-31,共8页
[目的/意义]社交媒体网站的飞速发展为我们贡献了海量数据,通过对这些数据的进一步挖掘,可以实现个性化服务推荐。[方法/过程]本文利用地理标签中的丰富的元数据信息,结合基于密度的DBSCAN聚类算法和TF-IDF的统计方法,来提取和识别当地... [目的/意义]社交媒体网站的飞速发展为我们贡献了海量数据,通过对这些数据的进一步挖掘,可以实现个性化服务推荐。[方法/过程]本文利用地理标签中的丰富的元数据信息,结合基于密度的DBSCAN聚类算法和TF-IDF的统计方法,来提取和识别当地的景点区域,然后结合季节来计算景点的热度,最后运用基于混合过滤的推荐算法,为游客实现个性化旅游服务推荐。[结果/结论]通过Flickr网站爬取到的Geo-tagged数据集验证了本文提出方法的有效性。 展开更多
关键词 地理标签数据 DBSCAN聚类 旅游 个性化服务推荐
在线阅读 下载PDF
面向属性情感分类的无标签数据增强位置感知网络
9
作者 蒋慧凯 李晓戈 +2 位作者 安晓春 王甜甜 阮桁 《计算机工程》 CAS CSCD 北大核心 2023年第11期106-114,共9页
在现有的属性情感分类研究中,训练模型时大多完全依赖标签数据或需要引入文本级标签数据作为补充,很少关注无标签数据对模型性能的提升。提出一种基于无标签数据增强的位置感知网络(UDE-PAN)。引入交叉可视训练(CVT)的半监督训练算法,... 在现有的属性情感分类研究中,训练模型时大多完全依赖标签数据或需要引入文本级标签数据作为补充,很少关注无标签数据对模型性能的提升。提出一种基于无标签数据增强的位置感知网络(UDE-PAN)。引入交叉可视训练(CVT)的半监督训练算法,使模型能够同时利用无标签数据。CVT算法在标签数据和无标签数据中交替训练模型来提升表征学习能力,使模型在无标签数据中学习到额外知识。此外,基于语义相对距离(SRD)嵌入层和动态特征加权(CDW)层捕获属性词和上下文的关系:SRD嵌入层显式地将位置信息建模成特征向量,使上下文特征包含特定的属性信息;CDW层通过动态设置权重系数来感知上下文中与属性词更密切的部分。在SemEval14的2个公开数据集上的实验结果表明:UDE-PAN的准确率分别达到76.23%、82.47%,Macro-F1值分别达到72.13%、73.97%,优于对比的主流模型,验证了模型的有效性;借助CVT算法,无标签数据的训练对模型的准确率平均提升1%,Macro-F1平均提升2%,验证了无标签数据可以有效增强模型性能。 展开更多
关键词 属性情感分类 标签数据 位置感知 交叉视图训练 注意力机制
在线阅读 下载PDF
使用无标签数据的主成分初始化方法
10
作者 欧军 李玉鑑 沈成恺 《北京工业大学学报》 CAS CSCD 北大核心 2019年第7期654-661,共8页
为了解决初始化方法的不确定性以及有标签数据的不足,提出一种使用无标签数据对网络参数进行主成分初始化的方法,包括采样、主成分计算、初始化和重排卷积核4个步骤.首先,通过移动感受野区域对特征图进行采样,得到与特征图的所有感受野... 为了解决初始化方法的不确定性以及有标签数据的不足,提出一种使用无标签数据对网络参数进行主成分初始化的方法,包括采样、主成分计算、初始化和重排卷积核4个步骤.首先,通过移动感受野区域对特征图进行采样,得到与特征图的所有感受野对应的图像块并形成采样集合;然后,计算采样集合的主成分;最后,使用主成分初始化网络参数并重排卷积核,以便提高识别性能.在相同的网络结构和数据集上,即STL-10和CIFAR-10数据集,该方法比传统的初始化方法在识别准确率上提高了4%~20%.实验结果表明,该方法能够充分利用无标签数据初始化网络参数以取得显著的识别效果.此外,通过算法的性能评估,证明该方法明显优于传统的初始化方法. 展开更多
关键词 初始化方法 网络参数 标签数据 主成分 采样
在线阅读 下载PDF
基于节点映射与标签数据构建的链接预测方法 被引量:6
11
作者 周娅 杨邦 《计算机工程与设计》 北大核心 2020年第2期373-380,共8页
为改进基于局部或全局信息相似性度量方法中存在的无法全面提取网络结构信息的问题,以及基于网络表示学习的方法不能对链接的不存在性进行度量的问题,提出一种结合节点向量化方法与机器学习分类算法的Net2Vec-CLP框架。使用具有重启机... 为改进基于局部或全局信息相似性度量方法中存在的无法全面提取网络结构信息的问题,以及基于网络表示学习的方法不能对链接的不存在性进行度量的问题,提出一种结合节点向量化方法与机器学习分类算法的Net2Vec-CLP框架。使用具有重启机制的随机游走方法获得节点环境序列,将源网络信息转换成向量表示,在此基础上生成标签数据集,使用带sigmoid核映射方法的SVM模型进行二分类预测。实验结果表明,算法在Facebook数据集上较Node2Vec方法AUC值提高了2.47%,在其它数据集上也有可观测的优势。同时,结合二分类思想的方法,其能明确度量不存在链接关系的数据。 展开更多
关键词 链接预测 节点映射 网络表示学习 标签数据构建 分类算法
在线阅读 下载PDF
基于大数据标签的卷烟新品选点投放模型研究与应用
12
作者 梁雪霞 陈志 +6 位作者 邓超 陆斌 莫玉华 许良本 陈凯迪 李派禹 叶朝文 《中国烟草学报》 北大核心 2025年第3期142-147,共6页
针对传统的新品选点方法存在效率低、适应性差等问题,本文提出了一种基于大数据标签的新品选点投放模型。首先利用时空网格技术将分析区域划分为若干个商圈网格,从消费人群、卷烟产品及消费场所3个维度为每个零售终端建立数据标签。采... 针对传统的新品选点方法存在效率低、适应性差等问题,本文提出了一种基于大数据标签的新品选点投放模型。首先利用时空网格技术将分析区域划分为若干个商圈网格,从消费人群、卷烟产品及消费场所3个维度为每个零售终端建立数据标签。采用大数据分析技术构建新品选点投放模型,从不同维度分别对零售终端进行分析,最终将不同维度的评价指标转化为1个可量化的综合评价指标,以此为依据实现卷烟新品选点投放。分别对南宁市和玉林市的10款卷烟进行实证分析,结果显示南宁市和玉林市A类客户(评分排在前50%的零售终端)的平均订购率、平均订购量、平均需求量、平均订购次数分别是B类客户(评分排在后50%的零售终端)的3.24、29.87、6.41、8.22倍以及4.24、14.58、9.63、12.01倍,表明本模型可以为卷烟新品选点投放提供支持。 展开更多
关键词 数据标签 商圈方格 综合评价 选点投放
在线阅读 下载PDF
一种基于层次聚类的人力数据标签体系设计与实现
13
作者 明丽洪 马永一 +1 位作者 罗昌俊 付渲理 《兵工自动化》 北大核心 2024年第11期32-35,共4页
人力数据作为各业务领域数据的核心承载点,是连接人、物理实体、业务活动的关键点。通过设计人力数据标签体系,将人力数据属性抽象为图结构,通过层次聚类算法实现不同属性集的自动聚类和人才梯队划分,可按照专业领域方向、科研项目承担... 人力数据作为各业务领域数据的核心承载点,是连接人、物理实体、业务活动的关键点。通过设计人力数据标签体系,将人力数据属性抽象为图结构,通过层次聚类算法实现不同属性集的自动聚类和人才梯队划分,可按照专业领域方向、科研项目承担、科研成果获得、人才奖励等维度实现人力数据的抽取和灵活组合呈现,为人才梯队层级的培养规划与目标拟定奠定基础。 展开更多
关键词 人力资源 数据标签 层次聚类
在线阅读 下载PDF
一种符号型增量数据标签算法 被引量:3
14
作者 李艳红 李德玉 王素格 《计算机科学》 CSCD 北大核心 2015年第6期223-227,共5页
数据标签是一种提高增量数据聚类效率的简单而有效的方法。数据标签就是分配每个新增数据点到与之最相似的簇的过程。符号数据分析的难点之一在于缺少一种恰当的方法来定义数据点与数据簇之间的相似性。为此,将簇代表定义为簇中所有属... 数据标签是一种提高增量数据聚类效率的简单而有效的方法。数据标签就是分配每个新增数据点到与之最相似的簇的过程。符号数据分析的难点之一在于缺少一种恰当的方法来定义数据点与数据簇之间的相似性。为此,将簇代表定义为簇中所有属性的属性值及其在簇中的频率构成的列表,用信息熵的变化来定义"点-簇"不相似性。基于此不相似性度量,设计了一个符号型增量数据标签算法来分配无标记数据到恰当的簇。在公开数据集和文本语料上的对比实验表明,该数据标签算法不但数据标记精度高、时间开销小,而且有较好的可伸缩性。 展开更多
关键词 聚类 数据标签 增量数据 符号数据 信息熵
在线阅读 下载PDF
元数据标签Keywords在搜索引擎的应用现状研究 被引量:2
15
作者 杨志 《现代情报》 北大核心 2007年第9期134-137,共4页
随着网络信息量的急剧增长,人们习惯运用各种搜索引擎在海量互联网信息资源中来查找所需的信息,但查寻的结果往往不尽人意。本文通过利用不同主题范围的检索词在中英文搜索引擎检索的结果,对元数据标签Keywords在网页中的应用情况进行... 随着网络信息量的急剧增长,人们习惯运用各种搜索引擎在海量互联网信息资源中来查找所需的信息,但查寻的结果往往不尽人意。本文通过利用不同主题范围的检索词在中英文搜索引擎检索的结果,对元数据标签Keywords在网页中的应用情况进行了调查和分析,并就提高搜索引擎的检索效率提出自己的一些建议。 展开更多
关键词 数据 数据标签 搜索引擎 信息组织
在线阅读 下载PDF
基于多源数据聚合的神经网络侧信道攻击 被引量:1
16
作者 张润莲 潘兆轩 +2 位作者 李金林 武小年 韦永壮 《计算机研究与发展》 EI CSCD 北大核心 2024年第1期261-270,共10页
基于深度学习的侧信道攻击需要针对密码算法的每一个密钥字节建模并训练,数据采集和模型训练开销大.针对该问题,提出一种基于多源数据聚合的神经网络侧信道攻击方法.为筛选具有良好泛化效果的密钥字节泄露数据进行数据聚合,以AES-128算... 基于深度学习的侧信道攻击需要针对密码算法的每一个密钥字节建模并训练,数据采集和模型训练开销大.针对该问题,提出一种基于多源数据聚合的神经网络侧信道攻击方法.为筛选具有良好泛化效果的密钥字节泄露数据进行数据聚合,以AES-128算法为例,先基于16个密钥字节的泄露数据训练16个单密钥字节模型,分别实现对16个密钥字节的恢复;其次,设计一种打分机制评估各单密钥字节模型的泛化效果,通过得分排序筛选出对各密钥字节恢复效果最好的单密钥字节模型;最后,以筛选模型所对应的各密钥字节泄露数据集构建多源数据聚合模型进行训练,实现密钥恢复.实验测试结果表明,多源数据聚合模型具有良好的泛化效果,有效提高了密钥恢复的准确率和效率,降低了恢复密钥所需的能量迹数量,其在采集能量迹较少的情况下依然具有较好的攻击效果. 展开更多
关键词 侧信道攻击 神经网络 打分机制 数据聚合 数据标签
在线阅读 下载PDF
民族药分子教学模拟库中二维码数据化标签的建立
17
作者 李竣 张宇 +1 位作者 王德彬 杨光忠 《绿色科技》 2018年第21期258-260,共3页
使用二维码技术建立了民族药分子教学模拟库数据化标签,使之能够成为一种快捷的分类手段,方便随时查阅和学习。同时将首次将成熟的二维码技术引入到民族药物的检索中,解决了如何归纳和统计众多民族药中有机化合物涉及结构、立体构型、... 使用二维码技术建立了民族药分子教学模拟库数据化标签,使之能够成为一种快捷的分类手段,方便随时查阅和学习。同时将首次将成熟的二维码技术引入到民族药物的检索中,解决了如何归纳和统计众多民族药中有机化合物涉及结构、立体构型、图谱等数据信息问题,以减少样品与统计数据间的错误。 展开更多
关键词 民族药 分子库 数据标签 二维码
在线阅读 下载PDF
电力设备运行状态大数据标签体系与关键技术 被引量:25
18
作者 刘文君 董明 +4 位作者 徐元孚 韩强 王鑫 许雷 杜明 《中国电力》 CSCD 北大核心 2022年第1期126-132,共7页
随着大数据分析技术在电网中的快速发展与深度应用,数据标签技术提供了一种新的数据整合思路。电力设备大数据标签以灵活的方式从海量、离散的数据中实现对有用数据的快速识别和提取,在帮助调控人员实现对电力设备情况作出多维判断的同... 随着大数据分析技术在电网中的快速发展与深度应用,数据标签技术提供了一种新的数据整合思路。电力设备大数据标签以灵活的方式从海量、离散的数据中实现对有用数据的快速识别和提取,在帮助调控人员实现对电力设备情况作出多维判断的同时,为后续电力数据挖掘建模提供了依据。围绕电力设备基础信息、运行信息和状态信息3个维度,提出了一种多维度电力设备标签体系的构建方法,并通过聚类、故障概率计算、模糊推理3个层次丰富了数据标签的内涵,为实现电网监控智能化奠定基础。 展开更多
关键词 数据分析 电力设备 运行状态 数据标签
在线阅读 下载PDF
基于数据标签的智能电网监控与异常检测 被引量:6
19
作者 管荑 谢小川 +2 位作者 胡琳 尚鹏 黎明 《工程科学与技术》 EI CSCD 北大核心 2023年第3期243-254,共12页
智能电网是电网的智能化系统,是以输电网、各级电网协调发展为基础的通信信息支撑平台,是包括输变电、配电与电力调度的各电压等级的信息化、自动化和互动化等为特征的高度一体化系统。智能电网在电网监控的数据传输协议、计算与处理效... 智能电网是电网的智能化系统,是以输电网、各级电网协调发展为基础的通信信息支撑平台,是包括输变电、配电与电力调度的各电压等级的信息化、自动化和互动化等为特征的高度一体化系统。智能电网在电网监控的数据传输协议、计算与处理效率、各种信息与网络攻击和数据异常检测等方面仍存在不足。因此,本文利用物联网和数据标签技术,提出一种基于数据标签的智能电网监控架构和异常数据检测算法。首先,针对智能电网数据标签监控与异常检测的框架,设计了智能电网的监控数据标签与异常检测框架、数据标签化方法和监控大数据任务划分方法;然后,对异常检测流程、稀疏化与精简算法和检测算法进行设计,提出一种基于数据标签的数据精简和异常检测算法;最后,对实验和仿真进行设置,对时序数据维度数、异常数据量的算法准确率和召回率与参比算法进行了仿真与对比实验,并对不同测试数据量的本文算法与参比算法运行时间进行了对比实验。结果表明:本文设计的数据标签智能电网监控与异常数据检测算法与参比算法相比,当时序数据维度数递增时,其异常数据检测的准确率大于80%,召回率高于82%;当异常数据量增加时,本文算法的异常数据检测准确率和召回率较优越;比较不同测试数据量的运行时间发现,本文算法比参比算法的运行时间少2.0~3.0 s。 展开更多
关键词 异常检测 监控 智能电网 数据标签
在线阅读 下载PDF
基于大数据标签技术的电网监控智能分析方法 被引量:43
20
作者 叶康 冷喜武 +2 位作者 肖飞 李雄立 朱励程 《电测与仪表》 北大核心 2019年第4期75-79,共5页
在电网规模和数据量急速增长的环境下,传统存储的关系型数据库、数据集成及整合分析方式已经无法满足业务应用的需求,本文分析梳理了电网监控应用需求,引入数据标签技术来解决目前的技术瓶颈。通过对数据物理表进行梳理,将业务专家的经... 在电网规模和数据量急速增长的环境下,传统存储的关系型数据库、数据集成及整合分析方式已经无法满足业务应用的需求,本文分析梳理了电网监控应用需求,引入数据标签技术来解决目前的技术瓶颈。通过对数据物理表进行梳理,将业务专家的经验与数据物理表结构融合而成,数据标签能够提供统一业务化的标签给下游使用方,节省计算资源、便于全局优化的特点,基于数据标签开展电力业务数据辨识、数据治理、数据加工,相较于传统数据存储和治理模式,能够大幅提高电网监控业务智能化水平。 展开更多
关键词 电网监控 数据 数据标签 智能分析 数据辨识
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部