题名 层次融合多元知识的命名实体识别框架——HTLR
1
作者
吕学强
王涛
游新冬
徐戈
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
福建省信息 处理与智能控制重点 实验室 (闽江学院)
出处
《计算机应用》
北大核心
2025年第1期40-47,共8页
基金
国家自然科学基金资助项目(62171043)
北京市自然科学基金资助项目(4212020)
+2 种基金
华能集团总部科技项目(HNKJ21-HF43)
中央引导地方项目(2020L3024)
北京市教育委员会研究与发展计划项目(KM202111232001)。
文摘
中文命名实体识别(NER)任务旨在抽取非结构化文本中包含的实体并给它们分配预定义的实体类别。针对大多数中文NER方法在上下文信息缺乏时的语义学习不足问题,提出一种层次融合多元知识的NER框架——HTLR(Chinese NER method based on Hierarchical Transformer fusing Lexicon and Radical),以通过分层次融合的多元知识来帮助模型学习更丰富、全面的上下文信息和语义信息。首先,通过发布的中文词汇表和词汇向量表识别语料中包含的潜在词汇并把它们向量化,同时通过优化后的位置编码建模词汇和相关字符的语义关系,以学习中文的词汇知识;其次,通过汉典网发布的基于汉字字形的编码将语料转换为相应的编码序列以代表字形信息,并提出RFECNN(Radical Feature Extraction-Convolutional Neural Network)模型来提取字形知识;最后,提出Hierarchical Transformer模型,其中由低层模块分别学习字符和词汇以及字符和字形的语义关系,并由高层模块进一步融合字符、词汇、字形等多元知识,从而帮助模型学习语义更丰富的字符表征。在Weibo、Resume、MSRA和OntoNotes4.0公开数据集进行了实验,与主流方法NFLAT(Non-Flat-LAttice Transformer for Chinese named entity recognition)的对比结果表明,所提方法的F1值在4个数据集上分别提升了9.43、0.75、1.76和6.45个百分点,达到最优水平。可见,多元语义知识、层次化融合、RFE-CNN结构和Hierarchical Transformer结构对学习丰富的语义知识及提高模型性能是有效的。
关键词
命名实体识别
自然语言处理
知识图谱构建
词汇增强
字形增强
Keywords
Named Entity Recognition(NER)
Natural Language Processing(NLP)
knowledge graph construction
lexicon enhancement
radical enhancement
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 面向联邦大语言模型训练的传输优化技术综述
被引量:3
2
作者
顿婧博
李卓
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
北京 信息 科技 大学 计算机学院
出处
《计算机科学》
北大核心
2025年第1期42-55,共14页
基金
北京市自然科学基金(4232024)
国家重点研发计划(2022YFF0604502)。
文摘
随着人工智能技术的快速发展,各类大型语言模型不断涌现.但是专用大语言模型的用户及数据集大多具有隐私性和安全性要求,数据安全隐私问题亟待解决.在此背景下,联邦大语言模型应运而生并得到越来越多的关注.由于大型语言模型庞大的数据量以及联邦学习的分布式架构,海量的参与节点与云服务器间进行大量的模型交换会产生较高的通信成本.为提升模型收敛速率,研究人员对面向联邦大语言模型训练的传输优化技术展开了研究.文章分析了联邦大语言模型所面临的挑战;综述了基于模型微调的传输优化方法、基于模型压缩的传输优化方法以及基于分布式并行处理的传输优化的优化问题;介绍了已有的开源联邦大语言模型以及所用到的传输优化技术,并对未来研究方向进行了展望.
关键词
联邦学习
大语言模型
传输优化
通信开销
模型压缩
Keywords
Federated learning
Large language models
Transmission optimization
Communication overhead
Model compression
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 基于声誉机制的网络编码抗污染攻击方案
被引量:1
3
作者
王铁峰
蔡英
张玉洁
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
信息 安全国家重点 实验室 (中国科学院信息 工程研究所)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2016年第11期2491-2499,共9页
基金
国家自然科学基金面上项目(61373038
61672106)
+1 种基金
网络文化与数字传播北京市重点实验室开放课题(ICDD201408)
北京市教育委员会科技发展计划项目(KM201611232013)~~
文摘
网络编码在提高网络吞吐量方面有很大的优势,但是它极易受到污染攻击.目前针对此问题的多数解决方案都是针对有中心机制的网络.针对无中心机制的移动自组织网络,考虑移动自组网中节点的移动性和无固定的可信任第三方中心机制,结合已有的声誉机制研究,提出一种基于声誉机制的抗污染攻击方案对抗网络编码中的污染攻击.该方案采用对污染攻击进行检测和定位,在检测污染攻击存在的情况下,通过声誉机制对恶意节点进行定位,从而达到抗污染攻击的目的.通过实验仿真,与已有的方案进行比较,实验结果表明:针对无中心机制的方案在包的接收成功率上有一定提高,并且在多个恶意节点存在的情况下依然可以准确定位出恶意节点并将其隔离.
关键词
污染攻击
网络编码
声誉机制
无线网络
安全
Keywords
pollution attack
network coding
reputation mechanism
wireless networks
security
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 能耗约束下分层联邦学习模型质量优化的节点协作机制
4
作者
范亚州
李卓
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
北京 信息 科技 大学 计算机学院
出处
《计算机应用》
北大核心
2025年第5期1589-1594,共6页
基金
国家重点研发计划项目(2022YFF0604502)
北京市自然科学基金资助项目(4232024)。
文摘
边缘生成的大量数据可以通过联邦学习(FL)的方式训练全局模型,因此边缘计算与联邦学习的结合已成为降低网络能耗的关键技术。在分层联邦学习(HFL)中,边缘设备的局部数据量和数据质量的差异会直接影响HFL全局模型的质量。为此,提出一种传输能量约束下的节点协作算法(NCATTECC)解决传输能耗限制下全局模型质量最优化问题,证明了该问题是一个NP-hard(Non-deterministic Polynomial-hard)问题,同时证明了所提算法具有(1-1/√e)的近似比例。具体而言,通过协作,可以在不超过传输能耗限制的情况下,让更多的优质节点参与训练。在广泛使用的CIFAR-10、FashionMNIST数据集上的仿真实验结果表明,所提算法对所选节点进行训练,得到的模型准确率比FedAvg(Federated Averaging)和Fed-CBS(Federated Class-balanced Sampling)分别高出4.47%、6.64%和3.47%、4.58%。
关键词
分层联邦学习
端到端通信
节点协作
模型质量优化
能耗限制
Keywords
Hierarchical Federated Learning(HFL)
Device-to-Device(D2D)communication
node cooperation
model quality optimization
energy consumption limit
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 面向微博影响力的社交网络特征分析
被引量:5
5
作者
吕非非
徐雅斌
李卓
武装
机构
北京 信息 科技 大学 计算机学院
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
出处
《计算机应用》
CSCD
北大核心
2013年第12期3359-3362,3418,共5页
基金
国家自然科学基金资助项目(60973107)
网络文化与数字传播北京市重点实验室资助项目(ICDD201106
+1 种基金
ICDD201207)
国家社会科学基金重大项目(12&ZD234)
文摘
社交网络的影响力与其自身的结构特征密切相关。基于新浪微博的数据,对用户的粉丝数、关注数的分布及这些特征之间的关系进行分析,发现用户的粉丝数、关注数、微博数都符合幂律分布;探讨了节点之间的距离特征,发现并证明了微博网络中存在着"小世界"现象;研究了节点之间的链接形成问题,发现链接的形成满足三元闭包原理。以上三方面研究结果,对于探索微博影响力同底层社交网络结构特征的关系、设计微博影响力控制机制具有重要的意义。
关键词
影响力
幂律分布
小世界
三元闭包
Keywords
influence
power law distribution
small-world
triple closure
分类号
TP393.094
[自动化与计算机技术—计算机应用技术]
题名 基于边缘计算的分支神经网络模型推断延迟优化
被引量:6
6
作者
樊琦
李卓
陈昕
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
北京 信息 科技 大学 计算机学院
出处
《计算机应用》
CSCD
北大核心
2020年第2期342-346,共5页
基金
国家自然科学基金资助项目(61502040,61872044)
北京市属高校高水平教师队伍建设支持计划青年拔尖人才培育计划资助项目(CIT&TCD201804055)
+1 种基金
北京信息科技大学“勤信人才”培养计划资助项目
网络文化与数字传播北京市重点实验室开放课题资助项目(ICDDXN001)~~
文摘
针对云服务器上深度神经网络(DNN)模型推断任务延迟过高的问题,提出基于边缘计算的分支神经网络部署模型。分析了边缘计算场景中深度神经网络的分布式部署问题,证明该问题是NP-难的。设计了一种基于分支定界思想的部署算法(DBB),选择合适的边缘计算节点部署模型以减少推断任务的延迟。设计并实现了选择节点退出(SNE)算法,为不同任务选择合适的边缘计算节点来退出推断任务。仿真实验结果表明,与在云端部署神经网络模型的方法相比,基于边缘计算的分支神经网络模型的推断延迟平均降低了36%。
关键词
边缘计算
分支神经网络
深度神经网络
推断延迟
部署问题
Keywords
edge computing
branchy neural network
Deep Neural Network(DNN)
inference delay
deployment problem
分类号
TP393.01
[自动化与计算机技术—计算机应用技术]
题名 融合词义信息的中文短语句法分析
被引量:1
7
作者
耿立飞
李红莲
吕学强
吴云芳
机构
北京 信息 科技 大学 信息 与通信工程学院
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
北京 大学 计算语言学研究所
出处
《计算机应用》
CSCD
北大核心
2014年第4期1109-1113,1154,共6页
基金
国家自然科学基金资助项目(61171159
61271304)
+1 种基金
北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)
北京信息科技大学网络文化与数字传播北京市重点实验室开放课题项目(ICDD201203)
文摘
针对目前融合词义信息的短语句法分析过程中,多义词词义消歧较差的问题,提出一种基于词性消歧的中文短语句法分析方法。首先构建具有词性信息的同义词字典;然后对训练集和测试集中的词语进行词义替换,利用多义词的词性区分其不同的词义。在宾州中文树库(CTB)的实验结果表明,正确率为80.30%,召回率为78.12%,F值为79.19%。相对于没有进行词性消歧的系统,该方法有效提高了短语句法分析的性能。
关键词
汉语句法分析
同义词词林
知网
一词多义
词义消歧
Keywords
Chinese parsing
TongYiCi CiLin
HowNet
polysemy
semantic disambiguation
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于区块链和PKI的身份认证技术研究
被引量:5
8
作者
李铭堃
马利民
王佳慧
张伟
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
北京 信息 科技 大学 计算机学院
国家信息 中心信息 与网络 安全部
出处
《信息安全研究》
CSCD
北大核心
2024年第2期148-155,共8页
基金
国家重点研发计划项目(2022YFC3320900)。
文摘
PKI是基于非对称密码算法和数字证书来实现身份认证和加密通信的安全体系,原理是基于信任锚的信任传递.该技术存在以下问题:CA中心唯一,存在单点故障;认证过程存在大量证书解析、签名验签、证书链校验等操作,认证流程繁琐.针对上述问题,基于长安链构建身份认证模型,提出基于长安链数字证书和公钥基础设施的身份认证方案,理论分析和实验数据表明,该方案减少了证书解析、签名验签等操作,简化认证流程,提高了认证效率.
关键词
长安链数字证书
长安链
证书解析
数字签名
签名值验证
身份认证
Keywords
chainmaker digital certificate
chainmaker
certificate parsing
digital signature
signature verification
identity authentication
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]
题名 面向煤矿机电设备领域的三元组抽取方法
9
作者
游新冬
问英姿
佘鑫鹏
吕学强
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
出处
《计算机应用》
CSCD
北大核心
2024年第7期2026-2033,共8页
基金
国家语委项目(ZDI145-10)
北京市自然科学基金资助项目(4212020)
华能集团总部科技项目(HNKJ21-HF43)。
文摘
针对机电设备领域相关语料匮乏、关系类型特征挖掘不充分以及文本包含重叠三元组的问题,提出一种融合提示学习与先验知识以迭代式对抗训练的三元组抽取方法TBPA(Triplet extraction Based on Prompt and Antagonistic training)。首先,利用BERT(Bidirectional Encoder Representations from Transformers)模型在自构语料库上进行微调,以获取输入文本的特征向量;接着,采用投影梯度下降(PGD)方法在嵌入层进行迭代式对抗训练,提高模型对干扰样本的抵御能力和对真实样本的泛化能力;然后,利用单层头尾指针网络识别出头实体,并结合提示学习模板获取头实体对应的领域先验特征,将字向量与Prompt模板中预测得到的提示向量相结合;最后,在分层标注框架下,使用单层头尾指针网络逐个识别预定义的所有关系类型所对应的尾实体。与基线模型CasRel相比,TBPA在精确率、召回率和F1值上分别提高了3.10、6.12、4.88个百分点。实验结果表明,TBPA在煤矿机电设备领域三元组抽取任务中具有一定的优势。
关键词
煤矿机电设备
三元组抽取
提示学习
迭代式对抗训练
自构语料库
Keywords
mine electromechanical equipment
triplet extraction
prompt learning
iterative adversarial training
selfconstructed corpora
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 基于突发词聚类的微博突发事件检测方法
被引量:33
10
作者
郭跇秀
吕学强
李卓
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
出处
《计算机应用》
CSCD
北大核心
2014年第2期486-490,505,共6页
基金
国家自然科学基金资助项目(61171159
61271304)
北京市教委科技发展计划重点项目暨北京市自然科学基金资助B类重点项目(KZ201311232037)
文摘
微博突发事件检测是网络舆情分析的重要分支,近年来已受到国内外学者的广泛关注。分析用户行为特征,提出一种用户影响力计算方法,并将其与微博文本特征、传播特征相结合,提出词语突发度概念作为突发词的判定标准,进而抽取突发词集;引入凝聚式层次聚类算法,对突发词集进行聚类,并筛选出合适的突发词类簇用以描述突发事件,从而实现微博突发事件检测。通过实验检测,结果是正确率为63.64%,召回率为87.5%,F值为0.74,表明该方法可以在大量微博数据中有效检测到突发事件。
关键词
突发事件
用户影响力
突发词
聚类
Keywords
bursty topic
users' influence
burst word
clustering
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
题名 光纤安防系统中振动信号的特征提取和识别
被引量:17
11
作者
邹柏贤
许少武
苗军
逯燕玲
机构
北京 联合大学 应用文理学院
北京 信息 科技 大学 计算机学院
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
出处
《计算机研究与发展》
EI
CSCD
北大核心
2019年第9期1859-1871,共13页
基金
国家自然科学基金项目(41671165,61650201)
北京市教委科技计划项目(KM201911232003)
+1 种基金
北京未来芯片技术高精尖创新中心科研基金项目(KYJJ2018004)
北京市属高校高水平教师队伍建设支持计划高水平创新团队建设计划项目(IDHT20180515)~~
文摘
利用光纤振动传感器可以实现分布式周界安防监测,进而实现自动报警.对周界安防监测信号的分析处理和识别受到业界关注.对光纤信号的特征提取和识别方法进行综述,这些特征提取方法通过对光纤振动信号的时域这个维度进行各种分解,从而提取各种信号的属性特征;对光纤振动信号的识别主要使用经验阈值、神经网络、支持向量机方法,目前这些方法对光纤入侵事件识别效果还不能令人满意.通过实验采集挖掘机挖掘、人工挖掘、汽车行驶、行人和自然环境噪声这5种入侵行为引起的光纤振动信号数据,并进行数据的3维图形可视化分析,提出一种安防监测信号在时域和空域这2个维度信息的特征提取方法;根据光纤振动入侵事件的重要程度分成4个阶段先后完成识别任务,采用2分类任务决策树模型和约束极速学习机算法识别入侵事件类型,提高了对各类事件的正确识别率.
关键词
入侵事件
实验样本
基于类间样本差向量的约束极速学习机
基于混合向量的约束极速学习机
识别率
Keywords
intrusion event
experimental sample
constrained difference extreme learning machine (CDELM)
constrained mixed extreme learning machine (CMELM)
recognition rate
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 面向移动群智感知的多任务分发算法
被引量:11
12
作者
徐哲
李卓
陈昕
机构
北京 信息 科技 大学 计算机学院
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
出处
《计算机应用》
CSCD
北大核心
2017年第1期18-23,47,共7页
基金
国家自然科学基金资助项目(61370065
61502040)
+2 种基金
北京市优秀人才培养资助青年骨干个人项目(2014000020124G099)
网络文化与数字传播北京市重点实验室资助项目(ICDD201406)
现代测控技术教育部重点实验室/机电系统测控北京市重点实验室资助项目(KF20151123205)~~
文摘
针对在移动群智感知中基于机会通信完成数据传输会消耗大量时间成本的问题,提出了一种基于中枢节点的多任务分发(HTA)算法。该算法利用节点在移动网络中社交关系属性不同的特点,通过中枢节点选择算法将部分节点作为中枢节点,并将其用于协助任务请求节点分发任务。在任务请求节点与中枢节点相遇时,同时给中枢节点本身和它的从属节点分配任务,并由中枢节点负责向从属节点分发任务与回收任务结果。基于The ONE模拟器进行实验,与在线任务分配(NTA)算法相比,HTA算法时间成本平均降低了24.9%,同时任务完成率平均提高150%。实验结果表明,HTA算法能够提高任务的完成速度,降低时间成本消耗。
关键词
移动群智感知
机会通信
多任务分发
社交
中枢节点
Keywords
mobile crowdsensing
opportunistic communication
multi-task assignment
social relationship
hub node
分类号
TP393.01
[自动化与计算机技术—计算机应用技术]
题名 融合BERT与标签语义注意力的文本多标签分类方法
被引量:18
13
作者
吕学强
彭郴
张乐
董志安
游新冬
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
出处
《计算机应用》
CSCD
北大核心
2022年第1期57-63,共7页
基金
北京市自然科学基金资助项目(4212020)
青海省藏文信息处理与机器翻译重点实验室/藏文信息处理教育部重点实验室开放课题基金资助项目(2019Z002)。
文摘
多标签文本分类(MLTC)是自然语言处理(NLP)领域的重要子课题之一。针对多个标签之间存在复杂关联性的问题,提出了一种融合BERT与标签语义注意力的MLTC方法TLA-BERT。首先,通过对自编码预训练模型进行微调,从而学习输入文本的上下文向量表示;然后,使用长短期记忆(LSTM)神经网络将标签进行单独编码;最后,利用注意力机制显性突出文本对每个标签的贡献,以预测多标签序列。实验结果表明,与基于序列生成模型(SGM)算法相比,所提出的方法在AAPD与RCV1-v2公开数据集上,F1值分别提高了2.8个百分点与1.5个百分点。
关键词
多标签分类
BERT
标签语义信息
双向长短期记忆神经网络
注意力机制
Keywords
multi-label classification
Bidirectional Encoder Representations from Transformers(BERT)
label semantic information
Bidirectional Long Short-Term Memory(BiLSTM)neural network
attention mechanism
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 基于改进K最近邻分类算法的不良网页并行识别
被引量:6
14
作者
徐雅斌
李卓
陈俊伊
机构
北京 信息 科技 大学 计算机学院
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
出处
《计算机应用》
CSCD
北大核心
2013年第12期3368-3371,3379,共5页
基金
国家社会科学基金重大项目(12&ZD234)
国家自然科学基金资助项目(60973107)
+1 种基金
网络文化与数字传播北京市重点实验室资助项目(ICDD201106
ICDD201207)
文摘
互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处理。对比实验结果表明,所采用的识别方法的识别准确率和识别效率都有较大的提高。
关键词
不良网页
文本分类
K最近邻分类算法
HADOOP
MAPREDUCE
Keywords
illegal Web page
text classification
K-Nearest Neighbors (KNN) classification algorithm
Hadoop
MapReduce
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 基于加权距离的机械设计图像异步检索方法
被引量:5
15
作者
方乃伟
吕学强
张丹
王弘蔚
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
北京 拓尔思信息 技术股份有限公司
出处
《计算机应用》
CSCD
北大核心
2013年第5期1406-1410,共5页
基金
国家自然科学基金资助项目(61271304)
北京市教委科技发展计划重点项目(KZ201311232037)
国家科技支撑计划项目(2011BAH11B03)
文摘
根据机械设计图像的形状特征,提出一种利用加权距离实现的多特征异步检索方法。首先利用机械设计图像的外接圆距离特征进行初步检索,再结合初步检索结果集的位置计算输入图像和初步检索结果集的加权Hu不变矩特征距离,并据此获得最终的检索结果。实验表明,与单一特征的检索方法相比,该方法在机械设计图像检索中有更高的查准率和查全率。
关键词
机械设计图像
外接圆距离
HU不变矩
加权距离
异步检索
Keywords
mechanical design image
circumcircle distance
Hu invariant moment
weighted distance
asynchronous retrieval
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 边缘计算支持下的移动群智感知本地差分隐私保护机制
被引量:9
16
作者
李卓
宋子晖
沈鑫
陈昕
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
北京 信息 科技 大学 计算机学院
出处
《计算机应用》
CSCD
北大核心
2021年第9期2678-2686,共9页
基金
国家自然科学基金资助项目(61872044)
北京市青年拔尖人才项目
+1 种基金
北京市青年拔尖人才培育计划项目(CIT&TCD201804055)
网络文化与数字传播北京市重点实验室开放课题。
文摘
针对移动群智感知(MCS)中在用户数据提交阶段的隐私保护困难和因隐私保护造成成本增加的问题,基于本地差分隐私(LDP)保护原理设计出用户提交数据属性联合隐私保护的CS-MVP算法和用户提交数据属性独立隐私保护的CS-MAP算法。首先,基于属性关系构建用户提交数据的隐私性模型和任务数据的可用性模型,利用CS-MVP和CS-MAP算法解决隐私性约束下的可用性最大化问题;并且在边缘计算支持的MCS场景中,构建用户提交数据隐私保护下的三层MCS架构。理论分析证明了两个算法分别在数据属性联合隐私约束下和数据属性独立隐私约束下的最优性。实验结果表明,在相同隐私预算和数据量下,相较于LoPub和PrivKV,基于CS-MVP和CS-MAP算法的用户提交数据恢复正确感知数据的准确率分别平均提高了26.94%、84.34%和66.24%、144.14%。
关键词
移动群智感知
本地差分隐私
边缘计算
数据可用性
隐私保护
Keywords
Mobile Crowd Sensing(MCS)
Local Differential Privacy(LDP)
edge computing
data availability
privacy protection
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 融合边特征与注意力的表格结构识别模型
被引量:3
17
作者
吕学强
张煜楠
韩晶
崔运鹏
李欢
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
农业农村部农业大数据重点 实验室 (中国农业科学院农业信息 研究所)
出处
《计算机应用》
CSCD
北大核心
2023年第3期752-758,共7页
基金
国家自然科学基金资助项目(62171043)。
文摘
针对现有方法在表格结构识别问题中存在的先验知识依赖、鲁棒性不足、表达能力不足等问题,提出一种新的融合边特征与注意力的表格结构识别模型——GEAN-TSR。首先,提出图边注意力网络(GEAN)并作为模型的主干网络,在边卷积结构的基础上引入并改进图注意力机制聚合图节点特征,解决图网络在特征提取过程中的信息损失的问题,提高图网络的表达能力;然后,引入边特征融合模块融合浅层图节点信息与图网络输出,增强图网络的局部信息提取能力与表达能力;最后,将门控循环单元(GRU)提取的图节点文本特征融入文本特征融合模块对边进行分类预测。在SciTSR-COMP数据集上的对比实验中,相较于目前最优的模型SEM,GEAN-TSR的召回率与F1值分别提升2.5与1.4个百分点。在消融实验中,GEAN-TSR采用特征融合模块后,所有指标都取得了最优值,验证了模块的有效性。实验结果表明,GEAN-TSR能够有效提升网络性能,更好地完成表格结构识别任务。
关键词
图神经网络
图注意力网络
特征融合
表格结构识别
表格解析
Keywords
graph neural network
graph attention network
feature fusion
table structure recognition
table parsing
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于KLT和HEVC的嵌入式高光谱图像实时压缩
被引量:1
18
作者
李卓
徐哲
陈昕
李淑琴
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
北京 信息 科技 大学 计算机学院
出处
《计算机应用》
CSCD
北大核心
2018年第8期2393-2397,2404,共6页
基金
国家自然科学基金资助项目(61502040)
北京市属高校高水平教师队伍建设支持计划青年拔尖人才培育计划资助项目(CIT&TCD201804055)
+1 种基金
网络文化与数字传播北京市重点实验室资助项目(ICDDXN001)
北京信息科技大学"勤信英才"培养计划资助项目~~
文摘
现有追求高压缩质量的高光谱图像压缩算法普遍存在计算复杂度高、离线式处理、嵌入式平台实现难度大等问题,目前很难得到实际应用。为解决以上问题,设计一种基于KLT和HEVC的嵌入式高光谱图像实时压缩方法。首先基于KLT去除谱间相关性,然后基于HEVC去除空间相关性并完成量化编码的过程。基于NVIDIA Jetson TX1平台,设计并实现了CPU和GPU异构并行压缩处理系统。利用真实数据集对所设计算法和所实现平台进行了性能及可行性验证。实验结果表明:在相同压缩比下,与离散小波变换(DWT)+JPEG2000算法相比,该系统明显提升了重建精度,在峰值信噪比(PSNR)方面平均提高了1.36 d B;同时,相比CPU,在GPU中进行KLT计算也至多可缩短33%的运行时间。
关键词
KLT
HEVC
高光谱
嵌入式系统
图像压缩
Keywords
KLT ( Karhunen-Loeve Transform)
HEVC ( High Efficiency Video Coding)
Hyper-spectral
embedded system
image compression
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于需求预测的PaaS平台资源分配方法
被引量:3
19
作者
徐雅斌
彭宏恩
机构
北京 信息 科技 大学 计算机学院
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
出处
《计算机应用》
CSCD
北大核心
2019年第6期1583-1588,共6页
基金
网络文化与数字传播北京市重点实验室项目(ICDDXN004)
信息网络安全公安部重点实验室开放课题资助项目(C18601)~~
文摘
针对缺乏PaaS平台下资源需求的有效预测与优化分配的问题,提出一种资源需求预测模型和分配方法。首先,根据PaaS平台中应用对资源需求的周期性来对资源序列进行切分,并在短期预测的基础上结合应用的多周期性特征,利用多元回归算法建立综合的预测模型。然后,基于MapReduce架构设计实现了一个Master-Slave模式的PaaS平台资源分配系统。最后,结合当前任务请求和资源需求预测结果进行资源分配。实验结果表明,采用该资源需求预测模型和分配方法后,相比于自回归模型和指数平滑算法,平均绝对百分比误差分别下降8.71个百分点和2.07个百分点,均方根误差分别下降2.01个百分点和0.46个百分点。所提预测模型的预测结果不仅误差小,与真实值的拟合程度也较高,而且利用较小的时间开销就可以获得较高的准确度。此外,使用该预测模型的PaaS平台的资源请求的平均等待时间有了明显的下降。
关键词
云计算
平台即服务
需求预测
资源分配
多元回归
Keywords
cloud computing
Platform-as-a-Service(PaaS)
demand forecasting
resource allocation
multiple regression
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于扩展射线法的三维模型检索
20
作者
姜阳
吕学强
李琳
施水才
机构
网络 文化与 数字 传播 北京市 重点 实验室 (北京 信息 科技 大学 )
北京 拓尔思信息 技术股份有限公司
出处
《计算机应用》
CSCD
北大核心
2013年第2期463-467,共5页
基金
国家自然科学基金资助项目(61171159)
北京市教委科技发展计划项目(KM201211232023)
国家科技支撑计划项目(2011BAH11B03)
文摘
针对原始射线法特征提取时间较长、仅利用三角形面片问题,提出一种基于不相交平面束原理的扩展射线法。从质心均匀散射出一组射线与三角形面片相交,利用射线确定的不相交平面束定位交点;根据交点、顶点到质心的距离,建立检索模型以改善三维模型的检索效果。利用普林斯顿大学三维模型库的10类模型作为实验数据,实验结果表明:与原始射线法对比,扩展射线法不仅提高了特征提取速度,而且提高了检索准确率。
关键词
三维模型检索
扩展射线法
折扣增益值
相似性度量
时间复杂度
Keywords
3D model retrieval
extended ray-based method
discounted cumulated gain
similarity measure
time complexity
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]