-
题名基于双重多视角表示的目标级隐性情感分类
被引量:2
- 1
-
-
作者
崔蒙蒙
刘井平
阮彤
宋雨秋
杜渂
-
机构
华东理工大学信息科学与工程学院
迪爱斯信息技术股份有限公司
-
出处
《计算机工程》
CSCD
北大核心
2024年第1期79-90,共12页
-
基金
国家重点研发计划(2021YFC2701800,2021YFC2701801)
上海市促进产业高质量发展专项资金(2021-GZL-RGZN-01018)。
-
文摘
目标级隐性情感分类是自然语言处理中一项重要的情感分析任务。目前多数研究主要侧重于对上下文感知的目标进行建模,且建模信息源较为单一,难以充分捕获到目标词在文本中的隐性情感。针对该问题,提出基于双重多视角表示学习的目标级隐性情感分类方法,采用3种视角对目标和输入文本进行建模,分别设计文本自身的表示学习、图视角下的表示学习以及外部知识视角下的表示学习,并通过卷积神经网络将3种视角下的表示进行深度融合。此外,同时采用上述3种视角对目标进行表示学习,将文本的语义表示和目标的语义表示相结合,并输入到情感极性分类器中。在5个公共数据集上进行实验并与8个基线模型的对比结果表明,该方法性能达到了最优水平,在News MTSC-mt和News MTSC-rw隐性情感分析数据集上的F1_m值分别比最好模型提高1.0%和2.6%,在Laptop14、Restaurant14和Twitter显性情感分析数据集上的F1_m值分别比最好模型提高3.6%、1.4%和1.6%。
-
关键词
目标级隐性情感分类
自然语言处理
情感分析
双重多视角
表示学习
-
Keywords
target-level implicit sentiment classification
natural language processing
sentiment analysis
dual multiview
representation learning
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名面向远程监督命名实体识别的噪声检测
被引量:1
- 2
-
-
作者
王嘉诚
王凯
王昊奋
杜渂
何之栋
阮彤
刘井平
-
机构
华东理工大学信息科学与工程学院
同济大学设计与创意学院
迪爱斯信息技术股份有限公司
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第4期916-928,共13页
-
基金
上海市促进产业高质量发展专项资金(2021-GZL-RGZN-01018)
国家重点研发计划项目(2021YFC2701800,2021YFC2701801)
+1 种基金
之江实验室开放课题(2019ND0AB01)
上海市青年科技英才扬帆计划项目(23YF1409400)。
-
文摘
针对远程监督命名实体识别(named entity recognition,NER)任务,目前有许多基于强化学习的方法,利用强化学习的强大决策能力,对远程监督生成的自动标注数据进行噪声过滤.然而,这些方法所使用的策略网络模型架构都较简单,识别噪声能力较弱,且都以完整的句子样本为单位进行识别,导致句子中的部分正确信息被丢弃.为解决上述问题,提出了一种新的基于强化学习的方法,称为RLTL-DSNER,该方法可以从远程监督生成的带噪数据中,以单词级别识别正确实例,减少噪声实例对远程监督NER的负面影响.具体来说,在策略网络模型中引入了标签置信函数来准确识别实例.此外,提出了一种新颖的NER模型预训练策略,使其能为强化学习的初始训练提供精准的状态表示和有效的奖励值,引导其向正确的方向更新.在4个数据集上的实验结果验证了RLTL-DSNER方法的优越性,在NEWS数据集上,相较于现有最先进的方法,获得了4.28%的F1提升.
-
关键词
命名实体识别
远程监督
深度强化学习
噪声检测
预训练策略
-
Keywords
named entity recognition
distant supervision
deep reinforcement learning
noise detection
pre-training strategy
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名改进的CRNN模型在警情文本分类中的研究与应用
被引量:6
- 3
-
-
作者
王孟轩
张胜
王月
雷霆
杜渂
-
机构
电信科学技术第一研究所
迪爱斯信息技术股份有限公司
-
出处
《应用科学学报》
CAS
CSCD
北大核心
2020年第3期388-400,共13页
-
基金
工业和信息化部2018年大数据产业发展试点项目基金
上海市信息化发展专项资金(No.201901043,No.201901003)
+1 种基金
上海市人工智能创新发展专项基金(No.2018-RGZN-01013,No.2019-RGZN-01080)
上海市软件和集成电路产业发展专项资金(No.190234)资助。
-
文摘
针对某市公安110接处警文本描述进行案件分类的需求,参考现有文本分类方法在其他行业的应用,搭建了应用于警情描述的文本分类系统.通过论证常见分类网络适用场合及其优缺点,结合对警情数据中案件描述特征的分析,提出了基于改进卷积循环神经网络的模型,该模型优化了关键特征提取过程,弥补了现有模型短文本局部特征提取不足的缺陷.实验表明,该模型的准确率比常见分类模型提升了2%~3%,且能够有效保证数据局部特征的关联性,可以对案件描述所对应的案件类型进行准确分类,从而提高公安接处警平台的自动化效率.
-
关键词
警情文本处理
文本分类
卷积神经网络
双向长短时记忆
SelfAttention
-
Keywords
alarm text processing
text classification
conventional neural network(CNN)
bi-directional long short-term memory(BiLSTM)
Self Attention
-
分类号
P751.1
[交通运输工程—港口、海岸及近海工程]
-
-
题名基于BERT的警情文本命名实体识别
被引量:47
- 4
-
-
作者
王月
王孟轩
张胜
杜渂
-
机构
迪爱斯信息技术股份有限公司
电信科学技术第一研究所
-
出处
《计算机应用》
CSCD
北大核心
2020年第2期535-540,共6页
-
基金
上海市信息化发展(大数据发展)专项资金资助项目(201901043)
上海市产业转型升级专项资金(产业技术创新)资助项目(JJ-YJCX-01-18-3418)~~
-
文摘
针对警情领域关键实体信息难以识别的问题,提出一种基于BERT的神经网络模型BERT-BiLSTMAttention-CRF用于识别和提取相关命名实体,且针对不同案由设计了相应的实体标记注规范。该模型使用BERT预训练词向量代替传统Skip-gram和CBOW等方式训练的静态词向量,提升了词向量的表证能力,同时解决了中文语料采用字向量训练时词语边界的划分问题;还使用注意力机制改进经典的命名实体识别(NER)模型架构BiLSTM-CRF。BERT-BiLSTM-Attention-CRF模型在测试集上的准确率达91%,较CRF++的基准模型提高7%,也高于BiLSTM-CRF模型86%的准确率,其中相关人名、损失金额、处理方式等实体的F1值均高于0.87。
-
关键词
警情文本
命名实体识别
预训练语言模型
标注规范
词向量
-
Keywords
alarm text
Named Entity Recognition(NER)
pretraining language model
annotation specification
word vector
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于特征融合编解码的人群计数和密度估计
被引量:2
- 5
-
-
作者
邹敏
黄虹
杜渂
黄继风
-
机构
上海师范大学信息与机电工程学院
上海师范大学商学院
上海迪爱斯信息技术股份有限公司
-
出处
《计算机工程与设计》
北大核心
2023年第7期2110-2117,共8页
-
基金
上海市地方能力建设基金项目(19070502900)。
-
文摘
为解决人群计数任务中因人群大小不一导致的计数偏差问题,提出一种基于特征融合的编解码卷积神经网络模型(CFFNet)。前端网络模块对输入的人群图像自动编码,提取不同尺度的人群特征语义信息;后端网络模块对编码后的人群特征信息进行融合和解码,得到最终的估计密度图。将该模型在4个公开数据集上进行实验,并与历年的主要方法进行对比,实验结果表明,该模型在ShanghaiTech PartA、UCSD和Mall数据集上取得了更好的MAE指标,优于目前的这些算法,验证了模型对不同的人群尺度具有很好的适应性。
-
关键词
人群计数
卷积神经网络
编码器
人群尺度
解码器
特征融合
密度图
-
Keywords
crowd counting
convolutional neural network
encoder
crowd scale
decoder
feature fusion
density map
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语义和结构置信度的知识图谱质量校验方法
被引量:4
- 6
-
-
作者
叶琪
张一乾
阮彤
杜渂
-
机构
华东理工大学信息科学与工程学院
迪爱斯信息技术股份有限公司
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第5期48-55,共8页
-
基金
国家重点研发计划(2021YFC2701800,2021YFC2701801)。
-
文摘
知识图谱因其较强的表达能力和可解释性而被广泛应用于问答系统、信息检索等人工智能任务中,然而,在实际应用场景中大量使用自动化知识图谱构建技术会不可避免地引入噪声和冲突,从而对知识图谱下游应用的性能产生严重影响。为从知识图谱中检测出潜在的噪声、保存真实可信的三元组并为下游应用任务提供高质量的知识,提出一种基于语义与结构双重置信度的三元组评估模型。该模型由语义真实性评估器与结构真实性评估器构成,前者通过特定规则将三元组转换为句子序列,基于双向编码器表示变换模型度量语义真实性,后者通过表示学习模型获取实体及关系的向量表示,在知识表示、路径特征两个层面上度量结构真实性。在4个真实图谱数据集上的实验结果表明,所提模型的准确率、精确率、召回率、F1值等评估指标相较TransE-RFC、TransE-KNC、TransEXGB等模型提升3%~4%,其能够有效检测带噪声图谱数据集中的噪声错误同时最大程度地保留真实可信的知识。
-
关键词
知识图谱
质量校验
三元组置信度评估
语义真实性
结构置信度
-
Keywords
knowledge graph
quality verification
triple trustworthiness evaluation
semantic authenticity
structural trustworthiness
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于主成分回归算法的城市客流聚集风险预测
被引量:2
- 7
-
-
作者
王聚全
王伟
马慧民
杨博
杜渂
-
机构
迪爱斯信息技术股份有限公司
电信科学技术第一研究所有限公司
上海市公安局科技处
上海市北高新股份有限公司
-
出处
《应用科学学报》
CAS
CSCD
北大核心
2019年第4期529-540,共12页
-
基金
工业和信息化部2018年大数据产业发展试点示范项目基金
上海市人工智能创新发展专项基金(No.2018-RGZN-01013)
+2 种基金
上海市科技支撑计划项目基金(No.15dz1207400)
上海市信息化发展专项资金(No.201502001)
上海市科技创新行动计划项目基金(No.16511101000)资助
-
文摘
为解决特大城市突发公共事件客流聚集预警准确度不高的问题,采用主成分回归算法对固定区域内运营商提供的手机用户数据和真实客流数据进行回归拟合,并根据多种统计检验方法对模型进行检验与评估.通过主成分分析,有效克服了运营商提供的手机用户数据的多重共线性问题,充分利用了手机用户数据的各个维度信息,并且降低了算法的复杂度,有效提高了城市客流聚集风险预测的精准度.
-
关键词
主成分分析
多重共线性
统计检验
客流聚集
-
Keywords
principal component analysis
multicollinearity
statistical test
passenger flow aggregation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于5G的智慧应急指挥平台
被引量:13
- 8
-
-
作者
雷霆
孙骞
王孟轩
-
机构
电信科学技术第一研究所有限公司
迪爱斯信息技术股份有限公司
-
出处
《指挥与控制学报》
2020年第4期319-323,共5页
-
基金
上海市2019年度信息化发展专项资金(201901003)资助。
-
文摘
5G是一场技术革命,必将推动各产业领域产生重大变革.当前5G在智能制造、远程医疗、智能驾驶等领域均得到了一定程度的应用,但在城市应急管理领域还没有5G成熟的应用案例.提出的基于5G的智慧应急指挥平台,基于5G的万物互联、大带宽、低时延、边缘计算、网络切片等基础能力,建设一个感知泛在、反应灵敏、处置智能、信息共享、稳定可靠的应急指挥平台,切实提升城市风险防范和应急处置能力.
-
关键词
5G
边缘计算
网络切片
数字孪生
-
Keywords
5G
edge computing
network slicing
digital twin
-
分类号
D63
[政治法律—中外政治制度]
TN929.5
[电子电信—通信与信息系统]
-