-
题名融合位置信息和交互注意力的方面级情感分析
- 1
-
-
作者
李佳静
李盛
戴媛媛
孟涛
罗小清
闫宏飞
-
机构
中国矿业大学(北京)人工智能学院
南京网感至察信息科技有限公司
北京大学经济学院
北京大学计算机学院
-
出处
《计算机工程与应用》
北大核心
2025年第6期220-228,共9页
-
基金
国家自然科学基金(51674762)。
-
文摘
社交媒体和电商平台中涌现了大量的评论性文本,基于注意力的方面级情感分析方法已经被广泛用于对这些文本进行分析。现有的方法在实现方面词和上下文的交互注意时,存在没有利用上下文和方面词的相对位置关系,只关注方面词对上下文的影响导致语义交互不够充分,和将方面词作为一个整体进行计算等问题。提出一种融合相对位置信息的交互注意力的方面级情感分析模型。利用双向长短期记忆网络学习融合位置信息的上下文和方面词的语义特征,融入可学习的参数矩阵将上下文与方面词的语义特征进行交互学习,并使用交互注意力在字词粒度上分别计算方面词对上下文的影响以及上下文对方面词的影响,最后进行情感分类。在SemEval 2014 Task4基准数据集以及Twitter数据集上进行了多个实验,实验结果表明,提出的模型取得的性能优于比较方法。
-
关键词
方面级情感分析
位置信息
交互注意力
深度学习
-
Keywords
aspect-based sentiment analysis
position information
interactive attention
deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种面向证券信息披露长文档的表格分类方法
被引量:3
- 2
-
-
作者
罗小清
贾网
李佳静
闫宏飞
孟涛
冯科
-
机构
北京大学软件工程国家工程研究中心
中国矿业大学(北京)机电与信息工程学院
南京网感至察信息科技有限公司
北京大学计算机学院
北京大学经济学院
-
出处
《中文信息学报》
CSCD
北大核心
2023年第5期70-79,共10页
-
文摘
针对现有方法在获取证券信息披露长文档中的表格时准确度低的问题,该文提出了一种基于上下文特征融合的表格分类方法。首先对证券信息披露长文档中的表格和其上下文进行抽取和预处理,建立了表格分类的数据集;然后针对表格信息和上下文信息的不同特点,使用不同的多尺度卷积神经网络进行特征提取;进一步设计了一种针对表格分类更有效的特征融合方式。在构建的表格分类数据集上的分类结果相较于基线模型Micro-F_(1)值提升了0.37%,Macro-F_(1)值提升了1.24%,实验结果表明,该文提出的表格分类方法可较好地改善待分析表格获取效果。
-
关键词
证券信息披露长文档
表格分类
卷积神经网络
特征融合
-
Keywords
long financial disclosures
table classification
convolutional neural network
feature fusion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名TML:一种通用高效的文本挖掘语言
被引量:4
- 3
-
-
作者
李佳静
李晓明
孟涛
-
机构
中国矿业大学(北京)机电与信息工程学院
南京网感至察信息科技有限公司
北京大学信息科学技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2015年第3期553-560,共8页
-
基金
南京市321领军型科技创业人才计划基金项目2013年第2批
中央高校基本科研业务费专项资金项目(2009QJ15)
国家"八六三"高技术研究发展计划基金项目(2013AA064303)
-
文摘
实现了一种通用高效的文本挖掘编程语言,包括其编译器、运行虚拟机和图形开发环境.其工作方式是用户通过编写该语言的代码以定制抽取目标和抽取手段,然后将用户代码编译成字节码并进行优化,再将其与输入文本语义结构做匹配.该语言具有如下特点:1)提供了一种描述文本挖掘的范围、目标和手段的形式化方法,从而能通过编写该语言的代码来在不同应用领域做声明式文本挖掘;2)运行虚拟机以信息抽取技术为核心,高效地实现了多种常用文本挖掘技术,并将其组成一个文本分析流水线;3)通过一系列编译优化技术使得大量匹配指令能够充分并发执行,从而解决了该语言在处理海量规则和海量数据上的执行效率问题.实用案例说明了TML语言的描述能力以及它的实际应用情况.
-
关键词
文本挖掘
信息抽取
编程语言
编译器
虚拟机
-
Keywords
text mining
information extraction
programming language
compiler
virtual machine
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
-