期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
融合位置信息和交互注意力的方面级情感分析
1
作者 李佳静 李盛 +3 位作者 戴媛媛 孟涛 罗小清 闫宏飞 《计算机工程与应用》 北大核心 2025年第6期220-228,共9页
社交媒体和电商平台中涌现了大量的评论性文本,基于注意力的方面级情感分析方法已经被广泛用于对这些文本进行分析。现有的方法在实现方面词和上下文的交互注意时,存在没有利用上下文和方面词的相对位置关系,只关注方面词对上下文的影... 社交媒体和电商平台中涌现了大量的评论性文本,基于注意力的方面级情感分析方法已经被广泛用于对这些文本进行分析。现有的方法在实现方面词和上下文的交互注意时,存在没有利用上下文和方面词的相对位置关系,只关注方面词对上下文的影响导致语义交互不够充分,和将方面词作为一个整体进行计算等问题。提出一种融合相对位置信息的交互注意力的方面级情感分析模型。利用双向长短期记忆网络学习融合位置信息的上下文和方面词的语义特征,融入可学习的参数矩阵将上下文与方面词的语义特征进行交互学习,并使用交互注意力在字词粒度上分别计算方面词对上下文的影响以及上下文对方面词的影响,最后进行情感分类。在SemEval 2014 Task4基准数据集以及Twitter数据集上进行了多个实验,实验结果表明,提出的模型取得的性能优于比较方法。 展开更多
关键词 方面级情感分析 位置信息 交互注意力 深度学习
在线阅读 下载PDF
一种面向证券信息披露长文档的表格分类方法 被引量:3
2
作者 罗小清 贾网 +3 位作者 李佳静 闫宏飞 孟涛 冯科 《中文信息学报》 CSCD 北大核心 2023年第5期70-79,共10页
针对现有方法在获取证券信息披露长文档中的表格时准确度低的问题,该文提出了一种基于上下文特征融合的表格分类方法。首先对证券信息披露长文档中的表格和其上下文进行抽取和预处理,建立了表格分类的数据集;然后针对表格信息和上下文... 针对现有方法在获取证券信息披露长文档中的表格时准确度低的问题,该文提出了一种基于上下文特征融合的表格分类方法。首先对证券信息披露长文档中的表格和其上下文进行抽取和预处理,建立了表格分类的数据集;然后针对表格信息和上下文信息的不同特点,使用不同的多尺度卷积神经网络进行特征提取;进一步设计了一种针对表格分类更有效的特征融合方式。在构建的表格分类数据集上的分类结果相较于基线模型Micro-F_(1)值提升了0.37%,Macro-F_(1)值提升了1.24%,实验结果表明,该文提出的表格分类方法可较好地改善待分析表格获取效果。 展开更多
关键词 证券信息披露长文档 表格分类 卷积神经网络 特征融合
在线阅读 下载PDF
TML:一种通用高效的文本挖掘语言 被引量:4
3
作者 李佳静 李晓明 孟涛 《计算机研究与发展》 EI CSCD 北大核心 2015年第3期553-560,共8页
实现了一种通用高效的文本挖掘编程语言,包括其编译器、运行虚拟机和图形开发环境.其工作方式是用户通过编写该语言的代码以定制抽取目标和抽取手段,然后将用户代码编译成字节码并进行优化,再将其与输入文本语义结构做匹配.该语言具有... 实现了一种通用高效的文本挖掘编程语言,包括其编译器、运行虚拟机和图形开发环境.其工作方式是用户通过编写该语言的代码以定制抽取目标和抽取手段,然后将用户代码编译成字节码并进行优化,再将其与输入文本语义结构做匹配.该语言具有如下特点:1)提供了一种描述文本挖掘的范围、目标和手段的形式化方法,从而能通过编写该语言的代码来在不同应用领域做声明式文本挖掘;2)运行虚拟机以信息抽取技术为核心,高效地实现了多种常用文本挖掘技术,并将其组成一个文本分析流水线;3)通过一系列编译优化技术使得大量匹配指令能够充分并发执行,从而解决了该语言在处理海量规则和海量数据上的执行效率问题.实用案例说明了TML语言的描述能力以及它的实际应用情况. 展开更多
关键词 文本挖掘 信息抽取 编程语言 编译器 虚拟机
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部