期刊文献+
共找到98篇文章
< 1 2 5 >
每页显示 20 50 100
基于异构用户知识融合的隐式情感分析研究 被引量:1
1
作者 廖健 张楷 +2 位作者 王素格 雷佳 张益阳 《中文信息学报》 北大核心 2025年第3期117-128,共12页
隐式情感分析因其缺乏显式情感线索的特性是情感分析领域的重要研究难点之一。传统的隐式情感分析方法通常针对隐式情感文本本身的信息进行建模,没有考虑隐式情感的主观差异性特征。该文提出了一种基于异构用户知识融合的隐式情感分析模... 隐式情感分析因其缺乏显式情感线索的特性是情感分析领域的重要研究难点之一。传统的隐式情感分析方法通常针对隐式情感文本本身的信息进行建模,没有考虑隐式情感的主观差异性特征。该文提出了一种基于异构用户知识融合的隐式情感分析模型HELENE,从用户数据中挖掘用户异构的内容知识、社会化属性知识以及社会化关系知识,基于图神经网络模型结合动态预训练模型分别从内、外部两个维度对用户进行建模;在此基础上与隐式情感文本语义信息进行融合学习,实现对隐式情感进行主观差异化建模。此外,该文构建了一个用户个性化通用情感分析语料库,涵盖了较为完整的文本内容信息、用户社会化属性信息和关系信息,可同时满足面向用户个性化建模的隐式或显式情感分析相关研究任务的需要。在所构建数据集上的实验结果显示,该文方法相比基线模型在用户个性化隐式情感分析任务上具有显著的提升效果。 展开更多
关键词 隐式情感分析 用户知识建模 异构知识融合
在线阅读 下载PDF
基于关系图卷积神经网络的跨句实体关系抽取
2
作者 陈千 关春祥 +1 位作者 郭鑫 王素格 《中文信息学报》 北大核心 2025年第7期62-71,共10页
相对于句子级关系抽取,涉及关系的实体存在于多个句子中的情况在实际场景中更常见。因此篇章级关系抽取逐渐成为近年来信息抽取领域的研究热点。为了充分利用上下文信息和篇章结构信息,该文采用实体嵌入表示和实体间的显式结构关系研究... 相对于句子级关系抽取,涉及关系的实体存在于多个句子中的情况在实际场景中更常见。因此篇章级关系抽取逐渐成为近年来信息抽取领域的研究热点。为了充分利用上下文信息和篇章结构信息,该文采用实体嵌入表示和实体间的显式结构关系研究跨句实体关系抽取。首先,对篇章进行编码和构图;进而,使用关系图卷积神经网络对图节点进行更新,并利用融合篇章全局信息的节点嵌入表示更新边嵌入表示;最后,该模型使用一种迭代算法完成边信息的推理,实现跨句实体关系抽取。实验结果表明,相比基线模型,在CDR和GDA数据集上的跨句实体关系抽取性能得到了显著提高。 展开更多
关键词 关系图卷积神经网络 跨句实体关系抽取 实体嵌入
在线阅读 下载PDF
基于高斯混合多层自编码器的情感漂移检测模型
3
作者 张文跃 李旸 +1 位作者 王素格 廖健 《软件学报》 北大核心 2025年第5期2064-2078,共15页
社交网络情感数据最为显著的特征是其动态性.针对群体文本情感漂移分析任务,提出一种高斯混合多层自编码器(GHVAE)用于情感漂移检测.GHVAE将高斯混合分布作为潜在分布的假设先验,对应潜在分布的多中心性质从而提高模型性能.此外,还对原... 社交网络情感数据最为显著的特征是其动态性.针对群体文本情感漂移分析任务,提出一种高斯混合多层自编码器(GHVAE)用于情感漂移检测.GHVAE将高斯混合分布作为潜在分布的假设先验,对应潜在分布的多中心性质从而提高模型性能.此外,还对原始HVAE模型内建的漂移度量算法进行改进,改善了高漂移值之间过于接近导致分类性能下降的问题.采用多项对照实验和消融实验用于验证GHVAE的性能,实验结果显示新模型的创新点为其漂移检测表现带来了提升. 展开更多
关键词 情感漂移 层次变分自编码器 情感元分布 漂移度量 高斯混合
在线阅读 下载PDF
基于分步协作融合表示的情感分类方法
4
作者 高龙 李旸 王素格 《计算机科学》 北大核心 2025年第9期313-319,共7页
多模态情感分析任务旨在通过各种异构模态(如语言、视频和音频)感知和理解人类的情感,但不同模态间存在着复杂的关联。现有的大多数方法将多个模态特征直接融合,忽略了不同步的模态融合表示在情感分析中的贡献不同。针对上述问题,提出... 多模态情感分析任务旨在通过各种异构模态(如语言、视频和音频)感知和理解人类的情感,但不同模态间存在着复杂的关联。现有的大多数方法将多个模态特征直接融合,忽略了不同步的模态融合表示在情感分析中的贡献不同。针对上述问题,提出了一种基于分步协作融合表示的情感分类方法。首先,利用降噪瓶颈模型对音视频中的噪声和冗余进行过滤,通过Transformer完成对音视频两种模态的交互融合,建立音视频融合的低级特征表示;进一步利用跨模态注意力机制,强化文本模态对音视频模态的低级融合表示,构建音视频融合的高级特征表示。其次,设计一个新颖的模态融合层将多级特征表示引入预训练模型T5中,建立以文本为中心的多模态融合表示。最后,将低级特征表示、高级特征表示以及以文本为中心的特征融合表示进行联合,实现了多模态数据的情感判别。在两个公开数据集CMU-MOSI和CMU-MOSEI上进行实验,结果表明所提出的方法相比已有基线模型ALMT在Acc-7指标上分别提高0.1和0.17,表明了分步协作融合表示能够提高多模态情感分类性能。 展开更多
关键词 多模态融合 情感分析 瓶颈机制 注意力机制 预训练模型
在线阅读 下载PDF
面向散文阅读理解简答题的多片段答案关键句抽取方法
5
作者 侯祺积 李旸 +2 位作者 王素格 何东欢 李书琪 《中文信息学报》 北大核心 2025年第6期67-76,共10页
机器阅读理解是自然语言处理领域中一个非常重要的研究方向,近年来发布了许多中文阅读理解任务的数据集,但散文数据集的构建工作还略显不足。该文从散文阅读理解简答题的角度,构建了散文阅读理解简答题答案关键句数据集。在散文阅读理... 机器阅读理解是自然语言处理领域中一个非常重要的研究方向,近年来发布了许多中文阅读理解任务的数据集,但散文数据集的构建工作还略显不足。该文从散文阅读理解简答题的角度,构建了散文阅读理解简答题答案关键句数据集。在散文阅读理解简答题中,散文文本较长,答案关键句分散在多个段落中,现有模型对长文本输入的底层设计存在局限性。为此,该文提出一种多片段答案关键句抽取方法。该方法融合词形匹配和词语语义相似度,构建了问题与句子的相似度计算模型;设计了分块处理策略,缓解了长文本输入信息缺失问题;构建了问题与文本的相关性判别模型,实现了多片段答案关键句抽取。在该文构建的数据集上与其他方法进行比较实验,实验结果表明,该方法性能优于其他对比方法。 展开更多
关键词 散文阅读理解 多片段抽取 关键句抽取 文本分块 相关性得分
在线阅读 下载PDF
基于交叉多头注意力的查询式文本摘要生成
6
作者 何东欢 李旸 王素格 《中文信息学报》 北大核心 2025年第7期138-147,共10页
生成是一项根据给定文档和查询,生成与查询相关摘要的任务。该文将查询式摘要生成任务转换为阅读理解任务,将文档与查询进行交互,建立了基于交叉多头注意力的Transformer架构的多源指针生成式摘要新模型。该模型通过BERT预训练模型,建... 生成是一项根据给定文档和查询,生成与查询相关摘要的任务。该文将查询式摘要生成任务转换为阅读理解任务,将文档与查询进行交互,建立了基于交叉多头注意力的Transformer架构的多源指针生成式摘要新模型。该模型通过BERT预训练模型,建立文档、查询和摘要的嵌入表示,再在Transformer架构中,通过交叉的多头注意力机制,建立查询与文档的交互深层语义表示。在此基础上,使用多源指针生成网络,使生成的摘要与文档和查询内容具有语义一致性和表达连贯性。最后,在查询式文本摘要生成数据集Debatepedia和Querysum-data上,与已有方法进行对比实验,实验结果验证了该文摘要生成模型CMAT-PG的有效性。 展开更多
关键词 查询式文本摘要生成 机器阅读理解 交叉多头注意力机制 多源指针生成网络
在线阅读 下载PDF
非平衡数据流在线主动学习方法 被引量:4
7
作者 李艳红 任霖 +1 位作者 王素格 李德玉 《自动化学报》 EI CAS CSCD 北大核心 2024年第7期1389-1401,共13页
数据流分类是数据流挖掘领域一项重要研究任务,目标是从不断变化的海量数据中捕获变化的类结构.目前,几乎没有框架可以同时处理数据流中常见的多类非平衡、概念漂移、异常点和标记样本成本高昂问题.基于此,提出一种非平衡数据流在线主... 数据流分类是数据流挖掘领域一项重要研究任务,目标是从不断变化的海量数据中捕获变化的类结构.目前,几乎没有框架可以同时处理数据流中常见的多类非平衡、概念漂移、异常点和标记样本成本高昂问题.基于此,提出一种非平衡数据流在线主动学习方法(Online active learning method for imbalanced data stream,OALM-IDS).AdaBoost是一种将多个弱分类器经过迭代生成强分类器的集成分类方法,AdaBoost.M2引入了弱分类器的置信度,此类方法常用于静态数据.定义了基于非平衡比率和自适应遗忘因子的训练样本重要性度量,从而使AdaBoost.M2方法适用于非平衡数据流,提升了非平衡数据流集成分类器的性能.提出了边际阈值矩阵的自适应调整方法,优化了标签请求策略.将概念漂移程度融入模型构建过程中,定义了基于概念漂移指数的自适应遗忘因子,实现了漂移后的模型重构.在6个人工数据流和4个真实数据流上的对比实验表明,提出的非平衡数据流在线主动学习方法的分类性能优于其他5种非平衡数据流学习方法. 展开更多
关键词 主动学习 数据流分类 多类非平衡 概念漂移
在线阅读 下载PDF
非平衡概念漂移数据流主动学习方法 被引量:2
8
作者 李艳红 王甜甜 +1 位作者 王素格 李德玉 《自动化学报》 EI CAS CSCD 北大核心 2024年第3期589-606,共18页
数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真... 数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真实场景下是不现实的.此外,真实数据流可能表现出较高且不断变化的类不平衡比率,会进一步增加数据流分类任务的复杂性.为此,提出一种非平衡概念漂移数据流主动学习方法 (Active learning method for imbalanced concept drift data stream, ALM-ICDDS).定义基于多预测概率的样本预测确定性度量,提出边缘阈值矩阵的自适应调整方法,使得标签查询策略适用于类别数较多的非平衡数据流;提出基于记忆强度的样本替换策略,将难区分、少数类样本和代表当前数据分布的样本保存在记忆窗口中,提升新基分类器的分类性能;定义基于分类精度的基分类器重要性评价及更新方法,实现漂移后的集成分类器更新.在7个合成数据流和3个真实数据流上的对比实验表明,提出的非平衡概念漂移数据流主动学习方法的分类性能优于6种概念漂移数据流学习方法. 展开更多
关键词 数据流分类 主动学习 概念漂移 多类不平衡
在线阅读 下载PDF
旅游自动问答系统中多任务问句分类研究 被引量:1
9
作者 陈千 冯子珍 +1 位作者 王素格 郭鑫 《计算机应用与软件》 北大核心 2024年第1期336-342,共7页
目前旅游产业信息化建设需要构建旅游自动问答系统,其中问句分类是问答系统的重要组成部分,传统问句类别体系角度单一,且传统分类模型对不平衡的问句数据集表现欠佳。针对这一问题,该文从问题主题和问句答案类型两个角度构建了旅游领域... 目前旅游产业信息化建设需要构建旅游自动问答系统,其中问句分类是问答系统的重要组成部分,传统问句类别体系角度单一,且传统分类模型对不平衡的问句数据集表现欠佳。针对这一问题,该文从问题主题和问句答案类型两个角度构建了旅游领域的问句类别体系架构,并提出多任务问句分类模型MT-Bert,在BERT上进行多任务训练,并加入自注意力机制,使用Softmax分类器,并设计了多任务融合损失函数。在山西旅游数据集的结果表明,MT-Bert在两种类别体系的微平均F1值分别为97.6%、91.7%,且避免了非平衡数据的预测失败问题,可以有效处理非平衡数据。 展开更多
关键词 旅游问答 问句分类 分类体系 BERT 自注意力 多任务
在线阅读 下载PDF
联合方面注意力交互的图文方面类情感识别 被引量:1
10
作者 赵一成 王素格 +1 位作者 廖健 何东欢 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期569-578,共10页
随着多媒体的快速发展,单纯采用文本的方面类情感分析,不能准确识别用户所表达的情感。而现有图文数据的方面类情感分析方法仅考虑图文模态间的交互,忽略图文数据的不一致性和相关性。因此,提出联合方面注意力交互网络(JAAIN)模型的图... 随着多媒体的快速发展,单纯采用文本的方面类情感分析,不能准确识别用户所表达的情感。而现有图文数据的方面类情感分析方法仅考虑图文模态间的交互,忽略图文数据的不一致性和相关性。因此,提出联合方面注意力交互网络(JAAIN)模型的图文方面类情感识别方法。所提方法针对图文数据的不一致性与相关性,通过多层次融合方面信息和图文信息,去除与给定方面无关的文本和图像,增强给定方面的图文模态数据的情感表示,将文本数据情感表示、图像数据情感表示及方面类情感表示进行拼接融合与全连接,实现图文方面类情感判别。在数据集Multi-ZOL上进行实验,实验结果表明:所提模型能够提升图文方面类情感判别的性能。 展开更多
关键词 方面类情感分析 注意力机制 多模态情感分析 情感表示 多模态融合
在线阅读 下载PDF
基于联合学习的语言粒度融合的重叠事件抽取方法
11
作者 闫婧涛 李旸 +1 位作者 王素格 潘邦泽 《计算机科学》 CSCD 北大核心 2024年第7期287-295,共9页
事件抽取是一项重要的信息抽取任务,现有的事件抽取方法大多假设一个句子中仅出现一个事件,然而,在真实的场景下,重叠事件是难以避免的。文中提出了一种基于联合学习的语言粒度融合的重叠事件抽取方法。该方法设计了基于token数目逐层... 事件抽取是一项重要的信息抽取任务,现有的事件抽取方法大多假设一个句子中仅出现一个事件,然而,在真实的场景下,重叠事件是难以避免的。文中提出了一种基于联合学习的语言粒度融合的重叠事件抽取方法。该方法设计了基于token数目逐层递增和逐层递减的策略,对不同语言粒度的片段进行表示,在此基础上,构建了渐进式语言粒度融合的句子表示。通过引入事件信息感知,建立了基于门控机制的语言粒度和事件信息融合的句子表示。最后,通过联合学习词间的片段关系和角色关系,实现对事件触发词、论元、事件类型和论元角色的判别。在FewFC和DuEE1.0-1数据集上进行了实验,所提LGFEE模型在事件类型判别任务上的F1值分别提高了0.8%和0.6%,在触发词识别、论元识别、论元角色分类任务上也获得了较高的召回率和F1值,验证了其有效性。 展开更多
关键词 重叠事件抽取 语言粒度融合 联合学习 注意力机制 门控机制
在线阅读 下载PDF
基于同义词的词汇情感倾向判别方法 被引量:36
12
作者 王素格 李德玉 +1 位作者 魏英杰 宋晓雷 《中文信息学报》 CSCD 北大核心 2009年第5期68-74,共7页
词汇的情感倾向直接影响短语、句子、段落、篇章等更高层次语言粒度的情感倾向。对于基准词选取问题,该文提出了基于类别区分能力与情感词词表相结合的方法。考虑到词汇与其同义词很大程度上具有相同的情感倾向,我们提出了基于同义词的... 词汇的情感倾向直接影响短语、句子、段落、篇章等更高层次语言粒度的情感倾向。对于基准词选取问题,该文提出了基于类别区分能力与情感词词表相结合的方法。考虑到词汇与其同义词很大程度上具有相同的情感倾向,我们提出了基于同义词的词汇情感倾向判别方法,这种方法一定程度上避免了数据稀疏问题。实验结果表明,基于同义词的词汇情感倾向判别方法优于仅采用目标词与基准词的词汇情感倾向判别方法。 展开更多
关键词 计算机应用 中文信息处理 词汇情感倾向 基准词 关联强度 同义词
在线阅读 下载PDF
基于BERT位置感知的旅游三元组知识抽取方法
13
作者 张诺 王素格 李大宇 《计算机应用与软件》 北大核心 2024年第1期343-349,共7页
直接获取文本中的三元组,往往存在语义联系较弱、距离过长和一词多义的问题,因此,提出基于BERT预训练的位置感知的两阶段旅游三元组知识抽取方法。利用BERT-Span模型通过边界预测方法对旅游实体进行识别;利用旅游数据中的字、语义、位... 直接获取文本中的三元组,往往存在语义联系较弱、距离过长和一词多义的问题,因此,提出基于BERT预训练的位置感知的两阶段旅游三元组知识抽取方法。利用BERT-Span模型通过边界预测方法对旅游实体进行识别;利用旅游数据中的字、语义、位置和实体类型特征,构建融合位置感知注意力和头尾实体类型的关系抽取模型。在山西旅游数据集上进行实验,实验结果表明提出的方法优于基准模型的F1值。 展开更多
关键词 旅游知识图谱 三元组 实体识别 关系抽取 位置感知
在线阅读 下载PDF
融合属性项情感的异质图神经网络产品推荐模型
14
作者 李旸 符玉杰 +1 位作者 王素格 郑建兴 《中文信息学报》 CSCD 北大核心 2024年第12期137-147,共11页
建立用户兴趣与产品属性项间的关联关系,有助于提升产品推荐系统中的准确度,因为在产品评论数据中,属性项可以作为构建用户与产品间关系的媒介。该文利用BERT-SAN/ChatGLM-Turbo自动获取评论数据的属性项情感信息,度量了用户对属性项的... 建立用户兴趣与产品属性项间的关联关系,有助于提升产品推荐系统中的准确度,因为在产品评论数据中,属性项可以作为构建用户与产品间关系的媒介。该文利用BERT-SAN/ChatGLM-Turbo自动获取评论数据的属性项情感信息,度量了用户对属性项的偏好度和属性项对产品口碑的贡献度,刻画了用户兴趣和产品口碑。在此基础上,以属性项为媒介构建了用户与产品关系的关联二部图,提出了融合属性项情感的多头注意力机制的异质图神经网络产品推荐模型,模型实现了图中边的更新和结点更新。最后,基于平均误差(MSE)训练了稳定的用户与产品属性项关联的二部图图神经网络产品推荐模型。在Yelp Restaurant和Digital Music两个数据集上进行了实验,验证了融合属性项情感的多头注意力机制的异质图神经网络产品推荐模型相比传统方法能够取得更好的性能,且属性项情感信息可以为产品推荐的可解释性提供依据。 展开更多
关键词 属性项情感分析 图神经网络 用户偏好度 属性项贡献度 可解释性
在线阅读 下载PDF
JAES-MGCN:金融实体与情感极性联合获取方法
15
作者 李旸 任鹏飞 +1 位作者 王素格 符玉杰 《中文信息学报》 CSCD 北大核心 2024年第11期135-145,共11页
针对金融领域文本中具有实体较多、实体长度较长以及实体间存在语义关联的特性,容易导致实体和情感极性联合获取对应错误的问题,该文提出了一种基于多图卷积网络的金融实体和情感极性联合获取方法(JAES-MGCN)。该方法利用预训练模型对... 针对金融领域文本中具有实体较多、实体长度较长以及实体间存在语义关联的特性,容易导致实体和情感极性联合获取对应错误的问题,该文提出了一种基于多图卷积网络的金融实体和情感极性联合获取方法(JAES-MGCN)。该方法利用预训练模型对句子进行初始表示,构建基于多头自注意力机制的句子权重矩阵,建立基于多个图卷积网络融合的实体边界深层语义表示。在此基础上,基于多头注意力机制,建立实体与句子之间的交互信息表示,最后在解码层实现<金融实体,情感极性>二元组联合获取。在金融实体和情感极性数据集CES-data上,与已有的模型进行对比,该文所提方法在精确率和F1值上分别提升了3.66和1.42,验证了图卷积网络有利于捕获金融实体间的语义关系,进一步在公开的英文Twitter方面项情感分析数据集上验证了该方法的有效性。 展开更多
关键词 金融实体 情感极性 图卷积网络 交互信息表示
在线阅读 下载PDF
基于赋权粗糙隶属度的文本情感分类方法 被引量:20
16
作者 王素格 李德玉 魏英杰 《计算机研究与发展》 EI CSCD 北大核心 2011年第5期855-861,共7页
提出了基于赋权粗糙隶属度的文本情感分类方法.该方法将特征倾向强度引入到文本的向量空间表示法中,建立了基于二元组属性(特征,特征倾向强度)的文本表示模型.提出了基于情感倾向强度序的属性离散化方法,将特征选择寓于离散化过程,达到... 提出了基于赋权粗糙隶属度的文本情感分类方法.该方法将特征倾向强度引入到文本的向量空间表示法中,建立了基于二元组属性(特征,特征倾向强度)的文本表示模型.提出了基于情感倾向强度序的属性离散化方法,将特征选择寓于离散化过程,达到数据降维的目的.利用特征倾向强度,定义了赋权粗糙隶属度,用于新文本的情感分类.在真实汽车评论语料上,与支持向量机分类模型进行比较实验表明,基于赋权粗糙隶属度的文本情感分类方法在对数据进行一定程度的压缩后仍表现出较好的分类性能. 展开更多
关键词 文本情感分类 文本表示 情感倾向强度 离散化 粗糙隶属度
在线阅读 下载PDF
基于汉语情感词表的句子情感倾向分类研究 被引量:34
17
作者 王素格 杨安娜 李德玉 《计算机工程与应用》 CSCD 北大核心 2009年第24期153-155,161,共4页
提出了一种基于汉语情感词词表的加权线性组合的句子情感分类方法。该方法通过已有的五种资源构建了中文情感词词表,并采用加权线性组合的句子情感分类方法对句子进行情感类别判断。实验结果表明,直接利用词汇语言粒度的句子情感分类综... 提出了一种基于汉语情感词词表的加权线性组合的句子情感分类方法。该方法通过已有的五种资源构建了中文情感词词表,并采用加权线性组合的句子情感分类方法对句子进行情感类别判断。实验结果表明,直接利用词汇语言粒度的句子情感分类综合F值为78.62%,若加入了否定短语语言粒度后,句子情感分类的综合F值提高了4.14%。 展开更多
关键词 情感词表 加权线性组合 句子情感分类
在线阅读 下载PDF
自动获取汉语词语搭配 被引量:14
18
作者 王素格 杨军玲 张武 《中文信息学报》 CSCD 北大核心 2006年第6期31-37,共7页
作为一种词汇现象,词语搭配在自然语言处理的许多领域具有重要的应用。本文对4种词语相关性度量和3种词语结构分布度量分别进行了比较分析,并提出了一种基于互信息与熵融合的获取词语搭配的方法。实验结果表明:在同现频率较高情况下,互... 作为一种词汇现象,词语搭配在自然语言处理的许多领域具有重要的应用。本文对4种词语相关性度量和3种词语结构分布度量分别进行了比较分析,并提出了一种基于互信息与熵融合的获取词语搭配的方法。实验结果表明:在同现频率较高情况下,互信息、Cosine系数、x2测试和似然比测试4种相关性度量对搭配判定有大致相同的效果;在度量词语的结构分布方面,熵要优于方差和离散度。本文所提方法依赖度量指标少,阈值容易选取,且与其他已有的方法具有同等效果。 展开更多
关键词 计算机应用 中文信息处理 词语搭配 互信息
在线阅读 下载PDF
停用词表对中文文本情感分类的影响 被引量:22
19
作者 王素格 魏英 《情报学报》 CSSCI 北大核心 2008年第2期175-179,共5页
本文利用三种特征选择方法、两种权重计算方法、五种停用词表以及支持向量机分类器对汽车语料的文本情感类别进行了研究。实验结果表明,不同特征选择方法、权重计算以及停用词表,对文本情感分类的影响也不尽相同;除形容词、动词和副... 本文利用三种特征选择方法、两种权重计算方法、五种停用词表以及支持向量机分类器对汽车语料的文本情感类别进行了研究。实验结果表明,不同特征选择方法、权重计算以及停用词表,对文本情感分类的影响也不尽相同;除形容词、动词和副词外的其余词语作为停用词表以及不使用停用词表对情感分类作用较大,得到的分类结果比较好;总体上,采用信息增益和布尔型权重进行中文文本情感分类的效果较好。 展开更多
关键词 停用词 文本情感分类 特征选择 支持向量机
在线阅读 下载PDF
基于领域知识的问答对自动提取方法 被引量:5
20
作者 王素格 宋晓雷 李红霞 《计算机工程与应用》 CSCD 北大核心 2010年第19期214-216,223,共4页
问答系统旨在用准确、简洁的答案回答用户用自然语言提出的问题。以旅游信息服务为应用背景,提出了基于领域知识的问答对自动提取方法。考察了常见旅游问题,建立了领域知识,在此基础上,设计了用户问题模式匹配算法和答案提取算法,对于... 问答系统旨在用准确、简洁的答案回答用户用自然语言提出的问题。以旅游信息服务为应用背景,提出了基于领域知识的问答对自动提取方法。考察了常见旅游问题,建立了领域知识,在此基础上,设计了用户问题模式匹配算法和答案提取算法,对于不能匹配模式的问题,采用句子相似度计算得到相关的答案。实验结果表明,提出的方法是可行的,实现了旅游问题的自动问答。 展开更多
关键词 问答系统 领域知识库 模式库 问答对
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部