传统的命名实体识别方法直接依靠大量的人工特征和专门的领域知识,解决了监督学习语料不足的问题,但设计人工特征和获取领域知识的代价昂贵。针对该问题,提出一种基于BLSTM(Bidirectional Long Short-Term Memory)的神经网络结构的命名...传统的命名实体识别方法直接依靠大量的人工特征和专门的领域知识,解决了监督学习语料不足的问题,但设计人工特征和获取领域知识的代价昂贵。针对该问题,提出一种基于BLSTM(Bidirectional Long Short-Term Memory)的神经网络结构的命名实体识别方法。该方法不再直接依赖于人工特征和领域知识,而是利用基于上下文的词向量和基于字的词向量,前者表达命名实体的上下文信息,后者表达构成命名实体的前缀、后缀和领域信息;同时,利用标注序列中标签之间的相关性对BLSTM的代价函数进行约束,并将领域知识嵌入模型的代价函数中,进一步增强模型的识别能力。实验表明,所提方法的识别效果优于传统方法。展开更多
在线评论在用户的购买决策中起到日益重要的作用,电商网站提供海量的用户评论,但是个体很难充分利用所有信息。因此,对这些评论进行分类、分析和汇总是很迫切的任务。首次提出一个基于注意力机制和双向LSTM(bi-directional long short-t...在线评论在用户的购买决策中起到日益重要的作用,电商网站提供海量的用户评论,但是个体很难充分利用所有信息。因此,对这些评论进行分类、分析和汇总是很迫切的任务。首次提出一个基于注意力机制和双向LSTM(bi-directional long short-term memory,BLSTM)的模型来判定评论对象的类别,用于评论的分类。模型首先使用BLSTM对词向量形式的评论进行训练;然后根据词性为BLSTM的输出向量赋予相应权重,权重作为先验知识能指导注意力机制的学习;最后使用注意力机制捕捉与类别相关的重要信息用于类别判定。在SemEval数据集上进行了实验,结果表明,模型能有效提高评论对象类别判定的效果,优于其他算法。展开更多
文摘传统的命名实体识别方法直接依靠大量的人工特征和专门的领域知识,解决了监督学习语料不足的问题,但设计人工特征和获取领域知识的代价昂贵。针对该问题,提出一种基于BLSTM(Bidirectional Long Short-Term Memory)的神经网络结构的命名实体识别方法。该方法不再直接依赖于人工特征和领域知识,而是利用基于上下文的词向量和基于字的词向量,前者表达命名实体的上下文信息,后者表达构成命名实体的前缀、后缀和领域信息;同时,利用标注序列中标签之间的相关性对BLSTM的代价函数进行约束,并将领域知识嵌入模型的代价函数中,进一步增强模型的识别能力。实验表明,所提方法的识别效果优于传统方法。
文摘在线评论在用户的购买决策中起到日益重要的作用,电商网站提供海量的用户评论,但是个体很难充分利用所有信息。因此,对这些评论进行分类、分析和汇总是很迫切的任务。首次提出一个基于注意力机制和双向LSTM(bi-directional long short-term memory,BLSTM)的模型来判定评论对象的类别,用于评论的分类。模型首先使用BLSTM对词向量形式的评论进行训练;然后根据词性为BLSTM的输出向量赋予相应权重,权重作为先验知识能指导注意力机制的学习;最后使用注意力机制捕捉与类别相关的重要信息用于类别判定。在SemEval数据集上进行了实验,结果表明,模型能有效提高评论对象类别判定的效果,优于其他算法。