期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
非对称信息下证券公司道德风险定价模型的研究
1
作者 李婷婷 丁庭栋 《北京工商大学学报(社会科学版)》 CSSCI 北大核心 2007年第5期37-40,共4页
由于证券市场上非对称信息状态的存在,信息差别给证券投资者保护制度带来了不容忽视的道德风险结果,本文通过建立证券公司道德风险定价模型,计算出了证券公司向证券投资者保护基金机构缴纳保护基金的费率基准。据此,在保护证券投资者利... 由于证券市场上非对称信息状态的存在,信息差别给证券投资者保护制度带来了不容忽视的道德风险结果,本文通过建立证券公司道德风险定价模型,计算出了证券公司向证券投资者保护基金机构缴纳保护基金的费率基准。据此,在保护证券投资者利益的基础上,证券投资者保护基金机构可以向证券公司按照给出的费率基准收取保护基金,从而减少证券公司道德风险的发生。 展开更多
关键词 非对称信息 道德风险 逆向选择 定价模型
在线阅读 下载PDF
融合主题信息和Transformer模型的健康问句意图分类 被引量:4
2
作者 迟海洋 严馨 +2 位作者 徐广义 陈玮 周枫 《小型微型计算机系统》 CSCD 北大核心 2021年第12期2519-2524,共6页
问答系统的一项关键任务就是如何理解用户的问句意图并将其正确地分类到相应的领域中,其分类性能直接影响着问答系统的质量.针对中文医疗健康问句数据量庞大但文本字符数少、特征稀疏的特点,以及传统卷积神经网络和循环神经网络的不足,... 问答系统的一项关键任务就是如何理解用户的问句意图并将其正确地分类到相应的领域中,其分类性能直接影响着问答系统的质量.针对中文医疗健康问句数据量庞大但文本字符数少、特征稀疏的特点,以及传统卷积神经网络和循环神经网络的不足,提出了一种融合主题信息和Transformer模型的健康问句意图分类方法.首先,对短文本数据集预处理后通过BERT预训练语言模型生成词的词向量;其次,分别使用BTM主题模型和TWE模型获得文档-主题矩阵、主题-词矩阵和主题向量矩阵,由矩阵变换生成每个词的主题向量;然后,将词向量和词的主题向量拼接融合后输入到Transformer编码器中进行充分的特征提取并得到句子特征向量;最后,由全连接和Softmax分类器获得输入文本在各个类别的概率,从而实现最终的分类目的.在中文医疗健康问句数据集上进行不同模型的对比实验,准确率、召回率和F1值指标上均有不错的提升.实验结果表明,本文提出的方法可以有效提高模型的语义表示能力和分类效果. 展开更多
关键词 主题信息 BTM TRANSFORMER 意图分类
在线阅读 下载PDF
融合多信息句子图模型的多文档摘要抽取 被引量:4
3
作者 蒋亚芳 严馨 +2 位作者 徐广义 周枫 邓忠莹 《计算机工程与科学》 CSCD 北大核心 2020年第3期535-542,共8页
针对现有多文档抽取方法不能很好地利用句子主题信息和语义信息的问题,提出一种融合多信息句子图模型的多文档摘要抽取方法。首先,以句子为节点,构建句子图模型;然后,将基于句子的贝叶斯主题模型和词向量模型得到的句子主题概率分布和... 针对现有多文档抽取方法不能很好地利用句子主题信息和语义信息的问题,提出一种融合多信息句子图模型的多文档摘要抽取方法。首先,以句子为节点,构建句子图模型;然后,将基于句子的贝叶斯主题模型和词向量模型得到的句子主题概率分布和句子语义相似度相融合,得到句子最终的相关性,结合主题信息和语义信息作为句子图模型的边权重;最后,借助句子图最小支配集的摘要方法来描述多文档摘要。该方法通过融合多信息的句子图模型,将句子间的主题信息、语义信息和关系信息相结合。实验结果表明,该方法能够有效地改进抽取摘要的综合性能。 展开更多
关键词 多文档摘要 句子贝叶斯主题模型 词向量 句子图模型 最小支配集
在线阅读 下载PDF
基于Tri-training的社交媒体药物不良反应实体抽取
4
作者 何忠玻 严馨 +2 位作者 徐广义 张金鹏 邓忠莹 《计算机工程与应用》 CSCD 北大核心 2024年第3期177-186,共10页
社交媒体因其数据的实时性,对其充分利用可以弥补传统医疗文献药物不良反应中实体抽取的迟滞性问题,但社交媒体文本面临标注数据成本高、数据噪声大等问题,使得模型难以发挥良好的效果。针对社交媒体大量未标注语料存在标注成本高的问题... 社交媒体因其数据的实时性,对其充分利用可以弥补传统医疗文献药物不良反应中实体抽取的迟滞性问题,但社交媒体文本面临标注数据成本高、数据噪声大等问题,使得模型难以发挥良好的效果。针对社交媒体大量未标注语料存在标注成本高的问题,采用Tri-training半监督的方法进行社交媒体药物不良反应实体抽取,通过三个学习器Transformer+CRF、BiLSTM+CRF和IDCNN+CRF对未标注数据进行标注,再利用一致性评价函数迭代地扩展训练集,最后通过加权投票整合模型输出标签。针对社交媒体的文本不正式性(口语化严重、错别字等)问题,通过融合字与词两个粒度的向量作为整个模型嵌入层的输入,来提取更丰富的语义信息。实验结果表明,提出的模型在“好大夫在线”网站获取的数据集上取得了良好表现。 展开更多
关键词 中文社交媒体 药物不良反应 实体抽取 半监督学习 TRI-TRAINING
在线阅读 下载PDF
融合历史答案特征的多粒度语义交互答案排序方法
5
作者 崔伟琪 严馨 +2 位作者 刘艳超 邓忠莹 徐广义 《计算机工程与设计》 北大核心 2024年第7期1989-1996,共8页
为解决只根据单一特征判断答案质量的问题,提出一种结合历史答案特征及多粒度语义交互判断答案质量的排序方法。通过指针网络提取历史答案特征,用动态注意力剔除掉问答对及历史答案的弱相关部分,采用比较聚合池化提取局部语义特征向量,... 为解决只根据单一特征判断答案质量的问题,提出一种结合历史答案特征及多粒度语义交互判断答案质量的排序方法。通过指针网络提取历史答案特征,用动态注意力剔除掉问答对及历史答案的弱相关部分,采用比较聚合池化提取局部语义特征向量,用池化归纳问答对及历史答案句子信息,通过加权求和提取全局语义特征向量。将问答对及历史答案的局部和全局语义特征向量融合,输入到分类器进行打分,按照得分对候选答案排名。实验结果表明,所提方法有效提升了答案选择的正确率。 展开更多
关键词 答案排序 多粒度语义交互 注意力机制 指针神经网络 预训练模型 长短期记忆网络 深度学习
在线阅读 下载PDF
一种改进的带障碍的基于密度和网格的聚类算法 被引量:4
6
作者 严馨 周丽华 +1 位作者 陈克平 徐广义 《计算机应用》 CSCD 北大核心 2005年第8期1818-1820,1823,共4页
提出了一个改进的带障碍的网格弥散聚类算法DCellO1:以网格为基础,将基于密度的聚类算法与图形学种子填充算法相结合。该算法能进行任意形状的带障碍聚类,并且在对象分布不均匀时也能获得较好的聚类结果。实验证明了该算法的有效性与优... 提出了一个改进的带障碍的网格弥散聚类算法DCellO1:以网格为基础,将基于密度的聚类算法与图形学种子填充算法相结合。该算法能进行任意形状的带障碍聚类,并且在对象分布不均匀时也能获得较好的聚类结果。实验证明了该算法的有效性与优越性。 展开更多
关键词 聚类 网格 密度 障碍
在线阅读 下载PDF
一种互联网个人支付终端的设计与实现
7
作者 余永纪 成静 余永元 《实验室研究与探索》 CAS 北大核心 2017年第7期148-150,184,共4页
介绍一种基于ARM的双界面读卡器,采用USB通信方式,它除了具有基本IC卡读写器功能之外,还具有金融IC卡交易的功能,并实现相应的算法与机制来保证数据通信的安全与可靠性,可以应用于互联网个人金融支付、银行柜面交易等应用场景。相比于... 介绍一种基于ARM的双界面读卡器,采用USB通信方式,它除了具有基本IC卡读写器功能之外,还具有金融IC卡交易的功能,并实现相应的算法与机制来保证数据通信的安全与可靠性,可以应用于互联网个人金融支付、银行柜面交易等应用场景。相比于传统的支付终端,它具有操作简单、支付更加安全、可扩展性更强等特点。 展开更多
关键词 互联网 金融支付 读卡器 算法
在线阅读 下载PDF
基于BERT-BiGRU-Attention的在线健康社区用户意图识别方法 被引量:7
8
作者 迟海洋 严馨 +2 位作者 周枫 徐广义 张磊 《河北科技大学学报》 CAS 2020年第3期225-232,共8页
针对传统用户意图识别主要使用基于模板匹配或人工特征集合方法导致成本高、扩展性低的问题,提出了一种基于BERT词向量和BiGRU-Attention的混合神经网络意图识别模型。首先使用BERT预训练的词向量作为输入,通过BiGRU对问句进行特征提取... 针对传统用户意图识别主要使用基于模板匹配或人工特征集合方法导致成本高、扩展性低的问题,提出了一种基于BERT词向量和BiGRU-Attention的混合神经网络意图识别模型。首先使用BERT预训练的词向量作为输入,通过BiGRU对问句进行特征提取,再引入Attention机制提取对句子含义有重要影响力的词的信息以及分配相应的权重,获得融合了词级权重的句子向量,并输入到softmax分类器,实现意图分类。爬取语料实验结果表明,BERT-BiGRU-Attention方法性能均优于传统的模板匹配、SVM和目前效果较好的CNN-LSTM深度学习组合模型。提出的新方法能有效提升意图识别模型的性能,提高在线健康信息服务质量、为在线健康社区问答系统提供技术支撑。 展开更多
关键词 自然语言处理 意图识别 在线健康社区 BERT词向量 BiGRU Attention机制
在线阅读 下载PDF
融合关键词的中文新闻文本摘要生成 被引量:8
9
作者 宁珊 严馨 +2 位作者 徐广义 周枫 张磊 《计算机工程与科学》 CSCD 北大核心 2020年第12期2265-2272,共8页
针对现有基于seq2seq模型在生成摘要时容易出现语义无关的摘要词,同时没有考虑到关键词在摘要生成中的作用,提出一种融合关键词的中文新闻文本摘要生成方法。首先将源文本词依次输入到Bi-LSTM模型中;然后将得到的时间步隐藏状态输入到... 针对现有基于seq2seq模型在生成摘要时容易出现语义无关的摘要词,同时没有考虑到关键词在摘要生成中的作用,提出一种融合关键词的中文新闻文本摘要生成方法。首先将源文本词依次输入到Bi-LSTM模型中;然后将得到的时间步隐藏状态输入到滑动卷积神经网络,提取每个词与相邻词之间的局部特征;其次利用关键词信息和门控单元对新闻文本信息进行过滤,去除冗余信息;再通过自注意力机制获得每个词的全局特征信息,最终编码得到具有层次性的局部结合全局的词特征表示;将编码得到的词特征表示输入到带有注意力机制的LSTM模型中解码得到摘要信息。该方法通过滑动卷积网络对新闻词的n-gram特征建模,在此基础上利用自注意力机制,获得具有层次性的局部结合全局的词特征表示。同时,考虑了关键词在新闻摘要生成中的重要作用,利用门控单元去除冗余信息,以获得更精准的新闻文本信息。在搜狗全网新闻语料上的实验表明,该方法能够有效提高摘要生成质量,能够有效地提高ROUGE-1、ROUGE-2、ROUGE-L值。 展开更多
关键词 文本摘要生成 滑动卷积网络 关键词信息融合 门控单元 全局编码
在线阅读 下载PDF
使用胶囊网络的细粒度情感分析方法 被引量:7
10
作者 滕磊 严馨 +2 位作者 徐广义 周枫 邓忠莹 《小型微型计算机系统》 CSCD 北大核心 2020年第12期2550-2556,共7页
Aspect-BasedSentimentClassification(ABSC)属于细粒度情感分析任务之一,旨在发现实体方面(Aspect)相关的情感倾向.本论文中提出一种基于胶囊网络的模型:MADC(Model based on Asp-Routing and Doc-Routing Capsule),通过迁移模型将文... Aspect-BasedSentimentClassification(ABSC)属于细粒度情感分析任务之一,旨在发现实体方面(Aspect)相关的情感倾向.本论文中提出一种基于胶囊网络的模型:MADC(Model based on Asp-Routing and Doc-Routing Capsule),通过迁移模型将文档级别的特征和语义信息用于方面级情感分析中,针对文档级别和句子级别的的任务,分别使用了基于注意力机制的AspRouting和Doc-Routing动态路由方法,加强了句子级别任务情感分析的可信度.为了让模型识别特定领域词向量的语义信息,文章使用双嵌入词向量加位置信息的表示方法,通过卷积神经网络抽取特征作为胶囊网络的输入,再使用两层动态路由算法使网络共享迁移学习的特征胶囊和主胶囊,最后针对不同的任务使用不同的类胶囊输出向量对方面情感或文档级别情感作出极性预测.文章通过在数据集上与多个框架的对比论证了模型的有效性. 展开更多
关键词 方面情感分析 胶囊网络 双嵌入 卷积神经网络 动态路由 迁移学习
在线阅读 下载PDF
基于层级BiGRU+Attention的面向查询的新闻多文档抽取式摘要方法 被引量:7
11
作者 曾昭霖 严馨 +2 位作者 徐广义 陈玮 邓忠莹 《小型微型计算机系统》 CSCD 北大核心 2023年第1期185-192,共8页
针对现有大多数面向查询的多文档抽取式摘要方法通常是将句子的内容显著性及查询相关性分开计算的,且对向量表示的建模不充分的问题,提出一种基于层级BiGRU+Attention的面向查询的新闻多文档抽取式摘要方法.首先,通过训练层级BiGRU+Atte... 针对现有大多数面向查询的多文档抽取式摘要方法通常是将句子的内容显著性及查询相关性分开计算的,且对向量表示的建模不充分的问题,提出一种基于层级BiGRU+Attention的面向查询的新闻多文档抽取式摘要方法.首先,通过训练层级BiGRU+Attention神经网络模型,获得具有丰富上下文语义信息的句子、文档向量表示;并在此过程中通过双线性变换注意力机制,使得文档向量表示不仅具有反映文档深层主旨信息的基本特性,还融入句子与用户查询的相关性信息,然后利用句向量与其进行相似度计算获得相应的句子重要性得分;其次,由句子重要性得分、句子中包含的关键词特征、句子的长度特征以及句子的时序权重系数加权组合得到最终的句子综合特征权重得分;最后,利用MMR算法来选择摘要句.实验结果表明,与其他方法相比本文提出的方法能在一定程度上提高面向查询的多文档抽取式摘要的质量,具有一定的有效性及优越性. 展开更多
关键词 面向查询的抽取式摘要 中文多文档 层级BiGRU 注意力机制
在线阅读 下载PDF
融合数据增强与半监督学习的药物不良反应检测 被引量:5
12
作者 佘朝阳 严馨 +2 位作者 徐广义 陈玮 邓忠莹 《计算机工程》 CAS CSCD 北大核心 2022年第6期314-320,共7页
目前药物不良反应(ADR)研究使用的数据主要来源于英文语料,较少选用存在标注数据稀缺问题的中文医疗社交媒体数据集,导致对中文医疗社交媒体的研究有限。为解决标注数据稀缺的问题,提出一种新型的ADR检测方法。采用ERNIE预训练模型获取... 目前药物不良反应(ADR)研究使用的数据主要来源于英文语料,较少选用存在标注数据稀缺问题的中文医疗社交媒体数据集,导致对中文医疗社交媒体的研究有限。为解决标注数据稀缺的问题,提出一种新型的ADR检测方法。采用ERNIE预训练模型获取文本的词向量,利用BiLSTM模型和注意力机制学习文本的向量表示,并通过全连接层和softmax函数得到文本的分类标签。对未标注数据进行文本增强,使用分类模型获取低熵标签,此标签被作为原始未标注样本及其增强样本的伪标签。此外,将带有伪标签的数据与人工标注数据进行混合,在分类模型的编码层和分类层间加入Mixup层,并在文本向量空间中使用Mixup增强方法插值混合样本,从而扩增样本数量。通过将数据增强和半监督学习相结合,充分利用标注数据与未标注数据,实现ADR的检测。实验结果表明,该方法无需大量的标注数据,缓解了标注数据不足对检测结果的影响,有效提升了药物不良反应检测模型的性能。 展开更多
关键词 医疗社交媒体 药物不良反应 数据增强 半监督学习 预训练语言模型
在线阅读 下载PDF
多重CCA算法的柬汉双语词向量构建方法 被引量:2
13
作者 蒋亚芳 严馨 +2 位作者 李思远 徐广义 周枫 《计算机工程与应用》 CSCD 北大核心 2020年第17期167-172,共6页
针对现有双语词向量研究方法获取双语词向量需要用到大量双语平行文本,对于柬汉双语而言存在着平行文本不足的关键问题,而英语作为通用语言,英语-汉语以及英语-柬埔寨语双语平行文本较多且容易获得,因此在典型相关分析跨语言词向量模型... 针对现有双语词向量研究方法获取双语词向量需要用到大量双语平行文本,对于柬汉双语而言存在着平行文本不足的关键问题,而英语作为通用语言,英语-汉语以及英语-柬埔寨语双语平行文本较多且容易获得,因此在典型相关分析跨语言词向量模型上作出进一步改进,提出以英语为中间语言的基于多重CCA算法的汉柬双语词向量构建方法。通过将英语、汉语词向量投影至汉-英向量空间,将英语、柬语词向量投影至柬-英向量空间,根据CCA算法分别得到英-汉、英-柬双语词向量;以英语作为中间词并结合部分实验室构建的柬汉双语电子词典将上一步得到的英-柬、英-汉双语词向量投影至第三方同一向量空间中,再次根据CCA算法得到柬语和汉语在新向量空间中的投影转换矩阵;得到柬英汉多语词向量,多语词向量中包含有柬汉双语词向量。与传统方法相比,该方法解决了当前其他模型所面临的初始柬汉平行文本稀缺的问题,且获得较高的柬汉双语词向量。 展开更多
关键词 双语词向量 典型相关分析(CCA) 汉柬双语 多重典型相关分析算法
在线阅读 下载PDF
基于Transformer模型的问句语义相似度计算 被引量:7
14
作者 丁邱 迟海洋 +2 位作者 严馨 徐广义 邓忠莹 《计算机工程与设计》 北大核心 2023年第3期887-893,共7页
针对现有方法准确率不高、不能充分捕捉句子深层次语义特征的问题,提出一种基于Transformer编码器网络的问句相似度计算方法。在获取句子语义特征前引入交互注意力机制比较句子间词粒度的相似性,通过注意力矩阵和句子矩阵相互生成彼此... 针对现有方法准确率不高、不能充分捕捉句子深层次语义特征的问题,提出一种基于Transformer编码器网络的问句相似度计算方法。在获取句子语义特征前引入交互注意力机制比较句子间词粒度的相似性,通过注意力矩阵和句子矩阵相互生成彼此注意力加权后的新的句子表示矩阵,将获取的新矩阵同原始矩阵拼接融合,丰富句子特征信息;将拼接后的句子特征矩阵作为Transformer编码器网络的输入,由Transformer编码器分别对其进行深层次语义编码,获得句子的全局语义特征;通过全连接网络和Softmax函数对特征进行权重调整,得到句子相似度。在中文医疗健康问句数据集上模型取得了90.2%的正确率,较对比模型提升了将近4.2%,验证了该方法可以有效提高句子的语义表示能力和语义相似度的准确性。 展开更多
关键词 自然语言处理 Transformer编码器 交互注意力机制 特征融合 语义相似度 语义编码 句子表示
在线阅读 下载PDF
基于分层最大边缘相关的柬语多文档抽取式摘要方法 被引量:1
15
作者 曾昭霖 严馨 +2 位作者 余兵兵 周枫 徐广义 《河北科技大学学报》 CAS 2020年第6期508-517,共10页
为了解决传统多文档抽取式摘要方法无法有效利用文档之间的语义信息、摘要结果存在过多冗余内容的问题,提出了一种基于分层最大边缘相关的柬语多文档抽取式摘要方法。首先,将柬语多文档文本输入到训练好的深度学习模型中,抽取得到所有... 为了解决传统多文档抽取式摘要方法无法有效利用文档之间的语义信息、摘要结果存在过多冗余内容的问题,提出了一种基于分层最大边缘相关的柬语多文档抽取式摘要方法。首先,将柬语多文档文本输入到训练好的深度学习模型中,抽取得到所有的单文档摘要;然后,依据类似分层瀑布的方式,迭代合并所有的单文档摘要,通过改进的最大边缘相关算法合理地选择摘要句,得到最终的多文档摘要。结果表明,与其他方法相比,通过使用深度学习方法并结合分层最大边缘相关算法共同获得的柬语多文档摘要,R1,R2,R3和RL值分别提高了4.31%,5.33%,6.45%和4.26%。基于分层最大边缘相关的柬语多文档抽取式摘要方法在保证摘要句子多样性和差异性的同时,有效提高了柬语多文档摘要的质量。 展开更多
关键词 多文档摘要 文本输入 语义信息 最大边缘相关 深度学习 多冗余 抽取式 多样性
在线阅读 下载PDF
基于Transformer和TextRank的微博观点摘要方法 被引量:1
16
作者 孙旭 沈彬 +2 位作者 严馨 张金鹏 徐广义 《广西师范大学学报(自然科学版)》 CAS 北大核心 2023年第4期96-108,共13页
针对已有研究没有考虑微博文本之间情感关联的问题,本文提出基于Transformer和TextRank的微博观点摘要方法。首先通过Transformer中的编码器和量化空间部分对文本的字向量进行编码和量化;然后根据量化结果实现语义聚类来划分微博文本集... 针对已有研究没有考虑微博文本之间情感关联的问题,本文提出基于Transformer和TextRank的微博观点摘要方法。首先通过Transformer中的编码器和量化空间部分对文本的字向量进行编码和量化;然后根据量化结果实现语义聚类来划分微博文本集的观点类别,并选取重要的类别进行摘要抽取;之后将情感特征向量和微博文本的特征向量进行拼接;接着在每个类别中使用融入情感特征的TextRank算法,将抽取出的权重最高的微博文本作为摘要文本;最后将所有类别下最具有代表性的摘要文本相结合,得到最终的微博观点摘要。实验结果表明:在加入情感极性影响因子后,相比于基线方法,本文方法的各项ROUGE值均有明显地提升,Rouge-1、Rouge-2和Rouge-SU4的F-measure值最高达到0.4937、0.2555、0.2706,证明本文方法对于微博观点摘要抽取任务是有效的。 展开更多
关键词 情感特征 观点摘要 语义聚类 摘要抽取 TRANSFORMER TextRank
在线阅读 下载PDF
基于深度主动学习的柬语单文档抽取式摘要方法 被引量:1
17
作者 余兵兵 严馨 +2 位作者 周枫 徐广义 莫源源 《计算机应用与软件》 北大核心 2021年第4期165-170,189,共7页
深层神经网络在文档摘要方面取得了很好的效果,其优势只有在大数据集下才能显示出来。为了解决在使用深度学习做柬语单文档抽取式摘要时语料标注不足的问题,提出一种将主动学习和深度学习相结合的方法。利用主动学习抽样策略选择出定量... 深层神经网络在文档摘要方面取得了很好的效果,其优势只有在大数据集下才能显示出来。为了解决在使用深度学习做柬语单文档抽取式摘要时语料标注不足的问题,提出一种将主动学习和深度学习相结合的方法。利用主动学习抽样策略选择出定量的文档,通过专家标注,结合深度学习中编码器解码器模型进行训练模型抽取得到摘要。实验结果表明,在训练语料显著标注不足的情况下,该方法能够有效地提升柬语单文档摘要的质量。 展开更多
关键词 柬语 主动学习 单文档摘要 深度学习
在线阅读 下载PDF
基于深度半监督的柬语句子级情感分类
18
作者 李超 严馨 +2 位作者 徐广义 莫源源 周枫 《计算机应用研究》 CSCD 北大核心 2021年第11期3283-3288,共6页
针对柬语标注数据较少、语料稀缺,柬语句子级情感分析任务进步缓慢的问题,提出了一种基于深度半监督CNN(convolutional neural networks)的柬语句子级情感极性分类方法。该方法通过融合词典嵌入的分开卷积CNN模型,利用少量已有的柬语情... 针对柬语标注数据较少、语料稀缺,柬语句子级情感分析任务进步缓慢的问题,提出了一种基于深度半监督CNN(convolutional neural networks)的柬语句子级情感极性分类方法。该方法通过融合词典嵌入的分开卷积CNN模型,利用少量已有的柬语情感词典资源提升句子级情感分类任务性能。首先构建柬语句子词嵌入和词典嵌入,通过使用不同的卷积核对两部分嵌入分别进行卷积,将已有情感词典信息融入到CNN模型中去,经过最大延时池化得到最大输出特征,把两部分最大输出特征拼接后作为全连接层输入;然后通过结合半监督学习方法——时序组合模型,训练提出的深度神经网络模型,利用标注与未标注语料训练,降低对标注语料的需求,进一步提升模型情感分类的准确性。结果证明,通过半监督方法时序组合模型训练,在人工标记数据相同的情况下,该方法相较于监督方法在柬语句子级情感分类任务上准确率提升了3.89%。 展开更多
关键词 柬语句子级情感分类 情感词典嵌入 卷积神经网络 半监督 时序组合模型
在线阅读 下载PDF
基于HDP的主题词向量构造——以柬语为例
19
作者 李超 严馨 +3 位作者 谢俊 徐广义 周枫 莫源源 《计算机工程与科学》 CSCD 北大核心 2020年第6期1111-1119,共9页
针对单一词向量中存在的一词多义和一义多词的问题,以柬语为例提出了一种基于HDP主题模型的主题词向量的构造方法。在单一词向量基础上融入了主题信息,首先通过HDP主题模型得到单词主题标签,然后将其视为伪单词与单词一起输入Skip-Gram... 针对单一词向量中存在的一词多义和一义多词的问题,以柬语为例提出了一种基于HDP主题模型的主题词向量的构造方法。在单一词向量基础上融入了主题信息,首先通过HDP主题模型得到单词主题标签,然后将其视为伪单词与单词一起输入Skip-Gram模型,同时训练出主题向量和词向量,最后将文本主题信息的主题向量与单词训练后得到的词向量进行级联,获得文本中每个词的主题词向量。与未融入主题信息的词向量模型相比,该方法在单词相似度和文本分类方面均取得了更好的效果,获取的主题词向量具有更多的语义信息。 展开更多
关键词 HDP主题模型 主题词向量 Skip-Gram模型
在线阅读 下载PDF
采用人脸识别支付的地铁自动售检票系统避免重复计费的方案研究 被引量:7
20
作者 王大彬 栗兰林 +1 位作者 李茂圣 方亚敏 《城市轨道交通研究》 北大核心 2023年第7期87-91,98,共6页
目的:开通人脸乘车服务的乘客在使用有感支付过闸机时,易被闸机上的人脸识别终端采集到人脸信息,误生成人脸识别支付交易数据,导致重复计费的问题。这一问题亟待解决。方法:根据乘客过闸机支付习惯,在使用有感支付时,是不应存在人脸识... 目的:开通人脸乘车服务的乘客在使用有感支付过闸机时,易被闸机上的人脸识别终端采集到人脸信息,误生成人脸识别支付交易数据,导致重复计费的问题。这一问题亟待解决。方法:根据乘客过闸机支付习惯,在使用有感支付时,是不应存在人脸识别支付的。基于此,提出了采用人脸识别支付的地铁自动售检票系统避免重复计费的方案,并特别提出闸机通行和单边行程调整算法,即在闸机处,较短时间内存在同一乘客的人脸识别支付请求和有感支付请求时,仅生成有感支付的交易数据,不生成人脸识别支付交易数据,继而就不会对人脸识别支付进行计费;在系统进行日切时,会自动删除同一乘客的相似(交易信息基本相同)行程中的人脸识别支付单边行程,避免了此单边行程计费。结果及结论:在不影响乘客正常通行闸机的情况下,在闸机处不仅有效地避免误生成人脸识别支付交易数据,而且也能在系统日切时有效地删除误生成的人脸识别支付单边行程,从而有效解决了人脸识别支付重复计费的问题。 展开更多
关键词 地铁 自动售检票系统 人脸识别 闸机通行算法 单边行程
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部