期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
供应链中断风险的度量与应用:基于词嵌入模型的分析 被引量:2
1
作者 江伟 王楠 曹少鹏 《南开管理评论》 北大核心 2025年第4期109-120,共12页
随着近年来供应链中断给一国乃至全球带来巨大经济损失和社会影响,如何在事前对企业层面的供应链中断风险进行量化成为学术界和实务界关注的一个重要议题。本文根据我国上市公司年报M D&A部分的文本信息,采用词嵌入模型度量企业层... 随着近年来供应链中断给一国乃至全球带来巨大经济损失和社会影响,如何在事前对企业层面的供应链中断风险进行量化成为学术界和实务界关注的一个重要议题。本文根据我国上市公司年报M D&A部分的文本信息,采用词嵌入模型度量企业层面的供应链中断风险。检验结果表明:这一供应链中断风险指标对于企业未来的会计业绩与市场价值具有预测能力,企业面临的供应链中断风险越高,其未来的会计业绩与市场价值越低。进一步研究发现,在非国有企业且客户集中度越高、海外销售比重越低、企业所属行业竞争程度越高时,本文度量的供应链中断风险指标的上述预测能力越强。最后,当面临较高的供应链中断风险时,企业会储备更多的存货来应对。研究结果表明,本文度量的企业层面的供应链中断风险指标能够在事前向企业提供有关供应链中断风险的特有信息,因而具有良好的有效性。本研究不仅有助于学术界利用企业层面供应链中断风险的量化指标开展相关影响因素和经济后果的大样本经验研究,而且有助于实务界和政府根据该量化指标在事前更好地评估和管控企业的供应链中断风险,以增强供应链的稳定性与韧性。 展开更多
关键词 文本信息 词嵌入模型 供应链中断风险 特有信息
在线阅读 下载PDF
科技领域词汇语义表示的稳定性研究:多种词嵌入模型对比
2
作者 陈果 徐赞 +2 位作者 洪思琪 吴嘉桓 肖璐 《情报学报》 CSSCI CSCD 北大核心 2024年第12期1440-1452,共13页
在科技文献情报分析领域,词汇语义分析至关重要。分布式词嵌入技术可以有效学习词汇的语义表示,近年来逐渐成为科技词汇语义分析的共性基础技术。然而,主流词嵌入模型的随机初始化操作使得即使在相同的语料上,每次训练产生的词汇语义向... 在科技文献情报分析领域,词汇语义分析至关重要。分布式词嵌入技术可以有效学习词汇的语义表示,近年来逐渐成为科技词汇语义分析的共性基础技术。然而,主流词嵌入模型的随机初始化操作使得即使在相同的语料上,每次训练产生的词汇语义向量都有不同程度的偏差,干扰了下游语义分析任务结果的可靠性与可复现能力。为了厘清模型和各因素对词汇语义表示结果稳定性的干扰程度,本文开展多种对比实验,以量化指导后续技术选型。本文综合考虑了领域数据集大小、模型种类、训练算法、关键词频次、向量维度、上下文窗口大小等影响因素,设计了基于语义场重叠的稳定性评估指标和相应的实验方案。在“人工智能”“免疫学”“货币政策”“量子纠缠”4个领域的MAG(Microsoft Academic Graph)论文语料集上,针对论文关键词开展多种模型词嵌入模型(Word2Vec、GloVe和fastText),训练并比较各种结果的稳定性。4个领域的研究结果均表明,在一定范围内,数据集越大,语义表示的稳定性越好,但GloVe例外;考虑语料规模、待分析关键词频次、词形相似等因素时,词嵌入模型的稳定性各有不同;向量维度为300,上下文窗口为5是较为合适的选择。最后,本文给出了多种因素组合下建议选择的词嵌入模型与技术,为后续科技词汇语义分析研究提供了量化证据和借鉴。 展开更多
关键词 科技情报分析 领域知识分析 汇语义 语义表示稳定性 词嵌入模型
在线阅读 下载PDF
基于TB-IDACNN的新闻推荐模型
3
作者 辛春花 鲁晓波 何婷 《计算机工程与设计》 北大核心 2025年第5期1387-1394,共8页
针对现有新闻推荐方法存在未考虑新闻的动态特性、难以深度挖掘新闻的语义信息等问题,提出一种融合TinyBERT和改进型动态注意卷积神经网络的个性化新闻推荐模型(TB-IDACNN)。充分利用TinyBERT词向量模型、卷积神经网络和内积注意力网络... 针对现有新闻推荐方法存在未考虑新闻的动态特性、难以深度挖掘新闻的语义信息等问题,提出一种融合TinyBERT和改进型动态注意卷积神经网络的个性化新闻推荐模型(TB-IDACNN)。充分利用TinyBERT词向量模型、卷积神经网络和内积注意力网络等深度学习模型的优势,综合考虑新闻的动态特性和静态特性,实现个性化新闻推荐。在MIND和Adressa数据集上的结果表明,相比其它几种先进的新闻推荐模型,所提模型可以获得更好的推荐性能,能够有效满足用户在新闻推荐任务中的需求。 展开更多
关键词 动态神经网络 新闻推荐 词嵌入模型 内积注意力机制 卷积神经网络 向量化 平均加权池化
在线阅读 下载PDF
面向上下位关系预测的词嵌入投影模型 被引量:11
4
作者 汪诚愚 何晓丰 +1 位作者 宫学庆 周傲英 《计算机学报》 EI CSCD 北大核心 2020年第5期868-883,共16页
上下位关系是自然语言处理领域中的重要概念,用于描述概念之间的从属关系.上下位关系的精准预测,有助于挖掘概念之间的内在层次结构,是构建大规模语义网络、知识本体、知识图谱等知识密集型系统的重要基石.传统上下位关系的预测算法大... 上下位关系是自然语言处理领域中的重要概念,用于描述概念之间的从属关系.上下位关系的精准预测,有助于挖掘概念之间的内在层次结构,是构建大规模语义网络、知识本体、知识图谱等知识密集型系统的重要基石.传统上下位关系的预测算法大多依赖较为固定的语言模式,因而具有低覆盖度、高人工干预等缺陷.此外,语言模式与语言本身的特性高度相关,在中文等表述灵活的语言中预测精度较低.随着深度学习技术在自然语言处理领域迅猛发展,词嵌入技术被广泛应用于建模词之间的语义关系.特别地,词嵌入投影模型学习如何将下位词的词向量投影到上位词的词向量,显式地建模了上下位关系的关系表示.基于已有经典研究以及最新成果,本文详细论述了词嵌入投影模型的发展过程和最新研究进展,包括基于迭代学习、转导学习、对抗学习等深度学习技术在词嵌入投影模型上的改进.在实验中,我们对多个词嵌入投影模型在中文和英文的公开数据集上进行充分详细的评测,探讨了不同的词嵌入投影模型在不同学习场景下的优缺点.最后,在面向特定领域和长尾上下位关系抽取等问题上探讨了未来的研究展望. 展开更多
关键词 上下位关系 嵌入 嵌入投影模型 关系抽取 中文语言特性
在线阅读 下载PDF
基于语言模型词嵌入和注意力机制的敏感信息检测方法 被引量:13
5
作者 黄诚 赵倩锐 《计算机应用》 CSCD 北大核心 2022年第7期2009-2014,共6页
针对基于关键词字符匹配和短语级情感分析等传统敏感信息检测方法准确率低和泛化性差的问题,提出了一种基于语言模型词嵌入和注意力机制(A-ELMo)的敏感信息检测方法。首先,进行字典树快速匹配,以最大限度地减少无用字符的比较,从而极大... 针对基于关键词字符匹配和短语级情感分析等传统敏感信息检测方法准确率低和泛化性差的问题,提出了一种基于语言模型词嵌入和注意力机制(A-ELMo)的敏感信息检测方法。首先,进行字典树快速匹配,以最大限度地减少无用字符的比较,从而极大地提高查询效率;其次,构建了一个语言模型词嵌入模型(ELMo)进行语境分析,并通过动态词向量充分表征语境特征,从而实现较高的可扩展性;最后,结合注意力机制加强模型对敏感特征的识别度,从而进一步提升对敏感信息的检测率。在由多个网络数据源构成的真实数据集上进行实验,结果表明,所提敏感信息检测方法与基于短语级情感分析的方法相比,准确率提升了13.3个百分点;与基于关键字匹配的方法相比,准确率提升了43.5个百分点,充分验证了所提方法在加强敏感特征识别度、提高敏感信息检测率方面的优越性。 展开更多
关键词 敏感信息 语言模型嵌入 语境分析 注意力机制 字典树
在线阅读 下载PDF
基于语义嵌入模型与交易信息的智能合约自动分类系统 被引量:15
6
作者 黄步添 刘琦 +2 位作者 何钦铭 刘振广 陈建海 《自动化学报》 EI CSCD 北大核心 2017年第9期1532-1543,共12页
作为区块链技术的一个突破性扩展,智能合约允许用户在区块链上实现个性化的代码逻辑从而使得区块链技术更加的简单易用.在智能合约代码信息迅速增长的背景下,如何管理和组织海量智能合约代码变得更具挑战性.基于人工智能技术的代码分类... 作为区块链技术的一个突破性扩展,智能合约允许用户在区块链上实现个性化的代码逻辑从而使得区块链技术更加的简单易用.在智能合约代码信息迅速增长的背景下,如何管理和组织海量智能合约代码变得更具挑战性.基于人工智能技术的代码分类系统能根据代码的文本信息自动分门别类,从而更好地帮助人们管理和组织代码的信息.本文以Ethereum平台上的智能合约为例,鉴于词嵌入模型可以捕获代码的语义信息,提出一种基于词嵌入模型的智能合约分类系统.另外,每一个智能合约都关联着一系列交易,我们又通过智能合约的交易信息来更深入地了解智能合约的逻辑行为.据我们所知,本文是对智能合约代码自动分类问题的首次研究尝试.测试结果显示该系统具有较为令人满意的分类性能. 展开更多
关键词 智能合约 代码 交易信息 词嵌入模型 神经网络 长短时记忆模型
在线阅读 下载PDF
基于词嵌入与卷积神经网络的建筑能耗预测 被引量:9
7
作者 季天瑶 王挺韶 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第6期40-48,共9页
在对建筑能耗进行回归预测时需要利用到时序特征与分类特征,而传统模型只能处理其中一种特征。针对该问题,文中提出了一种融合一维卷积与词嵌入的神经网络新构架,其中,一维卷积核能提取连续的时间序列特征,词嵌入模型能对离散的分类特... 在对建筑能耗进行回归预测时需要利用到时序特征与分类特征,而传统模型只能处理其中一种特征。针对该问题,文中提出了一种融合一维卷积与词嵌入的神经网络新构架,其中,一维卷积核能提取连续的时间序列特征,词嵌入模型能对离散的分类特征进行嵌入计算,从而建立能同时处理时序特征与分类特征的建筑能耗预测模型。通过与梯度提升决策回归树和长短时记忆网络的比较,证明所提出的模型在效率与准确率上都有良好的表现。在超参数调节上,采用基于贝叶斯优化的超参数自动优化算法,该算法能在树搜索空间上寻找最优超参数,相比于人工调参,超参数自动寻优算法能在较快的时间内提升模型本身的性能。最后进行了算例仿真,结果表明,文中提出的模型在性能上要优于集成学习模型与长短时记忆网络。 展开更多
关键词 建筑能耗预测 一维卷积网络 词嵌入模型 梯度提升决策回归树 长短时记忆网络 贝叶斯优化 超参数自动优化算法
在线阅读 下载PDF
基于语义关联与模糊聚类的共词分析方法 被引量:7
8
作者 陆泉 曹越 陈静 《情报学报》 CSSCI CSCD 北大核心 2022年第10期1003-1014,共12页
共词分析是文本内容分析的重要基础方法,但已有共词分析方法存在两方面不足,一是在关键词共词矩阵构建中未考虑词对的语义关联,二是在共词矩阵聚类分析中不支持词汇主题归属的多元性。本文提出基于语义关联与模糊聚类的共词分析方法,结... 共词分析是文本内容分析的重要基础方法,但已有共词分析方法存在两方面不足,一是在关键词共词矩阵构建中未考虑词对的语义关联,二是在共词矩阵聚类分析中不支持词汇主题归属的多元性。本文提出基于语义关联与模糊聚类的共词分析方法,结合高频低频词界分公式和词频g指数抽取领域关键词,利用词嵌入模型学习关键词的语义向量表示,进而构建语义加权共词矩阵,以综合共现特征与语义关联来度量词对间相关性;结合模糊C均值聚类算法与因子降维对语义加权共词矩阵进行关键词模糊聚类,以弥补硬聚类中词汇主题归属单一化的不足,提高类团的信息质量并揭示类团之间的联系。选择“感染性疾病学和传染病学类”期刊文献开展实验,结果验证了本文方法的有效性和优越性。 展开更多
关键词 分析 语义关联 词嵌入模型 模糊C均值聚类
在线阅读 下载PDF
以文本为基础的社会科学研究:从内容分析到算法模型 被引量:3
9
作者 胡安宁 《学术论坛》 CSSCI 北大核心 2022年第1期1-8,共8页
文章系统讨论了社会科学研究中以文本为基础的多种方法论,将其分类为以传统内容分析为代表的诠释导向的文本探索方法,以语义网分析和量化叙事分析为代表的诠释与结构并重的文本探索方法以及以主题模型和词嵌入模型为代表的结构导向的文... 文章系统讨论了社会科学研究中以文本为基础的多种方法论,将其分类为以传统内容分析为代表的诠释导向的文本探索方法,以语义网分析和量化叙事分析为代表的诠释与结构并重的文本探索方法以及以主题模型和词嵌入模型为代表的结构导向的文本探索方法。这些方法提出的历史时间点各不相同,呈现出一定的先后次序性,因此通过对比不同类型的方法分析策略,文章展示了以文本为基础的社会科学研究方法论的变迁图景。这一图景在研究目标上,从诠释逐渐转向因果和预测;在研究手段上,从人工为主导逐渐转向机器为主导;在研究对象上,从对意义的寻求逐渐转向对结构的探究。围绕着日渐兴起的以算法为导向的社会科学文本分析技术,文章从数据清洗、数据过拟合和结果验证三个方面讨论了其潜在的局限和未来发展的方向。 展开更多
关键词 文本挖掘 内容分析 语义网分析 量化叙事 主题模型 词嵌入模型
在线阅读 下载PDF
基于层级嵌入学习的社交策展内容推荐 被引量:1
10
作者 苏雪峰 岳云康 《计算机工程与设计》 北大核心 2018年第3期716-720,共5页
为对社交策展网站中的用户-采集册-采集条目进行统一建模,提出一种基于层级嵌入学习的社交策展内容推荐方法。基于语言词向量嵌入模型,通过隐性层级嵌入学习和显性层级嵌入学习两种策略,学习得到用户、采集册和采集条目在同一低维嵌入... 为对社交策展网站中的用户-采集册-采集条目进行统一建模,提出一种基于层级嵌入学习的社交策展内容推荐方法。基于语言词向量嵌入模型,通过隐性层级嵌入学习和显性层级嵌入学习两种策略,学习得到用户、采集册和采集条目在同一低维嵌入空间的表达。通过该方法获得的嵌入表达较好捕捉了用户与内容之间的关联关系,可以准确匹配需求用户和感兴趣内容,应用到个性化信息推荐问题中。在图像策展网站Pinterest上的实验验证了该方法在采集册推荐和采集条目推荐问题上的有效性。 展开更多
关键词 社交策展 层级嵌入学习 推荐系统 深度学习 向量嵌入模型
在线阅读 下载PDF
基于全域跨语义融合的多级酶功能预测
11
作者 周汉文 邓赵红 张炜 《计算机科学与探索》 北大核心 2025年第6期1588-1597,共10页
蛋白质在生物活动中发挥着关键作用,酶作为一种重要的蛋白质,因其催化功能在多个领域得到广泛应用。然而,通过生化实验验证酶的功能既费时又昂贵。传统的酶功能注释方法主要依赖于序列相似性,但在目标酶序列与已知酶差异较大时,这些方... 蛋白质在生物活动中发挥着关键作用,酶作为一种重要的蛋白质,因其催化功能在多个领域得到广泛应用。然而,通过生化实验验证酶的功能既费时又昂贵。传统的酶功能注释方法主要依赖于序列相似性,但在目标酶序列与已知酶差异较大时,这些方法效果不佳。近年来,科研人员初步探索了一些基于深度学习的方法,但现有的深度学习方法受限于传统酶序列编码方式,并且仅利用单一视图或单层次的信息,这使得模型在处理结构复杂或功能多样的酶时表现出一定的局限性。对此,提出一种新的全域跨语义融合的多级酶功能预测方法(GCMEFP)。所提方法使用了两种最新的蛋白质大语言模型进行序列词嵌入学习。构建了多语义深度特征学习模块,该模块通过卷积神经网络构建语义金字塔,实现了不同层级语义信息的提取。还提出了全域跨视图语义融合模块,用于探索不同视图之间隐藏的相互作用信息,并去除冗余信息来增强模型的泛化性。实验结果表明:提出的GCMEFP在基准数据集上的精度达到89.6%,较现有最优方法高出0.048;在独立测试集New-379上的精度达到55.6%,较现有最优方法高出0.14。 展开更多
关键词 多级酶功能预测 多语义深度特征学习 模型嵌入 多视图特征融合
在线阅读 下载PDF
基于语言模型及循环卷积神经网络的事件检测 被引量:4
12
作者 施喆尔 陈锦秀 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第3期442-448,共7页
目前,事件检测的难点在于一词多义和多事件句的检测.为了解决这些问题,提出了一个新的基于语言模型的带注意力机制的循环卷积神经网络模型(recurrent and convolutional neural network with attention based on language models,LM-ARC... 目前,事件检测的难点在于一词多义和多事件句的检测.为了解决这些问题,提出了一个新的基于语言模型的带注意力机制的循环卷积神经网络模型(recurrent and convolutional neural network with attention based on language models,LM-ARCNN).该模型利用语言模型计算输入句子的词向量,将句子的词向量输入长短期记忆网络获取句子级别的特征,并使用注意力机制捕获句子级别特征中与触发词相关性高的特征,最后将这两部分的特征输入到包含多个最大值池化层的卷积神经网络,提取更多上下文有效组块.在ACE2005英文语料库上进行实验,结果表明,该模型的 F 1 值为74.4%,比现有最优的文本嵌入增强模型(DEEB)高0.4%. 展开更多
关键词 事件检测 语言模型嵌入 长短期记忆网络 动态多池化卷积神经网络 注意力机制
在线阅读 下载PDF
高频诉诸权威如何影响公众对气候传播的响应?——来自文本分析和实验研究的证据
13
作者 胡赛全 刘展余 +1 位作者 袁依格 朱俊明 《管理科学学报》 CSSCI CSCD 北大核心 2024年第11期1-16,共16页
气候传播实践中激发公众响应的一种常用策略是诉诸权威.已有研究仅关注诉诸权威的使用与否,而忽视诉诸权威的使用频率和类型结构这两个特征对公众气候传播响应的影响.据此,本研究将回答高频诉诸权威如何影响公众气候传播响应,及此影响... 气候传播实践中激发公众响应的一种常用策略是诉诸权威.已有研究仅关注诉诸权威的使用与否,而忽视诉诸权威的使用频率和类型结构这两个特征对公众气候传播响应的影响.据此,本研究将回答高频诉诸权威如何影响公众气候传播响应,及此影响机制如何受权威类型结构的调节这两个问题.通过一项文本分析和两项实验研究分别对上述变量间的相关和因果关系进行检验,结果显示,与低频诉诸权威相比,高频诉诸权威会(以感知说服性意图为中介)显著降低公众对气候传播的态度与情感响应,但这一结论仅在低均衡性权威类型结构下成立.在高均衡性权威类型结构下,高频诉诸权威则会(不以感知说服性意图为中介)显著提高公众对气候传播的态度和情感响应.本研究的结论对气候传播实践中有效使用诉诸权威策略来改善公众响应具有重要启示. 展开更多
关键词 气候传播 诉诸权威 权威类型结构 精细化加工可能性模型 词嵌入模型
在线阅读 下载PDF
基于多目标优化算法NSGA-II推荐相似缺陷报告 被引量:13
14
作者 樊田田 许蕾 陈林 《计算机学报》 EI CSCD 北大核心 2019年第10期2175-2189,共15页
在软件开发过程中,开发人员会收到用户提交的大量缺陷报告.若修复缺陷报告中问题涉及到的相同源代码文件数目超过一半,则称这些缺陷报告为相似缺陷报告.给开发人员推荐相似缺陷报告能够有效节约开发人员修复缺陷的时间.该文提出一种基... 在软件开发过程中,开发人员会收到用户提交的大量缺陷报告.若修复缺陷报告中问题涉及到的相同源代码文件数目超过一半,则称这些缺陷报告为相似缺陷报告.给开发人员推荐相似缺陷报告能够有效节约开发人员修复缺陷的时间.该文提出一种基于多目标优化算法NSGA-Ⅱ推荐相似缺陷报告的方法,即在推荐尽可能少的相似缺陷报告情况下,使得缺陷报告间的相似度尽可能大.为此,利用缺陷报告的摘要和描述信息,该文采用TFIDF和Word Embedding两种方法,从历史缺陷报告中找出相似的缺陷报告,并采用基于搜索的多目标优化算法NSGA-Ⅱ来保证推荐的相似缺陷报告数目尽可能少.实验数据集是6个开源项目(AspectJ、Birt、Eclipse UI、JDT、SWT和Tomcat).与采用单目标算法相比,该文方法在推荐相似缺陷报告的准确率、平均准确率均值、平均序位倒数均值都有提高,其中,在Top@1准确率、平均准确率均值、平均序位倒数均值上分别比Yang方法提高125.5%、67.7%和62.75%. 展开更多
关键词 相似缺陷报告推荐 多目标优化 空间向量模型 词嵌入模型 NSGA-Ⅱ算法 软件工程
在线阅读 下载PDF
融合ChineseBERT和双向注意力流的中文商品评论方面情感分析 被引量:1
15
作者 胡晓丽 张于贤 黄思睿 《广西科学》 CAS 北大核心 2023年第1期187-195,共9页
准确分类电商平台中用户评论所包含的多个方面的情感极性,能够提升购买决策的有效性。为此,提出一种融合ChineseBERT和双向注意力流(Bidirectional Attention Flow,BiDAF)的中文商品评论方面情感分析模型。首先,通过融合拼音与字形的Chi... 准确分类电商平台中用户评论所包含的多个方面的情感极性,能够提升购买决策的有效性。为此,提出一种融合ChineseBERT和双向注意力流(Bidirectional Attention Flow,BiDAF)的中文商品评论方面情感分析模型。首先,通过融合拼音与字形的ChineseBERT预训练语言模型获得评论文本和方面文本的词嵌入,并采用从位置编码和内存压缩注意力两个方面改进的Transformer来表征评论文本和方面文本的语义信息。然后,使用双向注意力流学习评论文本与方面文本的关系,找出评论文本和方面文本中关键信息所对应的词语。最后,将Transformer和双向注意力流的输出同时输入到多层感知机(Multilayer Perceptron,MLP)中,进行信息级联和情感极性的分类输出。测试结果表明,提出的模型在两个数据集上的准确率分别为82.90%和71.08%,F1分数分别为82.81%和70.98%。 展开更多
关键词 商品评论 方面情感分析 词嵌入模型 注意力机制 双向注意力流
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部