期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于改进词移嵌入的文本表示方法研究
1
作者 岑咏华 李文敬 刘贤祖 《情报学报》 北大核心 2025年第9期1173-1191,共19页
文本表示是文本处理和分析的基础工作,在情感分析、文本分类等下游任务中发挥关键作用。鉴于传统模型存在语义精度不足、上下文窗口受限等局限性,基于词移距离(word mover's distance,WMD)和词移嵌入(word mover's embedding,W... 文本表示是文本处理和分析的基础工作,在情感分析、文本分类等下游任务中发挥关键作用。鉴于传统模型存在语义精度不足、上下文窗口受限等局限性,基于词移距离(word mover's distance,WMD)和词移嵌入(word mover's embedding,WME)的文本表示模型近年来受到特别关注。本文提出一种基于潜在狄利克雷分配(latent Dirichlet allocation,LDA)初始化和WFR(Wasserstein-Fisher-Rao)文本距离的改进词移嵌入表示方法LDA-WFR-WME。该方法通过LDA建模初始化嵌入维度,弥补一般词移嵌入模型通过随机文档表征嵌入维度时由均匀分布采样导致语义偏差的缺陷;引入WFR文本距离,解决文档间语义细节因差异过大而引起的距离失真问题。本文以多组短文本情感分析、长文本分类以及文本聚类任务为例,以Doc2Vec(document to vector)、Attention-BiLSTM(bidirectional long short-term memory)、BERT(bidirectional encoder representations from transformers)、Attention-BiGRU-CNN(attention-bidirectional gated recurrent unit-convolutional neural network)、BiGAT(bidirectional graph attention network)等为竞争模型,进行实验对比分析。结果表明,LDA-WFR-WME方法在文本篇章的嵌入式表示方面体现出更优的性能。 展开更多
关键词 文本嵌入表示 词移嵌入 WFR文档距离 LDA-WFR-WME
在线阅读 下载PDF
基金项目研究的主题挖掘与动态演化分析——以美国NSF数据中AI领域为例 被引量:19
2
作者 靳嘉林 王曰芬 +1 位作者 巴志超 岑咏华 《情报学报》 CSSCI CSCD 北大核心 2022年第9期967-979,共13页
本文旨在构架基金项目研究主题挖掘与动态演化分析的情报研究流程,通过对表征基金项目标题、摘要与学部的数据进行关联建模和挖掘,从项目内容层面上探究基金资助领域研究涉及的主题特点、范围侧重、发展方向及演化脉络。首先利用RAKE (r... 本文旨在构架基金项目研究主题挖掘与动态演化分析的情报研究流程,通过对表征基金项目标题、摘要与学部的数据进行关联建模和挖掘,从项目内容层面上探究基金资助领域研究涉及的主题特点、范围侧重、发展方向及演化脉络。首先利用RAKE (rapid automatic keyword extraction)关键词抽取算法从基金数据中的标题和摘要中抽取关键词,通过术语切分等方式获得核心关键词;然后,采用Google的word2vec深度学习工具对核心关键词进行词向量建模,并使用k-means算法对生成的词向量进行聚类,挖掘相应的研究主题;进而对主题分布进行统计分析,且通过WMD (word mover’s distance)算法计算主题之间的相似度,以分析研究主题演化趋势,并识别出演化主路径。实证研究发现,以美国NSF (National Science Foundation)数据中AI (artificial intelligence)领域为例,所提方法流程能够识别出AI领域的多个主题,且能识别出不同学部的主题侧重;在发展过程中,研究主题演化呈现出大量分裂与融合的复杂态势,演化路径明晰,侧重点突出,通过演化强度能够明晰研究主题演化的主路径。研究结果表明,本文方法流程能够有效揭示基金资助对相关技术的整合与推动态势,可为学术研究与政府规划提供有力的支撑。 展开更多
关键词 主题挖掘 动态演化 词向量建模 美国国家科学基金 人工智能
在线阅读 下载PDF
基金项目计划学部交叉及对前沿分布的影响研究——以美国NSF数据中AI领域为例 被引量:9
3
作者 范丽鹏 王曰芬 +1 位作者 岑咏华 杨洁 《情报学报》 CSSCI CSCD 北大核心 2022年第9期956-966,共11页
本文旨在融合学者参与度的基础上,测算和分析基金项目计划的学部交叉度,并识别前沿型项目计划,从项目资助专项层面上探究学部交叉对项目计划资助与前沿型项目计划分布的影响。本文首先以项目计划为研究对象,为融合项目计划的学部多样性... 本文旨在融合学者参与度的基础上,测算和分析基金项目计划的学部交叉度,并识别前沿型项目计划,从项目资助专项层面上探究学部交叉对项目计划资助与前沿型项目计划分布的影响。本文首先以项目计划为研究对象,为融合项目计划的学部多样性和不同学者对同一项目计划各学部参与的均衡性,引入Rao-Stirling指标,将项目计划分为学部高交叉、中交叉、低交叉和不交叉类;其次,依据项目计划的资助强度和资助趋势,结合学部交叉特性,将项目计划分为不同交叉水平的前沿型、热点型、潜在型和衰退型;最后,对高交叉前沿型项目计划进行具体分析。研究结果表明,以美国NSF (National Science Foundation)资助的AI (artificial intelligence)领域为例,NSF资助的项目计划在学部交叉和不交叉类的数目上分布较为均衡,但对交叉类项目计划的平均资助强度远高于不交叉类型;在前沿分布上,不交叉类的项目计划多为潜在型,而学部高交叉类和低交叉类的前沿型占比相对较高,且对前沿型项目计划的资助趋势向高交叉类倾斜;高交叉类的前沿型项目计划多倾向于神经与认知系统、自然与人类系统、信息智能系统等方面的研究。 展开更多
关键词 学部交叉 前沿识别 Rao-Stirling指数 美国国家科学基金 人工智能
在线阅读 下载PDF
长三角地区AI领域城市协同创新网络及影响因素研究 被引量:1
4
作者 王曰芬 周玜宇 岑咏华 《情报学报》 CSSCI CSCD 北大核心 2024年第4期377-390,共14页
探索城市协同创新的机制与影响因素,推动地区间与多主体的科技创新发展。本文采集2016—2021年的长三角地区AI(artificial intelligence)领域专利数据,以该地区核心的27座城市作为研究对象,将城市与专利技术知识组合构建城市协同创新网... 探索城市协同创新的机制与影响因素,推动地区间与多主体的科技创新发展。本文采集2016—2021年的长三角地区AI(artificial intelligence)领域专利数据,以该地区核心的27座城市作为研究对象,将城市与专利技术知识组合构建城市协同创新网络。采用社会网络分析法对所构建网络的属性特征、离散程度与结构状态及其变化进行分析研究,利用指数随机图模型,结合城市的历年统计指标、城市等级和隶属省份以及历史经验网络,对城市协同创新形成机制与影响因素进行模型构建及分析。研究结果表明,长三角地区AI领域城市协同创新网络的规模和丰富性逐年增长,网络的可达性与影响力逐渐增加,核心城市与技术节点联系紧密、分布在不同子群中且稳定性程度逐渐提高,网络受限节点逐渐减少且结构愈加均衡;在网络形成机制及影响因素方面,节点的主效应中工业化水平和教育支出有明显的促进发展作用,隶属省份与行政等级的同质性对网络发展产生不同的作用,网络路径依赖趋势明显,上一年的现实网络对下一年的网络形成具有重要影响作用。 展开更多
关键词 城市协同创新网络 影响因素 专利数据 统计指标 人工智能 长三角地区
在线阅读 下载PDF
基金项目学部分部的交叉网络分析——以美国NSF数据中AI领域为例 被引量:4
5
作者 杨洁 王曰芬 +1 位作者 陈必坤 恢光平 《情报学报》 CSSCI CSCD 北大核心 2022年第9期945-955,共11页
本文旨在通过探究基金资助项目研究的交叉融合状况与趋势,从学部分部内容交叉层面探究基金投入对交叉研究的引导方向、影响特征及演化作用。本文组合共词网络分析和学科交叉研究等方法,从基金学部分部内在知识的聚合和基金分部间知识的... 本文旨在通过探究基金资助项目研究的交叉融合状况与趋势,从学部分部内容交叉层面探究基金投入对交叉研究的引导方向、影响特征及演化作用。本文组合共词网络分析和学科交叉研究等方法,从基金学部分部内在知识的聚合和基金分部间知识的交叉两个维度,构建对分部内部知识发展状况及分部间交叉态势的分析框架和测度方法。研究结果表明,以美国NSF (National Science Foundation)数据中AI (artificial intelligence)领域为例,该领域在基金投入引导下,随着年代递进,不同分部受资助项目数量增加,主题多样性增加,分部内部知识聚合程度降低,分部间交叉融合程度增强,同时分部内部知识聚合程度和分部间交叉融合程度均出现了明显分化;NSF分部的知识交叉集中在有相同或相似的理论方法的学科框架之下,表明知识实现近距离交叉融合更容易;内部知识的聚合性与外部知识的交叉程度具有一定的关联性。 展开更多
关键词 交叉研究 网络分析 交叉演化 美国国家科学基金 人工智能
在线阅读 下载PDF
绿色发展理念支撑的生态文明建设综合评价指标体系构建及应用 被引量:11
6
作者 王曰芬 徐天傲 岑咏华 《智库理论与实践》 CSSCI 2023年第4期52-63,共12页
[目的/意义]绿色发展是大力推进生态文明建设和突破发展掣肘的必经之路。将绿色发展理念贯穿到生态文明建设过程中,推动生态文明建设走向绿色发展水平,具有重要意义。[方法/过程]本文基于绿色发展理念,构建以“生态环境–生态经济–生... [目的/意义]绿色发展是大力推进生态文明建设和突破发展掣肘的必经之路。将绿色发展理念贯穿到生态文明建设过程中,推动生态文明建设走向绿色发展水平,具有重要意义。[方法/过程]本文基于绿色发展理念,构建以“生态环境–生态经济–生态社会”为框架的三级综合评价指标体系,采用组合客观赋权法确定指标权重,结合指标排名和提升程度排名形成综合排名方式进行综合评价,并选取重点区域作为实证对象加以应用研究。[结果/结论]本文提出的综合评价方法能够在使用客观赋权时避免因各最高级指标层下属指标数量不同而对评价结果平衡性、准确性造成影响,较好地以动静结合的方式反映绿色发展理念支撑的生态文明建设的综合水平。 展开更多
关键词 生态文明 绿色发展 指标体系 综合评价
在线阅读 下载PDF
学科主题探测与演化分析:多视角述评与展望 被引量:6
7
作者 岑咏华 王曰芬 《情报学报》 CSSCI CSCD 北大核心 2023年第4期477-494,I0002-I0006,共23页
如何借助于有效的方法和途径在大量文献数据基础上对学科主题进行深入和精准的探测和跟踪,是以情报学科学计量领域为核心、不同学科共同致力突破的热点和前沿研究问题。相关方法和途径主要涉及频次视角、内容视角、引证视角以及融合视... 如何借助于有效的方法和途径在大量文献数据基础上对学科主题进行深入和精准的探测和跟踪,是以情报学科学计量领域为核心、不同学科共同致力突破的热点和前沿研究问题。相关方法和途径主要涉及频次视角、内容视角、引证视角以及融合视角等四个视角。本研究试图结合近年来发表于国际国内重要期刊有关学科主题探测和演化分析的最新文献,对相关视角的主要进展进行述评,归纳总结不同视角的实现路径和机制,指出已有视角可能存在的知识单元或者网络关系的异质重要性偏差问题、知识的时间衰变以及新兴主题特征的小样本弱势问题、主题自然发育和进化的拟合困境、微观层面的知识流动和变迁刻画问题等,特别地,为融合视角这一总体趋势指明方向。 展开更多
关键词 主题探测跟踪 主题演化分析 频次分析 内容分析 引证分析 融合视角
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部