期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
科技领域情报分析中文献集构造方式比较研究:一致性与可靠性问题 被引量:4
1
作者 陈果 邵雨 王曰芬 《情报学报》 CSSCI CSCD 北大核心 2020年第10期1034-1045,共12页
科技领域情报分析中,文献集构造有多种方式,但目前尚不清楚这些方式间的差别及可靠性。推动科技情报分析方法科学化的第一步,是探索能保证分析结果可靠性的领域文献集构造方法。因此,本文旨在通过实证分析量化地解答这一问题。以“人工... 科技领域情报分析中,文献集构造有多种方式,但目前尚不清楚这些方式间的差别及可靠性。推动科技情报分析方法科学化的第一步,是探索能保证分析结果可靠性的领域文献集构造方法。因此,本文旨在通过实证分析量化地解答这一问题。以“人工智能”领域为例,本文在充分考虑科技情报分析多种任务场景(包括不同分析元素、不同元素数量、排序与否等)的前提下,设计了3个递进式的实验,分别为:①当前几种主流文献集构造方式间,所得结果差异性如何?②这些文献集构造方式所得结果的可靠性如何?③对这些文献集进行组合是否能提高最终分析结果的可靠性?实验结果表明,粗粒度元素(如国家)情报分析任务上,现有文献集构造方式结果差异不大,可靠性较高;但在细粒度元素(特别是作者)情报分析任务上,现有文献集构造方式结果差异明显,可靠性较低。不同情报分析任务上可以相应地挑选最合适的文献集构造方式。对现有文献集构造方式所得文献集进行组合,可靠性提升并不明显。总之,优化文献集构造方式是当前科技情报分析中必须重点关注的问题。最后,基于量化指标,本文给出了科技情报分析中在文献集构造层面上提高可靠性的一些建议,以及未来研究的一些思路。 展开更多
关键词 领域知识分析 科技情报分析 文献计量 文献集构造 数据质量
在线阅读 下载PDF
文献集规模对科技领域情报分析的影响:多种任务场景下的实证分析 被引量:4
2
作者 陈果 王盼停 王曰芬 《情报学报》 CSSCI CSCD 北大核心 2021年第8期869-878,共10页
面向特定领域开展科技情报分析时,由于文献的集中与离散分布规律,难以有效构造全量文献集。那么多大规模的领域文献集是可靠的?这一问题在不同的情报分析任务场景下,有不同答案。本文综合考虑待分析领域大小、待分析对象(学科分类、国... 面向特定领域开展科技情报分析时,由于文献的集中与离散分布规律,难以有效构造全量文献集。那么多大规模的领域文献集是可靠的?这一问题在不同的情报分析任务场景下,有不同答案。本文综合考虑待分析领域大小、待分析对象(学科分类、国家、机构、关键词、引文、作者,及其各自共现关系)、待分析对象的Top值截取(如高频词)数量、结果是否考虑排序等常见的多种任务场景,设计相应的实验方案。以“人工智能”领域WoS(Web of Science)数据为例,开展多种规模的数据抽样,并计算得出抽样子文献集对全量文献集的拟合指标值为4800个,以量化结果揭示科技情报分析中不同任务场景对文献集规模的要求。研究结果表明,涉及学科与国家分类的分析任务,以极小规模文献集便可得到较为可靠的结果;涉及作者的分析任务,对于文献集规模的要求极高,有必要采用全量数据;涉及机构、关键词、引文的分析任务,文献集达到一定规模可得到较为可靠的结果,但相应规模受不同因素的影响,尤其是共现分析、截取较多Top对象和结果要求排序这三种任务场景对文献集规模要求更高。 展开更多
关键词 领域知识分析 科技情报分析 文献计量 文献集规模
在线阅读 下载PDF
多因素驱动下的领域知识网络演化模型:跟风、守旧与创新 被引量:18
3
作者 陈果 赵以昕 《情报学报》 CSSCI CSCD 北大核心 2020年第1期1-11,共11页
当前几种经典的复杂网络模型尚不能有效拟合领域知识网络现实情况,表现为:①以边连线为增长单元难以有效拟合知识网络模块化增长的高聚集效应;②知识增长中除马太效应外,有其他重要因素(如守旧、创新)与之抗衡。因此,有必要根据领域知... 当前几种经典的复杂网络模型尚不能有效拟合领域知识网络现实情况,表现为:①以边连线为增长单元难以有效拟合知识网络模块化增长的高聚集效应;②知识增长中除马太效应外,有其他重要因素(如守旧、创新)与之抗衡。因此,有必要根据领域知识自身增长特点探寻一种新的演化模型,以有效实现领域知识的量化分析和预测。本文以典型的领域共词网络为例,从微观的增长视角解析其生成过程、增长方式和多种影响因素,以前人研究结论为证据,提出一种由模块化增长单元组成,并融合跟风、守旧与创新三种影响因素的领域知识网络演化模型;随后,通过实验仿真证明了该模型能更好地拟合现实领域知识网络的整体和微观结构;最后,以此模型为基础,通过进一步的仿真实验揭示了相关因素在领域新知识增长、知识聚集中的影响力度和相互作用。本研究为领域知识增长规律和共现型知识网络结构规律的探索提供了更直接可靠的量化分析基础。 展开更多
关键词 领域知识分析 共词网络 知识演化 网络演化模型
在线阅读 下载PDF
基于数据科学的知识创新服务应用模式构建研究 被引量:22
4
作者 曹嘉君 王曰芬 《情报学报》 CSSCI CSCD 北大核心 2018年第10期971-978,共8页
大数据时代背景下知识需求发生变化,现有知识服务模式难以适用于知识创新发展与数据密集型科学研究范式的转变,需要导入数据科学构建面向知识创新服务的应用模式。本研究在概述知识创新、知识服务、数据科学的基础上,探索知识创新服务... 大数据时代背景下知识需求发生变化,现有知识服务模式难以适用于知识创新发展与数据密集型科学研究范式的转变,需要导入数据科学构建面向知识创新服务的应用模式。本研究在概述知识创新、知识服务、数据科学的基础上,探索知识创新服务的概念与特点及导入数据科学的目的,并分析知识创新服务模式的研究现状。进而提出知识创新服务模式构建需求及目标,尝试构建基于数据科学的知识创新服务应用模式。研究认为基于数据科学的知识创新服务模式主要应由数据基础层、分析逻辑层和结果展现层三个层面构成。同时,依据知识内容分析、知识创新模式等角度,从四个方面对知识创新服务模式进行阐述。 展开更多
关键词 知识创新 知识服务 知识创新服务 数据科学 应用模式 模式构建
在线阅读 下载PDF
国外新兴研究话题发现研究综述 被引量:38
5
作者 卢超 侯海燕 +1 位作者 Ding Ying 章成志 《情报学报》 CSSCI CSCD 北大核心 2019年第1期97-110,共14页
新兴研究话题发现一直以来都是学者们广泛关注的研究问题。对于新兴研究话题动向的把握,不仅可从宏观层面为管理部门制定科技政策提供决策支持、以提高科研资金投入的效益、加速科学进步和发展,还可为科研工作者投身富有前景的研究领域... 新兴研究话题发现一直以来都是学者们广泛关注的研究问题。对于新兴研究话题动向的把握,不仅可从宏观层面为管理部门制定科技政策提供决策支持、以提高科研资金投入的效益、加速科学进步和发展,还可为科研工作者投身富有前景的研究领域提供具体的研究方向建议。对国际核心期刊上关于新兴研究话题发现的研究现状进行梳理发现,目前学术界对新兴研究话题及其相关概念尚无清晰的界定;相应地,新兴研究话题的探测方法也存在诸多的不足;探测新兴研究话题中所依据的指标繁杂多样。综述现有研究,本文给出新兴研究话题的概念及其特征的界定,比较新兴研究话题及其相关概念的联系与区别,并指出在新兴研究话题发现中应注意的具体问题并提出四个方面的工作展望。 展开更多
关键词 新兴研究话题发现 研究前沿 共被引分析 文献耦合分析 直接引用分析
在线阅读 下载PDF
学术专著引用行为研究——基于引文内容特征分析的视角 被引量:16
6
作者 章成志 王玉琢 卢超 《情报学报》 CSSCI CSCD 北大核心 2017年第3期319-330,共12页
当前的引文内容分析研究基本上以学术论文为研究对象。与学术论文相比,学术专著的篇幅较长、引文内容更加翔实。学术专著的引文内容特征分布对学术专著的引文内容分析方法、乃至引用行为与动机等研究都具有重要的意义。本文首先通过对Mo... 当前的引文内容分析研究基本上以学术论文为研究对象。与学术论文相比,学术专著的篇幅较长、引文内容更加翔实。学术专著的引文内容特征分布对学术专著的引文内容分析方法、乃至引用行为与动机等研究都具有重要的意义。本文首先通过对Morgan&Claypool出版的39本学术专著的引文内容进行人工标注,构建包含13539条引文内容的学术专著引文内容分析语料;然后分别从引文内容位置分布、引文提及次数以及引文内容上下文特征等三个方面分析学术专著的引文行为,并针对不同学科学术专著的引用行为特点进行了总结;最后本文讨论了学术专著与学术论文引文内容特征分布的差异,并指出进行学术专著引文内容分析时应注意的问题。本文研究成果可以帮助学者进一步了解学术专著引用行为的特点,并为后续的学术专著中的引文动机研究打下基础。 展开更多
关键词 学术专著 引文内容分析 引用行为 引用位置 提及次数
在线阅读 下载PDF
生命周期阶段中的科学合作网络演化及高影响力学者成长特征研究 被引量:19
7
作者 王曰芬 李冬琼 余厚强 《情报学报》 CSSCI CSCD 北大核心 2018年第2期121-131,共11页
为进一步研究科学合作的关系,并揭示科学发展的规律。本论文以文献增长规律与生命周期理论为基础,借助于数理统计与复杂网络分析方法,以CNKI数据库中的新能源领域研究为例,从整体属性和个体成长角度,分析科学合作网络在不同生命周期阶... 为进一步研究科学合作的关系,并揭示科学发展的规律。本论文以文献增长规律与生命周期理论为基础,借助于数理统计与复杂网络分析方法,以CNKI数据库中的新能源领域研究为例,从整体属性和个体成长角度,分析科学合作网络在不同生命周期阶段的演化特征。首先,通过对科学合作网络结构演变情况分析,发现网络整体随阶段不同存在着差异。在分布上,除萌芽期初始阶段的网络是随机网络外,其他各阶段的网络均是无标度网络。其次,从初始合作模式、成长演变模式、所处网络类型三个方面,探寻新能源领域生命周期阶段中top10高影响力学者的成长变化特征。研究表明,在初始合作模式方面,通过对合著者数量以及合作者影响力的测度,发现高影响力学者主要按照"独著"、"简单合著"、"带入合著"与"同步合著"四种模式进入;在成长演变模式方面,通过对度中心性变化的测度,发现高影响力学者的合作网络主要体现出"稳步增长型"、"上升下降型"、"持续领导型"、"不温不火型"四种成长形式;在所处合作网络类型方面,通过对网络中核心节点的数目、网络中节点存在年次的测度,发现高影响力节点所在的网络呈现出"流动合作型网络"、"引领成长型网络"以及"多核共处型网络"三种结构状态。 展开更多
关键词 科学合作网络 高影响力学者 网络演化 网络统计特征 成长特征
在线阅读 下载PDF
基于SVM的中文微博观点倾向性识别 被引量:22
8
作者 丁晟春 吴靓婵媛 李红梅 《情报学报》 CSSCI 北大核心 2016年第12期1235-1243,共9页
通过识别海量中文微博文本观点句的情感倾向,能挖掘用户对某事件或产品持有的个人立场。为了找到更适合观点句倾向性识别的特征与模型,本文在分析微博观点句特征基础上,使用句式特征、句内特征以及隐性特征三类特征,借助于SVM模型对微... 通过识别海量中文微博文本观点句的情感倾向,能挖掘用户对某事件或产品持有的个人立场。为了找到更适合观点句倾向性识别的特征与模型,本文在分析微博观点句特征基础上,使用句式特征、句内特征以及隐性特征三类特征,借助于SVM模型对微博进行主客观识别;然后以主观句作为语料,从情感特征、词性特征、句式特征与句间特征四个角度来表示微博,最后利用SVM模型进行观点句的褒义、贬义、褒义贬义混合的情感倾向性分析。该方法在COAE2015 Task2"微博观点句识别"评测结果中取得较好的效果,微平均评估上,准确率达到了74.01%,召回率达到了71.61%,F值为72.79%,综合排名第二,测评结果验证了本文提出的方法有效且具有可行性。 展开更多
关键词 主客观分类 情感倾向性分析 支持向量机 特征选择
在线阅读 下载PDF
新闻替代计量指标的分布特征研究 被引量:12
9
作者 余厚强 曹雪婷 王曰芬 《情报学报》 CSSCI CSCD 北大核心 2020年第10期1081-1092,共12页
学术成果在新闻中的传播痕迹形成了新闻替代计量指标。最新研究表明,该指标能够反映学术成果的社会影响力。本文基于427万余条新闻替代计量数据的统计分析和对比分析,较为系统地揭示了其分布特征。研究发现,综合类和医学类的新闻来源平... 学术成果在新闻中的传播痕迹形成了新闻替代计量指标。最新研究表明,该指标能够反映学术成果的社会影响力。本文基于427万余条新闻替代计量数据的统计分析和对比分析,较为系统地揭示了其分布特征。研究发现,综合类和医学类的新闻来源平台提及学术成果的新闻量最多,其中The Conversation、EurekAlert!和MedicalXpress位居三甲;新闻指标的及时率为56%,优于政策文件指标,弱于新浪微博指标和推特指标;论文层次分布呈集中态势,以独立用户数观察,20%的学术成果拥有65%的新闻提及数,篇均指标值为3.5;来源层次分布基本符合布拉德福定律,测定出了76个核心来源,最核心的来源是The Conversation、Nature和PLoS ONE;学科层次分布中,医学与保健科学“一家独大”,其次是生物科学、心理与认知科学。这些结论将为进一步理解和应用新闻替代计量指标提供参考。 展开更多
关键词 替代计量学 新闻替代计量指标 新闻 科学交流 科学评价
在线阅读 下载PDF
游戏化对MOOC用户持续使用意愿的影响研究 被引量:22
10
作者 朱鹏 朱星圳 丁晟春 《中国电化教育》 CSSCI 北大核心 2019年第4期85-91,共7页
游戏化在教学、教育过程中的作用早已受到广泛关注,游戏化学习、教育游戏化已经成为重要的研究主题。同时,随着网络在线学习平台的不断发展,以提高学习者参与度、学习黏性及持续使用意愿为目的的游戏化学习手段被不断应用和推广。该文... 游戏化在教学、教育过程中的作用早已受到广泛关注,游戏化学习、教育游戏化已经成为重要的研究主题。同时,随着网络在线学习平台的不断发展,以提高学习者参与度、学习黏性及持续使用意愿为目的的游戏化学习手段被不断应用和推广。该文基于期望确认、感知有用性、满意度和游戏化的因素,构建了一个理论框架来探究用户的持续使用意愿的关键影响因素,并在MOOC的情境下进行了实证分析;基于信息系统持续使用理论提出了游戏化的影响方式,研究发现游戏化在MOOC用户的持续使用意愿影响中起着显著的作用。 展开更多
关键词 游戏化 网络学习 持续使用 MOOC
在线阅读 下载PDF
基于学术论文全文内容的算法使用行为及其影响力研究 被引量:22
11
作者 章成志 丁睿祎 王玉琢 《情报学报》 CSSCI CSCD 北大核心 2018年第12期1175-1187,共13页
数据挖掘算法已被广泛应用于科学研究与实践中。考察数据挖掘算法在学术论文中的使用情况、进而评估其影响力,能辅助研究者全面了解其所在领域的常用算法,并根据研究任务类型选择相应算法。本文利用学术论文全文内容,对算法的使用行为... 数据挖掘算法已被广泛应用于科学研究与实践中。考察数据挖掘算法在学术论文中的使用情况、进而评估其影响力,能辅助研究者全面了解其所在领域的常用算法,并根据研究任务类型选择相应算法。本文利用学术论文全文内容,对算法的使用行为进行分析,从而考察算法的影响力。具体来说,本文以自然语言处理领域为例,收集整理全国计算语言学会议(CCL)1993—2016年收录的学术论文全文数据,从使用频次、使用位置、使用年代以及使用动机等四个方面全面考察十大经典数据挖掘算法在该领域的使用情况,并在此基础上对算法的影响力进行评估。实验结果显示,十大算法的使用行为存在明显差异,且SVM算法影响力最高,CART与Apriori算法影响力较低。本文研究可为基于数据驱动的相关研究者,尤其是为初学者在算法选择时提供参考。 展开更多
关键词 算法影响力评估 使用行为 全文内容分析
在线阅读 下载PDF
学术博客用户的博文分类行为研究——以科学网博客为例 被引量:5
12
作者 张颖怡 章成志 陈果 《情报学报》 CSSCI 北大核心 2016年第11期1223-1232,共10页
学术博客的不断发展促使网络学术资源不断增长。为了有效地对网络学术资源进行分类,很多学术博客网站引入博文分类机制。对用户的博文分类行为进行研究,有助于理解学术博客中用户分类的规律,从而促进博文分类系统的优化。目前国内外学... 学术博客的不断发展促使网络学术资源不断增长。为了有效地对网络学术资源进行分类,很多学术博客网站引入博文分类机制。对用户的博文分类行为进行研究,有助于理解学术博客中用户分类的规律,从而促进博文分类系统的优化。目前国内外学者开始关注学术博客中的用户行为与分类机制,但缺乏对用户的博文分类行为的研究。为分析学术博客中的不同学科的用户分类行为,本文以科学网博客为例,分析不同学科用户的系统分类与个人分类使用结构,并分析系统分类以及个人分类与各学科的关联度。基于以上分析结果,本文最后为学术博客分类系统的优化提出相应的建议。 展开更多
关键词 系统分类 用户分类 学术博客 信息分类行为 用户行为研究
在线阅读 下载PDF
基于CRFs和领域本体的中文微博评价对象抽取研究 被引量:12
13
作者 丁晟春 吴婧婵媛 李霄 《中文信息学报》 CSCD 北大核心 2016年第4期159-166,共8页
微博情感分析是对微博内容进行细粒度的挖掘,有着重要的研究价值。微博评价对象的抽取是微博情感分析研究的关键问题之一。为了提高中文微博评价对象抽取的准确率,该文在中文微博特征分析和微博评论本体构建研究的基础上,尝试从词、词... 微博情感分析是对微博内容进行细粒度的挖掘,有着重要的研究价值。微博评价对象的抽取是微博情感分析研究的关键问题之一。为了提高中文微博评价对象抽取的准确率,该文在中文微博特征分析和微博评论本体构建研究的基础上,尝试从词、词性、情感词以及本体四个方面进行特征选择,采用CRFs模型对评价对象进行抽取。该文将提出的方法运用到COAE2014测评的Task5评价对象抽取任务中,宏平均准确率达到61.20%,在所有测评队伍中居第一。实验结果表明,将本体特征引入到CRFs模型中,能够有效地提高评价对象抽取的准确率。 展开更多
关键词 CRFs模型 本体 特征选择 评价对象抽取 信息抽取
在线阅读 下载PDF
基于知识进化视角的科学文献传播网络演变模型构建及仿真 被引量:8
14
作者 王曰芬 丁玉飞 《情报学报》 CSSCI CSCD 北大核心 2019年第9期966-973,共8页
为了揭示科学文献传播过程的内在实质、分析科学发展的动力机制,本文导入知识进化理论,并利用概率统计、复杂网络分析与仿真实验等方法,对科学文献传播网络开展研究。首先阐述知识进化理论主要内容,分析科学文献传播中知识进化现象的表... 为了揭示科学文献传播过程的内在实质、分析科学发展的动力机制,本文导入知识进化理论,并利用概率统计、复杂网络分析与仿真实验等方法,对科学文献传播网络开展研究。首先阐述知识进化理论主要内容,分析科学文献传播中知识进化现象的表征;其次,构建基于知识进化的科学文献传播网络演变模型,并从遗传机制与变异机制两个方面加以解析;最后,对科学文献传播网络演化进行仿真分析,并验证所建模型的有效性和可行性。通过研究发现,科学文献传播网络中隐含的知识进化现象、属性特征与演化行为等反映了科学文献传播的状态和规律。 展开更多
关键词 知识进化 科学文献 传播网络 演变模型
在线阅读 下载PDF
电镜能谱仪认定火灾起火点研究 被引量:3
15
作者 黄超 侍伟 李继红 《消防科学与技术》 CAS 北大核心 2016年第10期1490-1494,共5页
介绍烧毁严重程度认定法、烟熏痕迹认定法等起火点的认定方法。以烧毁严重程度判别起火部位或起火点受火灾荷载的干扰,其科学性与准确度受到质疑。电镜能谱认定起火点的方法基于起火点受热时间最长,在同类别灰烬中的碳含量最低的原理。... 介绍烧毁严重程度认定法、烟熏痕迹认定法等起火点的认定方法。以烧毁严重程度判别起火部位或起火点受火灾荷载的干扰,其科学性与准确度受到质疑。电镜能谱认定起火点的方法基于起火点受热时间最长,在同类别灰烬中的碳含量最低的原理。以粉碎的A4打印纸充当可燃物设计实验,利用电镜能谱仪辨识灰烬类别,测定碳含量,确定火灾蔓延方向及起火点,验证电镜能谱认定法的可行性。结果表明,灰烬样本在经实验室电炉600℃灼烧2h后仍能够检测出≥2%的碳元素;选择能谱面分析误差较小;检测点的灰烬必须是相同类别的灰烬。介绍电镜能谱仪认定起火点的步骤。 展开更多
关键词 起火点 火灾调查 电镜 能谱
在线阅读 下载PDF
基于双向长短期记忆模型的网民负面情感分类研究 被引量:38
16
作者 吴鹏 应杨 沈思 《情报学报》 CSSCI CSCD 北大核心 2018年第8期845-853,共9页
网民负面情感在网络舆情情感分析中具有重要意义,但已有研究缺乏自动化识别海量短文本中网民负面情感的多分类方法。本文利用词嵌入技术学习词语的特征表示,通过增加文本的情感特征生成具有情感意义的词向量,并训练双向长短期记忆模型... 网民负面情感在网络舆情情感分析中具有重要意义,但已有研究缺乏自动化识别海量短文本中网民负面情感的多分类方法。本文利用词嵌入技术学习词语的特征表示,通过增加文本的情感特征生成具有情感意义的词向量,并训练双向长短期记忆模型得到网民负面情感识别模型,在判断网民情感极性的基础上,识别网民的愤怒、悲伤和恐惧三种负面情感,并结合案例数据与SVM、LSTM和CNN等模型进行对比分析。实验表明,具有情感语义的词向量比词向量更适合情感分析任务;利用双向长短期记忆模型可以得到较好的情感识别效果;判断网民情感极性基础上识别网民负面情感的分类方式优于直接判断网民的负面情感的方式。 展开更多
关键词 网络舆情 负面情感分析 情感词向量 双向长短期记忆模型
在线阅读 下载PDF
基于深度学习和OCC情感规则的网络舆情情感识别研究 被引量:43
17
作者 吴鹏 刘恒旺 沈思 《情报学报》 CSSCI CSCD 北大核心 2017年第9期972-980,共9页
为解决网络舆情情感倾向性分析中语义理解不足和仅关注情感词典的现状,本文基于OCC模型认知情感角度建立情感规则,对网络舆情中突发事件的微博文本进行情感分类标注作为训练集,并对深度学习中卷积神经网络模型进行训练得到网络舆情情感... 为解决网络舆情情感倾向性分析中语义理解不足和仅关注情感词典的现状,本文基于OCC模型认知情感角度建立情感规则,对网络舆情中突发事件的微博文本进行情感分类标注作为训练集,并对深度学习中卷积神经网络模型进行训练得到网络舆情情感识别模型。通过对比实验证明OCC情感规则标注使数据集情感分类更加精确,卷积神经网络的识别效果显著优于传统的机器学习方式(SVM),情感识别模型情感最高可达到90.98%的准确率。 展开更多
关键词 网络舆情 OCC模型 深度学习 词向量 卷积神经网络
在线阅读 下载PDF
基于OCC模型和LSTM模型的财经微博文本情感分类研究 被引量:23
18
作者 吴鹏 李婷 +1 位作者 仝冲 沈思 《情报学报》 CSSCI CSCD 北大核心 2020年第1期81-89,共9页
为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore&Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从... 为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore&Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从网民认知角度建立情感规则,对财经微博文本进行情感标注,并作为LSTM模型进行深度学习的训练集;基于LSTM模型,使用深度学习中的TensorFlow框架和Keras模块建立相应的实验模型,进行海量微博数据情感分类,并结合13家上市公司3年的微博文本数据进行实证研究和模型验证对比。实证研究结果发现本文提出的模型取得了89.45%的准确率,高于采用传统的机器学习方式的支持向量机方法 (support vector machine,SVM)和基于深度学习的半监督RAE方法 (semi-supervised recursive auto encoder)。 展开更多
关键词 长短期记忆模型 OCC模型 财经微博 情感分类
在线阅读 下载PDF
基于调节定向理论的社交网络用户信息分享行为研究 被引量:30
19
作者 朱鹏 李璐 Gary Marchionini 《情报学报》 CSSCI CSCD 北大核心 2019年第3期257-265,共9页
本文基于隐私计算理论与调节定向理论对社交网络用户的信息分享行为进行研究,重在研究感知风险与感知收益对用户信息分享行为的影响,以及用户调节定向特质对感知风险和感知收益的影响及其对用户信息分享行为的调节作用。本文构建了基于... 本文基于隐私计算理论与调节定向理论对社交网络用户的信息分享行为进行研究,重在研究感知风险与感知收益对用户信息分享行为的影响,以及用户调节定向特质对感知风险和感知收益的影响及其对用户信息分享行为的调节作用。本文构建了基于调节定向理论的社交网络用户信息分享行为模型,通过调查问卷收集到了376份有效样本,并通过构建回归方程、t检验、方差分析的方法对提出的假设进行了验证。研究表明,感知风险负向影响用户信息分享行为,而感知收益正向影响信息分享行为,同时用户的调节定向特质对用户在感知收益上的影响显著。本文根据此结论为社交网络平台的发展提出了合理的建议。 展开更多
关键词 用户信息分享行为 调节定向 感知风险 感知收益
在线阅读 下载PDF
基于社区发现和关键节点识别的网络舆情主题发现与实证分析 被引量:21
20
作者 王曰芬 王一山 杨洁 《图书与情报》 CSSCI 北大核心 2020年第5期48-58,共11页
为了深入探究网络舆情演化的特点与规律,需要在内容层面上有效地从网络舆情的大量数据中发现高价值的舆情主题,并结合时间维度将各个时间点孤立的舆情内容整合起来。文章将情报学理论、生命周期理论、舆情传播理论、社会网络分析方法与... 为了深入探究网络舆情演化的特点与规律,需要在内容层面上有效地从网络舆情的大量数据中发现高价值的舆情主题,并结合时间维度将各个时间点孤立的舆情内容整合起来。文章将情报学理论、生命周期理论、舆情传播理论、社会网络分析方法与文本分析方法相结合,提出了基于社区发现与关键节点识别的包括网络舆情生命周期阶段划分、网络舆情社区发现与关键节点识别、舆情事件主题发现三个部分的网络舆情主题发现研究设计。最后,选取新浪微博“上海踩踏”事件作为研究对象进行实证分析。研究发现:在主题发现研究中加入用户属性和用户行为等非文本特征要素的设计,弥补了用户关系的缺失,提高主题发现的效率;提出的主题发现方法在一定程度上降低了微博文本稀疏性的影响;研究发现了舆情事件在整个生命周期中主题内容变化的状态,所提方案可为相关决策提供有效的方法支撑,研究结论具有情报参考价值。 展开更多
关键词 网络舆情 主题发现 社区发现 关键节点识别 非文本特征
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部