期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
面向多样化编译环境的恶意代码同源性分析
1
作者 刘昕仪 彭国军 +2 位作者 刘思德 杨秀璋 傅建明 《信息安全学报》 CSCD 2024年第6期28-42,共15页
随着恶意样本数量的急剧增加,为减少人工溯源的工作量,恶意代码同源性分析研究的重要性日益凸显。然而,攻击者在复用恶意代码时,需针对不同的攻击场景设置特定的编译环境,这会造成同源二进制在语法和结构层面存在很大差异,降低恶意代码... 随着恶意样本数量的急剧增加,为减少人工溯源的工作量,恶意代码同源性分析研究的重要性日益凸显。然而,攻击者在复用恶意代码时,需针对不同的攻击场景设置特定的编译环境,这会造成同源二进制在语法和结构层面存在很大差异,降低恶意代码同源性分析的准确率。为解决此问题,本文通过分析编译环境对二进制生成带来的影响,实现了一个准确、无监督、高效的恶意代码同源性分析方案。本文采用二进制提升与重优化技术将其统一到中间表示层,一定程度上消除语法、结构层面的改变。针对传统CBOW模型学习代码单词语义的不足,提出指令级的上下文语义学习方案,并考虑到出现上下文无关指令的小概率事件,结合SIF模型计算基本块特征向量。此外,针对恶意代码中库函数和字符串包含敏感信息更丰富的特点,本文提出基本块初始匹配集合的建立算法,在K-Hop贪心匹配算法和线性匹配算法的基础上,进一步提高了恶意代码同源性分析的准确率。实验表明,对于开源恶意代码Mirai,本方案相较于现有的无监督模型和预训练模型,在分析准确性和运行开销两个方面的综合表现更优。同时,对于其他类型的恶意代码,本方案输出的同源性指数均高于本文预先设立的同源性判定阈值,进一步证明其有效性。 展开更多
关键词 恶意代码同源性 编译环境 语义学习
在线阅读 下载PDF
基于Bert和BiLSTM-CRF的APT攻击实体识别及对齐研究 被引量:14
2
作者 杨秀璋 彭国军 +3 位作者 李子川 吕杨琦 刘思德 李晨光 《通信学报》 EI CSCD 北大核心 2022年第6期58-70,共13页
针对高级可持续威胁(APT)分析报告未被有效利用,缺乏自动化方法生成结构化知识并形成黑客组织特征画像问题,提出一种融合实体识别和实体对齐的APT攻击知识自动抽取方法。首先,结合APT攻击特点设计12种实体类别;其次,构建融合Bert、双向... 针对高级可持续威胁(APT)分析报告未被有效利用,缺乏自动化方法生成结构化知识并形成黑客组织特征画像问题,提出一种融合实体识别和实体对齐的APT攻击知识自动抽取方法。首先,结合APT攻击特点设计12种实体类别;其次,构建融合Bert、双向长短期记忆(BiLSTM)网络和条件随机场(CRF)的APT攻击实体识别模型,利用Bert预训练标注语料,BiLSTM学习上下文语义信息,注意力机制突出关键特征,再由CRF识别实体;最后,结合实体对齐方法来生成不同APT组织的结构化知识。实验结果表明,所提方法能有效识别APT攻击实体,其精确率、召回率和F1值分别为0.9296、0.8733和0.9006,均优于现有模型。此外,所提方法能在少量样本标注的情况下自动抽取高级可持续威胁知识,通过实体对齐能生成常见APT组织的结构化特征画像,从而为后续APT攻击知识图谱构建和攻击溯源提供支撑。 展开更多
关键词 高级可持续威胁 威胁情报抽取 实体识别 实体对齐 深度学习
在线阅读 下载PDF
基于社交网络和决策树的中国电影产业研究 被引量:6
3
作者 杨秀璋 夏换 +1 位作者 于小民 李娜 《电影文学》 北大核心 2019年第5期3-12,共10页
本文提出了一种基于社交网络和决策树的中国电影产业分析方法,结合可视化技术从多种角度分析影响电影票房和质量的因素。本文旨在从多个维度挖掘中国电影市场的特点,分析电影票房和电影质量、电影类型、演员阵容、上映时间的关系,利用... 本文提出了一种基于社交网络和决策树的中国电影产业分析方法,结合可视化技术从多种角度分析影响电影票房和质量的因素。本文旨在从多个维度挖掘中国电影市场的特点,分析电影票房和电影质量、电影类型、演员阵容、上映时间的关系,利用社交网络构建演员关系图谱,智能化推荐符合观众口味的电影。实验结果表明,本文的研究成果具有重要的理论研究意义和实际应用价值,该算法可以广泛应用于电影市场分析、文本挖掘、电影智能推荐等领域,同时可以优化中国电影市场,为观众提供更好的精神食粮。 展开更多
关键词 中国电影市场 电影分析 社交网络 决策树 可视化
在线阅读 下载PDF
基于多视图融合的论文自动分类方法研究 被引量:4
4
作者 杨秀璋 夏换 +2 位作者 于小民 杨琪 汪瑜斌 《现代电子技术》 北大核心 2020年第8期120-124,共5页
为科研工作者精准推荐所需的学术论文,从而节约检索时间和精力,提高科研效率,并进一步提升论文自动分类的准确度。该文在传统单视图论文分类基础上,提出了一种基于多视图融合的论文自动分类方法,考虑论文标题、关键词、摘要三个视图的... 为科研工作者精准推荐所需的学术论文,从而节约检索时间和精力,提高科研效率,并进一步提升论文自动分类的准确度。该文在传统单视图论文分类基础上,提出了一种基于多视图融合的论文自动分类方法,考虑论文标题、关键词、摘要三个视图的互补性和协调性,实现对海量论文的自动分类。文中抓取了中国知网9个主题的1 710篇论文作为实验语料,并构建决策树、K最近邻、随机森林、支持向量机、朴素贝叶斯分类器进行实验。结果表明,基于多视图融合的论文分类方法在准确率、召回率和F值上都有所提升,优于单视图的论文分类方法,且可以为论文自动分类、推荐系统、文本挖掘提供有效支撑,具有一定的应用前景和实用价值。 展开更多
关键词 论文自动分类 多视图融合 数据处理 语料获取 智能推荐 文本挖掘
在线阅读 下载PDF
大数据视域下2019年中国电影产业分析研究 被引量:4
5
作者 杨秀璋 武帅 +1 位作者 夏换 于小民 《电影文学》 北大核心 2020年第23期17-29,共13页
本文采用大数据及可视化技术分析2019年中国电影产业,挖掘潜在价值信息,通过计量分析和文本挖掘梳理了2019年度国内电影产业各类概况,利用知识图谱及K-Means聚类算法构建演员合作关系,智能发现演员、影片和黄金档期的影响力。研究结果表... 本文采用大数据及可视化技术分析2019年中国电影产业,挖掘潜在价值信息,通过计量分析和文本挖掘梳理了2019年度国内电影产业各类概况,利用知识图谱及K-Means聚类算法构建演员合作关系,智能发现演员、影片和黄金档期的影响力。研究结果表明,2019年中国电影市场在探索中前行,更加注重影片内容及回归原创,电影质量有较大提升,市场活力和观众口碑均在不断提高,多类型题材的电影让中国电影产业异彩纷呈,为观众提供了更好的精神文化需求,让中国电影进一步走向世界。 展开更多
关键词 中国电影 电影产业 2019年 电影市场分析 大数据
在线阅读 下载PDF
融合多头注意力机制和BiLSTM的电商评论情感分析研究 被引量:2
6
作者 杨秀璋 武帅 +3 位作者 任天舒 刘建义 宋籍文 廖文婧 《信息技术与信息化》 2022年第10期5-9,共5页
针对电商评论数据缺乏深层次的情感分析和语义知识关联,不利于系统挖掘潜在的消费情感和客户满意度信息问题,以京东电商评论数据为例,提出一种融合多头注意力机制和双向长短时记忆网络模型(bi-directional long short-term memory,BiLS... 针对电商评论数据缺乏深层次的情感分析和语义知识关联,不利于系统挖掘潜在的消费情感和客户满意度信息问题,以京东电商评论数据为例,提出一种融合多头注意力机制和双向长短时记忆网络模型(bi-directional long short-term memory,BiLSTM)的电商评论情感分析模型。首先,通过词嵌入将文本数据转化为句向量;其次,构建融合多头注意力机制的BiLSTM模型,利用BiLSTM捕获长距离依赖关系,利用Transformer突出全局关键特征;最后,构建分类器实现电商评论的情感分析。实验结果表明,文章提出方法优于现有的机器学习和深度学习方法,其F_(1)值为0.9276。同时,通过详细的对比实验证明了该方法能实现评论文本情感特征的细粒度提取,并能在少样本标注的情况下取得更好的准确率,具有良好的鲁棒性和准确性。 展开更多
关键词 多头注意力机制 BiLSTM 电商评论 情感分析 细粒度文本
在线阅读 下载PDF
基于LDA和关系图谱的数据治理文献主题演化研究 被引量:2
7
作者 杨秀璋 武帅 +3 位作者 宋籍文 廖文婧 任天舒 刘建义 《信息技术与信息化》 2022年第8期6-12,共7页
针对数据治理领域缺乏深层次的主题挖掘,未有效结合机器学习算法开展主题演化研究,无法精准感知数据治理的变化趋势及主题演化规律问题,提出了一种基于LDA模型和关系图谱的数据治理文献主题演化算法。首先,利用LDA模型和层次聚类算法梳... 针对数据治理领域缺乏深层次的主题挖掘,未有效结合机器学习算法开展主题演化研究,无法精准感知数据治理的变化趋势及主题演化规律问题,提出了一种基于LDA模型和关系图谱的数据治理文献主题演化算法。首先,利用LDA模型和层次聚类算法梳理数据治理的核心主题;其次,结合文本特征和群体特征开展主题关系图谱及科研群体发现研究;最后,通过计算主题消融权重实现数据治理主题演化感知分析。实验结果表明,文章提出的方法能有效挖掘数据治理文献的主题,梳理该领域知识的发展态势,确定未来的研究趋势和热点,为数据治理领域的发展提供了理论基础和研究思路。 展开更多
关键词 数据治理 文本挖掘 LDA模型 关系图谱 主题演化
在线阅读 下载PDF
一种自适应图像增强和AlexNet的水书古文字识别算法 被引量:2
8
作者 杨秀璋 武帅 +2 位作者 宋籍文 廖文婧 周既松 《信息技术与信息化》 2023年第1期212-216,共5页
针对水族古文字受字形变化、年代噪声影响,无法实现高质量数字化提取,且缺乏利用深度学习技术实现对水书古文字的自动化识别问题,提出了一种自适应图像增强和AlexNet的水书文字识别算法,通过优化模型识别复杂环境下文字的关键特征,实现... 针对水族古文字受字形变化、年代噪声影响,无法实现高质量数字化提取,且缺乏利用深度学习技术实现对水书古文字的自动化识别问题,提出了一种自适应图像增强和AlexNet的水书文字识别算法,通过优化模型识别复杂环境下文字的关键特征,实现水书古文字智能识别以及同汉字的自动翻译。首先,采集具有代表性的水书古文字并进行数据标注处理,通过图像变换算法扩充数据集;其次,计算各种场景的图像噪声阈值,构建自适应图像增强的去噪算法;最后,构建AlexNet神经网络模型实现水书古文字的自动识别。实验结果表明,提出的算法能有效识别复杂环境下的水族古文字,其精确率、召回率和F1值分别为0.9755、0.9743和0.9743,能为少数民族文字识别、古籍文字自动提取及少数民族古文字与汉字的自动翻译提供有效支撑,具有一定的学术价值和应用前景。 展开更多
关键词 水书古文字 自适应图像增强 AlexNet
在线阅读 下载PDF
基于TextCNN和Attention的微博舆情事件情感分析 被引量:15
9
作者 杨秀璋 武帅 +3 位作者 张苗 李娜 于小民 范郁锋 《信息技术与信息化》 2021年第7期41-46,共6页
传统方法对微博舆情事件情感分析缺乏深层次语义支持,且特征稀疏、上下文关系单薄,导致情感分类准确率较低,无法第一时间感知舆情突发事件。针对这些问题,提出一种基于TextCNN和注意力机制的舆情事件情感分析模型。首先采集微博舆情事... 传统方法对微博舆情事件情感分析缺乏深层次语义支持,且特征稀疏、上下文关系单薄,导致情感分类准确率较低,无法第一时间感知舆情突发事件。针对这些问题,提出一种基于TextCNN和注意力机制的舆情事件情感分析模型。首先采集微博舆情事件文本知识并进行数据预处理,接着利用TextCNN模型的卷积层和池化层从多个角度提取局部特征,再结合Attention机制组合句子向量完成情感分类任务。实验结果表明,文章提出的方法在准确率、精确率、召回率和F1值上均有所提升,其值分别是0.9813、0.9821、0.9804和0.9812,优于传统的随机森林、SVM、逻辑回归和朴素贝叶斯方法,能在微博舆情事件情感分析中较好地进行识别,为后续应用于公共突发事件预测及舆情分析提供帮助。 展开更多
关键词 微博舆情事件 情感分析 TextCNN 注意力机制 舆情分析
在线阅读 下载PDF
一种改进卷积神经网络的阿拉伯文字图像识别方法 被引量:4
10
作者 杨秀璋 施奕 +3 位作者 李娜 刘润森 杨琪 武帅 《信息技术与信息化》 2021年第9期6-11,共6页
传统阿拉伯文字研究主要集中于字形释义、文化传承和艺术探究领域,缺乏利用深度学习技术对文字的识别,并且由于古文字的字形变化、数字化读取困难,传统方法识别的准确率较低。针对上述问题,提出了一种改进卷积神经网络的阿拉伯文字图像... 传统阿拉伯文字研究主要集中于字形释义、文化传承和艺术探究领域,缺乏利用深度学习技术对文字的识别,并且由于古文字的字形变化、数字化读取困难,传统方法识别的准确率较低。针对上述问题,提出了一种改进卷积神经网络的阿拉伯文字图像识别方法。首先采集阿拉伯文字图像数据集,对其进行数值特征转换、图像标准化等预处理操作;接着构建融合注意力机制和四层卷积神经网络的模型,提取具有代表性的局部特征;最后通过全连接层并调用Softmax分类器实现阿拉伯文字图像分类,完成图像识别任务。实验结果表明,提出的方法在准确率、精确率、召回率和F1值上均有所提升,其值分别是0.9657、0.9662、0.9658和0.9660,该结果优于传统卷积神经网络和机器学习方法,并通过详细的图像分类实验有效识别出28种类别的阿拉伯文字,为少数民族文字自动化和智能化提取及识别研究提供有效支撑。 展开更多
关键词 深度学习 图像识别 阿拉伯文字 卷积神经网络 数字人文
在线阅读 下载PDF
基于LDA模型和社交网络的个人技术博客文本挖掘 被引量:1
11
作者 杨秀璋 武帅 +3 位作者 于小民 项美玉 周既松 赵小明 《信息技术与信息化》 2021年第6期7-12,共6页
针对个人技术博客缺乏深层次的主题挖掘,较少利用文本挖掘或机器学习算法研究其领域方向和演化态势的问题,提出了一种基于LDA模型和社交网络的个人技术博客文本挖掘算法。首先,通过Python抓取CSDN论坛的博客文本;其次,利用LDA模型和层... 针对个人技术博客缺乏深层次的主题挖掘,较少利用文本挖掘或机器学习算法研究其领域方向和演化态势的问题,提出了一种基于LDA模型和社交网络的个人技术博客文本挖掘算法。首先,通过Python抓取CSDN论坛的博客文本;其次,利用LDA模型和层次聚类算法挖掘技术博客的核心主题,揭示其博客创作的演化历程;最后,通过社交网络分析法构建技术博客的主题关系图谱,从而发现其核心主题社交群体。实验结果表明,提出的方法能有效识别出个人技术博客的热点主题,发现核心主题的关系图谱,挖掘主题演化脉络及构建博客画像,具有一定的学术价值。 展开更多
关键词 文本挖掘 LDA模型 社交网络 个人技术博客 层次聚类
在线阅读 下载PDF
ResNet网络下教室人物姿态分类 被引量:1
12
作者 倪照风 马原东 +3 位作者 崔潇 郦烜杰 杨秀璋 罗子江 《现代电子技术》 北大核心 2020年第12期42-46,共5页
该文首次将ResNet网络的思想对复杂教室环境下的人物进行多类别分类设计,改进了网络结构,有效解决了传统基于像素特征的方法分类效果不理想的问题。实验中通过卷积提取特征、不同感受野、保留像素间联系、多层卷积级联提取深层次特征等... 该文首次将ResNet网络的思想对复杂教室环境下的人物进行多类别分类设计,改进了网络结构,有效解决了传统基于像素特征的方法分类效果不理想的问题。实验中通过卷积提取特征、不同感受野、保留像素间联系、多层卷积级联提取深层次特征等方法,在网络训练过程中进行参数调整,优化算法和网络参数来解决困难样本的识别,将多类别的分类准确率从83.5%提升到99.2%,并实现了多目标检测的11类样本的判定。最终选取ResNet1816来进行高速有效的多类别识别。 展开更多
关键词 姿态分类 ResNet网络 卷积网络 分类训练 参数调整 多类别识别
在线阅读 下载PDF
基于情感分析巴黎圣母院火灾对古建筑保护探讨 被引量:6
13
作者 武帅 夏换 +3 位作者 杨秀璋 于小民 赵紫如 窦悦琪 《信息技术与信息化》 2019年第8期154-159,共6页
古建筑的毁坏对全人类来说都是心痛的,巴黎圣母院火灾事件牵动着每个人的心。随着互联网技术的快速发展,信息传播媒体已成多元化局势,以微信、微博、网页新闻为代表的新一代信息传播媒体逐渐代替报刊、论坛、客户端成为主流信息传播媒... 古建筑的毁坏对全人类来说都是心痛的,巴黎圣母院火灾事件牵动着每个人的心。随着互联网技术的快速发展,信息传播媒体已成多元化局势,以微信、微博、网页新闻为代表的新一代信息传播媒体逐渐代替报刊、论坛、客户端成为主流信息传播媒体。本文基于数据可视化和情感分析技术从多种角度分析巴黎圣母院火灾事件,提出了一种面向多源社交网络舆情并结合实体关系抽取的新情感分析算法,采用舆情走势、情感分布、热点主题词、媒体和热区分布,挖掘网民对巴黎圣母院失火的探讨,智能化地对网民舆情进行分析。本文的研究成果具有重要的理论研究意义和应用价值,情感分析算法能够应用于古建筑保护和宣传工作,并通过对古建筑毁坏的探讨可以得出对中国古建筑保护启示。 展开更多
关键词 巴黎圣母院 情感分析 数据可视化 古建筑保护 文化启示
在线阅读 下载PDF
基于社交网络分析和LDA主题挖掘的短文本挖掘研究 被引量:5
14
作者 武帅 施奕 +1 位作者 杨秀璋 项美玉 《现代电子技术》 2022年第20期124-128,共5页
随着自媒体技术的不断发展,如何高效挖掘短文本数据信息已成为现阶段的研究重点。传统主题挖掘方法进行短文本数据分析时,仅考虑单位词出现频率进行判断,未考虑语义关联结构信息,分析效果欠佳。针对短文本数据的稀缺性,文中提出一种基... 随着自媒体技术的不断发展,如何高效挖掘短文本数据信息已成为现阶段的研究重点。传统主题挖掘方法进行短文本数据分析时,仅考虑单位词出现频率进行判断,未考虑语义关联结构信息,分析效果欠佳。针对短文本数据的稀缺性,文中提出一种基于社交网络分析和LDA的主题挖掘分析模型。首先结合共词分析算法,分析不同文档间主题词的关系;然后结合社交网络分析算法,提高共词网络主题词耦合度;再借助隐含空间模型对共词网络进行降维,提高社交网络耦合性;最后结合隐含位置聚类算法发掘潜在社区,提高主题识别效果。实验结果表明,所提方法能够在一定程度上优化主题挖掘算法在识别短文本主题的效果,便于进行短文本研究,具有实用价值,也可为后续应用于前沿主题识别提供参考。 展开更多
关键词 LDA主题挖掘 共词分析 社交网络分析 短文本挖掘 隐含空间模型 隐含位置聚类 主题识别 吉布斯抽样
在线阅读 下载PDF
基于时间序列及K-Means聚类的学生就业形式分析 被引量:2
15
作者 武帅 刘锡峰 +3 位作者 张苗 陈静桥 夏换 杨秀璋 《信息技术与信息化》 2021年第1期5-10,共6页
随着网络的飞速发展,全球数据呈爆发增长,大数据正在慢慢改变着我们的生活方式,对经济发展、社会秩序等都产生着重大影响。如何对海量数据进行分析并得出有效结论,使数据产生价值,已经成为目前信息技术的重点问题。本文就校园招聘信息... 随着网络的飞速发展,全球数据呈爆发增长,大数据正在慢慢改变着我们的生活方式,对经济发展、社会秩序等都产生着重大影响。如何对海量数据进行分析并得出有效结论,使数据产生价值,已经成为目前信息技术的重点问题。本文就校园招聘信息对大学生就业形势进行数据挖掘,通过WordCloud词云技术、K-Means聚类算法、时间序列和回归算法对相关信息进行分析,预测目前的就业形势,并通过可视化技术展现。本文所研究的内容具有重要的实践价值,可广泛应用于预测大学生就业领域。 展开更多
关键词 就业形式 数据挖掘 Kmeans聚类 时间序列 逻辑回归
在线阅读 下载PDF
K-Means聚类和时间序列的在线短租共享经济分析 被引量:2
16
作者 武帅 张苗 +1 位作者 夏换 杨秀璋 《信息技术与信息化》 2021年第8期41-46,共6页
互联网创新浪潮下,共享经济作为一种新型商业模式,改变了人们参与经济及消费方式。传统的酒店住宿不再是人们唯一的选择,随着消费者对住宿的需求多样化,传统酒店行业已无法满足用户个性化需求。在与互联网的共同推动下,在线短租应运而... 互联网创新浪潮下,共享经济作为一种新型商业模式,改变了人们参与经济及消费方式。传统的酒店住宿不再是人们唯一的选择,随着消费者对住宿的需求多样化,传统酒店行业已无法满足用户个性化需求。在与互联网的共同推动下,在线短租应运而生。然而,在线短租作为新兴住宿,业态的相关研究甚少。针对以上不足,提出一种基于K-Means聚类和时间序列ARIMA模型的预测分析算法,依托数据可视化从多维度挖掘蚂蚁短租网有关贵州短租房相关数据,并预测地区短租房房价波动情况。提出的算法可广泛运用于全国在线短租房价预测分析,对商家如何占据共享经济市场份额有积极指导作用,具有重要的理论依据和使用价值。 展开更多
关键词 时间序列 K-MEANS聚类 线性回归 在线短租 共享经济
在线阅读 下载PDF
基于在线评论情感分析的企业市场竞争情报挖掘 被引量:1
17
作者 陈登建 杜飞霞 +1 位作者 夏换 杨秀璋 《信息技术与信息化》 2022年第7期152-157,共6页
为解决大数据环境下企业面临的市场竞争情报挖掘难题,提出了一种基于细粒度情感分析的企业间竞争优势与劣势的挖掘模型。以两家外卖企业A、B的在线评论作为实验数据,借助大连理工大学中文情感词汇本体库作为情感词典,实现对在线评论文... 为解决大数据环境下企业面临的市场竞争情报挖掘难题,提出了一种基于细粒度情感分析的企业间竞争优势与劣势的挖掘模型。以两家外卖企业A、B的在线评论作为实验数据,借助大连理工大学中文情感词汇本体库作为情感词典,实现对在线评论文本的多维度情感分析,基于时间序列维度下分析用户的情感走势;借助TF-IDF筛选文本关键特征词,利用LDA主题模型识别不同情感倾向的文本主题,并且运用可视化技术对其进行解释分析。实验结果表明:相较于传统的分类模型,本模型可以实现细粒度下更精确的文本情感多分类问题,更加精确的挖掘企业自身品牌以及竞争对手之间的优势与劣势。 展开更多
关键词 在线评论 企业竞争情报 情感分析 主题挖掘
在线阅读 下载PDF
基于共词分析和主题挖掘的档案服务创新研究 被引量:1
18
作者 李晓峰 李坤琪 +3 位作者 袁杰 杨鑫 杨秀璋 罗子江 《信息技术与信息化》 2021年第7期58-60,64,共4页
旨在对中国知网中关于档案服务创新的文献数据进行梳理和分析,探讨当前档案服务创新领域中的主题情况和研究热点。基于共词分析法,借助Gephi工具绘制国内档案服务创新的知识图谱,从关键词词频、词间联系等角度实现该领域现状研究,通过LD... 旨在对中国知网中关于档案服务创新的文献数据进行梳理和分析,探讨当前档案服务创新领域中的主题情况和研究热点。基于共词分析法,借助Gephi工具绘制国内档案服务创新的知识图谱,从关键词词频、词间联系等角度实现该领域现状研究,通过LDA模型,详尽分析文献摘要中的主题信息,并使用可视化技术将结果呈现。研究表明,方法能够有效梳理文献信息、挖掘主题关键词及热门研究领域,使得主题脉络更加清晰,为下一步档案服务创新的研究提供帮助,具备一定的理论意义和应用前景。 展开更多
关键词 档案创新服务 共词分析 主题挖掘 知识图谱
在线阅读 下载PDF
基于数据挖掘的中国民谣歌曲行业研究分析
19
作者 赵紫如 莫慕璇 +2 位作者 夏换 杨秀璋 武帅 《信息技术与信息化》 2019年第10期198-201,共4页
随着新媒体的不断涌现,以及媒体强有力的传播,民谣作为小众品味的代表,却能在众多主流音乐类型中独出于众,在当下媒介泛化的社会中受到越来越多的关注,不断地引发人们的热议,民谣歌手也受到了大批粉丝听众的追捧和用户。本文以网易云音... 随着新媒体的不断涌现,以及媒体强有力的传播,民谣作为小众品味的代表,却能在众多主流音乐类型中独出于众,在当下媒介泛化的社会中受到越来越多的关注,不断地引发人们的热议,民谣歌手也受到了大批粉丝听众的追捧和用户。本文以网易云音乐的民谣歌曲为研究对象,对其歌手、歌曲、歌词进行数据挖掘,分析歌词中的情感,并对其结果进行可视化分析,使更多人了解民谣歌曲的内容,同时可以优化中国民谣歌曲行业,为听众提供更多的优质民谣歌曲。 展开更多
关键词 中国民谣 数据挖掘 主题演化 网易云音乐 LDA主题模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部