期刊文献+
共找到60篇文章
< 1 2 3 >
每页显示 20 50 100
Unsupervised Feature Selection for Latent Dirichlet Allocation 被引量:1
1
作者 徐蔚然 杜刚 +2 位作者 陈光 郭军 杨洁 《China Communications》 SCIE CSCD 2011年第5期54-62,共9页
As a generative model,Latent Dirichlet Allocation Model,which lacks optimization of topics' discrimination capability focuses on how to generate data,This paper aims to improve the discrimination capability throug... As a generative model,Latent Dirichlet Allocation Model,which lacks optimization of topics' discrimination capability focuses on how to generate data,This paper aims to improve the discrimination capability through unsupervised feature selection.Theoretical analysis shows that the discrimination capability of a topic is limited by the discrimination capability of its representative words.The discrimination capability of a word is approximated by the Information Gain of the word for topics,which is used to distinguish between "general word" and "special word" in LDA topics.Therefore,we add a constraint to the LDA objective function to let the "general words" only happen in "general topics" other than "special topics".Then a heuristic algorithm is presented to get the solution.Experiments show that this method can not only improve the information gain of topics,but also make the topics easier to understand by human. 展开更多
关键词 pattern recognition unsupervised feature selection latent dirichlet allocation general topic special topic
在线阅读 下载PDF
基于LDA主题模型的智慧健康养老服务与管理人才岗位需求分析 被引量:1
2
作者 达朝锦 吴臣 +4 位作者 蔡婷婷 吉珍颖 陈佳琳 苗晓琦 袁长蓉 《护士进修杂志》 2024年第6期664-669,共6页
目的应用潜在狄利克雷分配(LDA)主题模型挖掘养老服务与管理人才的岗位需求,为相关人才培养提供依据。方法采用Python程序软件抓取前程无忧、智联招聘、猎聘网、养老网、丁香人才网等网站上与养老服务与管理人才相关的招聘信息,并进行... 目的应用潜在狄利克雷分配(LDA)主题模型挖掘养老服务与管理人才的岗位需求,为相关人才培养提供依据。方法采用Python程序软件抓取前程无忧、智联招聘、猎聘网、养老网、丁香人才网等网站上与养老服务与管理人才相关的招聘信息,并进行数据清洗,借助LDA主题模型对数据进行主题识别,分析岗位需求。结果共采集招聘信息3684条。数据清洗后获得2120条有效数据,包含健康照护类1161条,经营与管理类959条。招聘信息主要分布在华东、华北和华南地区。2类岗位各自析出8个岗位需求主题,按照主题强度,健康照护岗位析出的需求主题依次为:性格品质、生活及心理照料能力、疾病照料能力、职业礼仪和态度、急救与安全照料能力、职业通用能力、活动组织及服务管理能力、信息技术和老年政策法规知识;经营与管理岗位析出的需求主题依次为:机构运营管理能力、性格品质、市场开发与定位能力、客户维护与产品销售能力、职业礼仪和态度、职业通用能力、活动组织和策划能力、信息技术和老年政策法规知识。结论健康照护和经营与管理岗位知识和技能需求存在差异,但两者均重视养老服务与管理人才的人文素养和信息化应用能力,上述需求特征可为相关人才培养提供一定参考。 展开更多
关键词 lda主题模型 养老服务与管理 网络招聘 岗位需求
在线阅读 下载PDF
基于改进LDA算法的电力用户咨询文本分类算法
3
作者 李竹青 侯本忠 +2 位作者 曹培祥 王一蓉 李向阳 《太赫兹科学与电子信息学报》 2024年第12期1400-1406,共7页
针对目前情感极性分析中电力咨询短文本的准确性较低的问题,提出一种基于改进潜在狄利克雷分配(LDA)算法的电力用户咨询文本分类算法。在分析电力咨询短文本与情感的关联关系基础上,定义了基于情感词共现袋、主题特殊词以及主题关系词... 针对目前情感极性分析中电力咨询短文本的准确性较低的问题,提出一种基于改进潜在狄利克雷分配(LDA)算法的电力用户咨询文本分类算法。在分析电力咨询短文本与情感的关联关系基础上,定义了基于情感词共现袋、主题特殊词以及主题关系词的概念;为提高语义分析的质量,设计了改进LDA算法的电力用户咨询文本分类算法执行流程。实验表明,所提模型表现出优异性能,平均精确度和平均召回率为90.91%和85.03%。所提模型可充分发挥多模型集成优势,有效提升模型性能。 展开更多
关键词 电力咨询 文本分类 主题分析 卷积神经网络 潜在狄利克雷分配
在线阅读 下载PDF
一种改进的LDA主题模型 被引量:47
4
作者 张小平 周雪忠 +3 位作者 黄厚宽 冯奇 陈世波 焦宏官 《北京交通大学学报》 CAS CSCD 北大核心 2010年第2期111-114,共4页
由于文档中的词符合幂律分布,使得LDA模型的主题分布向高频词倾斜,导致能够代表主题的多数词被少量的高频词淹没使得主题表达能力降低.通过一种高斯函数对特征词加权,改进LDA主题模型的主题分布.实验显示加权LDA模型获得的主题间的相关... 由于文档中的词符合幂律分布,使得LDA模型的主题分布向高频词倾斜,导致能够代表主题的多数词被少量的高频词淹没使得主题表达能力降低.通过一种高斯函数对特征词加权,改进LDA主题模型的主题分布.实验显示加权LDA模型获得的主题间的相关性以及复杂度(Perplexity)值都降低,说明改进模型在主题表达和预测性能方面都有所提高. 展开更多
关键词 lda dirichlet分布 加权主题模型
在线阅读 下载PDF
融合TF-IDF和LDA的中文FastText短文本分类方法 被引量:32
5
作者 冯勇 屈渤浩 +2 位作者 徐红艳 王嵘冰 张永刚 《应用科学学报》 CAS CSCD 北大核心 2019年第3期378-388,共11页
FastText文本分类模型具有快速高效的优势,但直接将其用于中文短文本分类则存在精确率不高的问题.为此提出一种融合词频-逆文本频率(term frequency-inverse document frequency, TF-IDF)和隐含狄利克雷分布(latent Dirichlet allocatio... FastText文本分类模型具有快速高效的优势,但直接将其用于中文短文本分类则存在精确率不高的问题.为此提出一种融合词频-逆文本频率(term frequency-inverse document frequency, TF-IDF)和隐含狄利克雷分布(latent Dirichlet allocation, LDA)的中文FastText短文本分类方法.该方法在FastText文本分类模型的输入阶段对n元语法模型处理后的词典进行TF-IDF筛选,使用LDA模型进行语料库主题分析,依据所得结果对特征词典进行补充,从而在计算输入词序列向量均值时偏向高区分度的词条,使其更适用于中文短文本分类环境.对比实验结果可知,所提方法在中文短文本分类方面具有更高的精确率. 展开更多
关键词 中文短文本分类 FastText 词频-逆文本频率 词向量 隐含狄利克雷分布
在线阅读 下载PDF
有监督主题模型的SLDA-TC文本分类新方法 被引量:11
6
作者 唐焕玲 窦全胜 +2 位作者 于立萍 宋英杰 鲁明羽 《电子学报》 EI CAS CSCD 北大核心 2019年第6期1300-1308,共9页
本文提出了一种有监督主题模型的SLDA-TC(Super vised LDA-Text Categorization)文本分类方法,引入主题-类别概率分布参数,识别主题-类别的语义信息;提出SLDA-TC-Gibbs主题采样新方法,对每个词的隐含主题采样,只从该词所在文档的同类其... 本文提出了一种有监督主题模型的SLDA-TC(Super vised LDA-Text Categorization)文本分类方法,引入主题-类别概率分布参数,识别主题-类别的语义信息;提出SLDA-TC-Gibbs主题采样新方法,对每个词的隐含主题采样,只从该词所在文档的同类其它文档中采样,并给出了理论推导;另外,其主题数只需略大于类别数.实验表明,对比LDA-TC(LDA-Text Categorization)和SVM算法,本方法能提高分类精度和时间性能. 展开更多
关键词 文本分类 主题模型 隐含dirichlet分布 吉布斯采样
在线阅读 下载PDF
基于SIFT,K-Means和LDA的图像检索算法 被引量:12
7
作者 汪宇雷 毕树生 +1 位作者 孙明磊 蔡月日 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2014年第9期1317-1322,共6页
图像检索一直是信息检索领域的难题.提出了一种基于尺度不变特征变换(SIFT,Scale Invariant Feature Transform),K-Means和潜在狄利克雷分布(LDA,Latent Dirichlet Allocation)的图像检索算法.算法主要分为两个阶段.预备工作得到分类完... 图像检索一直是信息检索领域的难题.提出了一种基于尺度不变特征变换(SIFT,Scale Invariant Feature Transform),K-Means和潜在狄利克雷分布(LDA,Latent Dirichlet Allocation)的图像检索算法.算法主要分为两个阶段.预备工作得到分类完成的图库、概率分配参数表和基本词库;实现检索是在预备工作的基础上归类测试图片,然后在该类下搜索最相似图片.对比传统的基于文本或内容的检索方法,该算法在检索之前将图片库中所有图片按其本身特征进行自动分类,取代人工标注图像信息的过程,同时由于整个算法完全基于图像特征,故此方法不会引入人工因素的干扰.实验结果表明,该算法能够较为准确地将要检索的图片归为图片库对应的类别中,有效地提高图像检索效率. 展开更多
关键词 尺度不变特征变换(SIFT) K-MEANS 潜在狄利克雷分布(lda) 基于内容的图像检索 图像匹配
在线阅读 下载PDF
基于LDA话题关联的话题演化 被引量:20
8
作者 楚克明 李芳 《上海交通大学学报》 EI CAS CSCD 北大核心 2010年第11期1496-1500,共5页
话题演化可以帮助人们快速获取信息和了解趋势.提出了一种挖掘话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化.对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意2个话题的分布距... 话题演化可以帮助人们快速获取信息和了解趋势.提出了一种挖掘话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化.对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意2个话题的分布距离和话题的特征向量相似度实现话题的关联.实验结果证明,该方法不但可以描述同一个话题随时间的强度变化,还可以描述新话题的产生,旧话题的消失以及话题内容随时间的演化. 展开更多
关键词 话题探测 话题关联 话题演化 潜在狄里特里分配
在线阅读 下载PDF
基于共享背景主题的Labeled LDA模型 被引量:17
9
作者 江雨燕 李平 王清 《电子学报》 EI CAS CSCD 北大核心 2013年第9期1794-1799,共6页
隐藏狄利克雷分配(Latent Dirichlet Allocation,LDA)模型被广泛应用于文本分析、图像识别等领域.但由于LDA及其扩展模型多为无监督学习模型,无法将其应用于分类任务中.本文通过研究文档标记与LDA模型中主题的映射关系,提出一种新的Labe... 隐藏狄利克雷分配(Latent Dirichlet Allocation,LDA)模型被广泛应用于文本分析、图像识别等领域.但由于LDA及其扩展模型多为无监督学习模型,无法将其应用于分类任务中.本文通过研究文档标记与LDA模型中主题的映射关系,提出一种新的Labeled LDA模型(Shared Background Topics Labeled LDA,SBTL-LDA).在SBTL-LDA模型中每个标记除了存在若干个独享的局部主题外,还存在若干个共享的背景(Background)主题,这样可以有效分析不同标记所含主题之间的依赖关系,而文档标记被映射为局部主题和共享主题的组合,因此SBTL-LDA模型可以有效提升文档标记判别的准确性.同时SBTL-LDA模型还可以看成是一种半监督聚类模型,在对文档进行聚类分析的过程中模型可以有效的利用文档的标记信息提升文档聚类效果.实验证明SBTL-LDA模型能够有效解决PLDA模型中主题之间的相似性和依赖关系,具有良好的多标记判别能力,并且具有优于LDA、PLDA模型的文档聚类效果. 展开更多
关键词 隐藏狄利克雷分配 文本分析 多标记学习 半监督聚类
在线阅读 下载PDF
基于LDA模型的在线网络信息内容安全事件分类 被引量:4
10
作者 葛琳 季新生 +1 位作者 卫红权 江涛 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2014年第3期70-79,共10页
针对在线网络信息内容安全事件的分类问题,利用网络用户通信信息中含有的时间、关系和内容特征均可基于文本描述的特点,引入LDA模型,提出了一种实时多维信息联合(RMIA-LDA)的在线信息内容安全事件分类模型及算法。以网络通信中的时间特... 针对在线网络信息内容安全事件的分类问题,利用网络用户通信信息中含有的时间、关系和内容特征均可基于文本描述的特点,引入LDA模型,提出了一种实时多维信息联合(RMIA-LDA)的在线信息内容安全事件分类模型及算法。以网络通信中的时间特征为轴,对由此划分出的各个时间片段中的通信关系、通信内容特征采用LDA模型进行建模分类,对分类结果的相似性进行度量后,再与增量更新数据部分的分类结果归纳合并,从而得到当前实时在线数据中的事件分类。仿真实验结果表明,该模型和算法可以有效实现网络中信息内容安全事件的在线分类,较现有算法具有优越的性能。 展开更多
关键词 事件分类 信息内容安全事件 隐含狄利克雷分布 相似性度量 GIBBS抽样
在线阅读 下载PDF
LDA单词图像表示的蒙古文古籍图像关键词检索方法 被引量:7
11
作者 白淑霞 鲍玉来 《现代情报》 CSSCI 北大核心 2017年第7期51-54,88,共5页
[目的 ]为了克服传统视觉词袋方法(Bag-of-Visual-Words)中忽略视觉单词间的空间关系和语义信息等问题。[方法 ]本文提出一种与视觉语言模型相结合的基于LDA主题模型,并采用查询似然模型实现检索。[结果 ]实验数据表明,本文所提出的基于... [目的 ]为了克服传统视觉词袋方法(Bag-of-Visual-Words)中忽略视觉单词间的空间关系和语义信息等问题。[方法 ]本文提出一种与视觉语言模型相结合的基于LDA主题模型,并采用查询似然模型实现检索。[结果 ]实验数据表明,本文所提出的基于LDA的表示方法可以高效、准确地解决蒙古文古籍的关键词检索问题。[结论 ]同时,该方法的性能比Bo VW方法有显著提高。 展开更多
关键词 隐含狄利克雷分配(lda) 主题模型 视觉语言模型 蒙古文古籍 关键词检索 查询似然模型
在线阅读 下载PDF
基于主题模型(LDA)的查新辅助分析系统设计研究 被引量:8
12
作者 马林山 郭磊 《现代情报》 CSSCI 2018年第2期111-115,共5页
文章概述了主题概率模型(LDA)的计算原理和方法,以及开源R语言中lda程序包采用快速压缩吉普抽样算法分析语料库的处理流程。设计了基于LDA模型的查新辅助分析系统设计功能框架,对其功能、编程实现思路和工作流程做了描述。最后结合课题... 文章概述了主题概率模型(LDA)的计算原理和方法,以及开源R语言中lda程序包采用快速压缩吉普抽样算法分析语料库的处理流程。设计了基于LDA模型的查新辅助分析系统设计功能框架,对其功能、编程实现思路和工作流程做了描述。最后结合课题查新实例,详述了采用LDA模型通过相关文献关键词进行潜在主题挖掘,对比分析课题研究内容,对课题给出客观评价的过程。结果表明,基于主题模型的查新辅助分析系统可以快速有效挖掘相关文献主题,降低查新员对相关文献的分析难度,提高课题评价的客观性,整体辅助分析效果良好。 展开更多
关键词 主题模型 R语言 查新 课题评价
在线阅读 下载PDF
结合非负张量表示与扩展隐Dirichlet分配模型的图像标注
13
作者 钱智明 钟平 王润生 《国防科技大学学报》 EI CAS CSCD 北大核心 2014年第6期152-157,共6页
由于"语义鸿沟"的存在,自动图像标注是一项极具挑战性的工作。考虑到图像低层视觉特征与高层语义概念的差异,分别从图像表示与语义建模两个方面来实现自动图像标注。在图像表示方面,提出了一种正则化约束下的非负张量表示方法... 由于"语义鸿沟"的存在,自动图像标注是一项极具挑战性的工作。考虑到图像低层视觉特征与高层语义概念的差异,分别从图像表示与语义建模两个方面来实现自动图像标注。在图像表示方面,提出了一种正则化约束下的非负张量表示方法,用以提取符合人眼视觉直观理解的图像高阶结构特征。在语义建模方面,提出了一种三层贝叶斯模型——扩展隐Dirichlet分配。该模型利用隐变量来实现图像与标注词的关联,并通过一种基于变分推理的期望最大值方法来估计参数。实验结果表明,ELDA模型在大规模数据库NUS-WIDE上的标注结果相较于现有方法有了显著的提高。 展开更多
关键词 图像标注 非负张量表示 扩展隐dirichlet分配 变分推理
在线阅读 下载PDF
基于LDA主题模型的网络问答社区妊娠合并糖尿病孕产妇健康信息需求分析 被引量:12
14
作者 马誉萁 侯小妮 +4 位作者 段红梅 徐杨 陈延亭 李博文 金宁宁 《护理学杂志》 CSCD 北大核心 2023年第7期86-89,124,共5页
目的 应用LDA主题模型挖掘妊娠合并糖尿病孕产妇信息需求,为医护人员开展有效信息服务提供参考。方法 采用网络爬虫程序获取网络问答社区妊娠合并糖尿病板块的用户问答数据,采用LDA主题模型对数据进行主题识别,分析信息需求。结果 通过... 目的 应用LDA主题模型挖掘妊娠合并糖尿病孕产妇信息需求,为医护人员开展有效信息服务提供参考。方法 采用网络爬虫程序获取网络问答社区妊娠合并糖尿病板块的用户问答数据,采用LDA主题模型对数据进行主题识别,分析信息需求。结果 通过对126 616条数据的LDA主题分析,妊娠合并糖尿病孕产妇的信息需求包括8类:母儿危害与检查,母儿自我监护,营养体质量控制与胎儿生长发育,筛查与产检,病友经验分享与情感支持,细分食物类别的选择与升糖效应,分娩及产后母婴健康管理,血糖调控与餐食、胰岛素用药。结论 妊娠合并糖尿病孕产妇的信息需求多元、专业、精细化,包括认知、生理、情感等多个维度,医护人员应发挥医患共同信息服务主体作用,针对妊娠合并糖尿病孕产妇提供专业、精细、全面的信息服务。 展开更多
关键词 妊娠合并糖尿病 健康信息需求 网络问答社区 lda主题模型 孕期保健 围生期护理
在线阅读 下载PDF
基于LDA的地铁施工安全隐患排查要点挖掘与可视化研究 被引量:4
15
作者 潘杏 钟波涛 +1 位作者 黑永健 骆汉宾 《土木建筑工程信息技术》 2021年第2期7-14,共8页
随着地铁的快速建设和隐患排查系统的建立,系统中积累了大量隐患排查记录,但是隐患排查记录信息冗杂,相关工作严重依赖导则与专家经验,需要投入大量人力成本。为提高隐患排查工作效率和安全管理决策,同时促进排查工作实现全程自动化,本... 随着地铁的快速建设和隐患排查系统的建立,系统中积累了大量隐患排查记录,但是隐患排查记录信息冗杂,相关工作严重依赖导则与专家经验,需要投入大量人力成本。为提高隐患排查工作效率和安全管理决策,同时促进排查工作实现全程自动化,本文提出了一种基于文本挖掘与可视化技术的自动化分析隐患排查文本框架,该框架主要包括以下四个步骤:第一,基于Term Frequency-Inverse Document Frequency(TF-IDF)算法,对隐患描述下的关键词有一个整体的概括;第二,基于TF-IDF筛出特征值较高的关键词,借助吉布斯抽样的Latent Dirichlet Allocation(LDA)模型识别出大规模隐患描述语料库中潜藏的主题信息和隐患排查要点;第三,结合时间维度,通过Word Cloud(WC)技术对隐患描述进行可视化分析,绘制隐患词云演化图;第四,借助Word Co-occurrence Network(WCN)模型,挖掘隐患共现关系。该框架在分析武汉地铁2016-2018年施工安全隐患排查记录中得到了应用和验证。实验结果表明,该框架有效挖掘出34类隐患所对应的隐患排查要点和可视化信息。 展开更多
关键词 安全管理 地铁施工安全 隐患排查要点 文本挖掘 latent dirichlet allocation模型 数据可视化
在线阅读 下载PDF
基于局部和全局的LDA话题演化分析 被引量:3
16
作者 章建 李芳 《上海交通大学学报》 EI CAS CSCD 北大核心 2012年第11期1753-1758,共6页
对话题演化进行形式化描述,探讨了基于全局和局部话题演化的2种建模方式,并应用话题相似度和困惑度进行评测.对房地产话题和奥运会话题进行实例分析,给出了2种不同建模方法在话题演化方面的优缺点.两会报告实验结果表明,全局话题演化能... 对话题演化进行形式化描述,探讨了基于全局和局部话题演化的2种建模方式,并应用话题相似度和困惑度进行评测.对房地产话题和奥运会话题进行实例分析,给出了2种不同建模方法在话题演化方面的优缺点.两会报告实验结果表明,全局话题演化能够获得较好的模型参数,方法简单可靠;而局部话题演化则能产生细粒度话题,反映新话题的产生和旧话题的消亡. 展开更多
关键词 文字信息处理 狄利特利分布 话题关联和演化
在线阅读 下载PDF
基于LDA-GA算法的移动目录优化研究
17
作者 梁潘 《西安航空学院学报》 2017年第1期77-82,共6页
针对移动设备向用户推荐产品时受限于尺寸的问题,目前普遍采用个性化协作推荐算法来实现开发面向移动目录(MOC),但是传统的方法存在大数据环境下适应度不高、协作能力差等不足。为解决此问题,首先将主题建模算法与遗传算法相结合开发出L... 针对移动设备向用户推荐产品时受限于尺寸的问题,目前普遍采用个性化协作推荐算法来实现开发面向移动目录(MOC),但是传统的方法存在大数据环境下适应度不高、协作能力差等不足。为解决此问题,首先将主题建模算法与遗传算法相结合开发出LDA-GA算法,然后设计富有吸引力和协作性的产品推荐目录,最后将MOC应用在亚马逊APP和淘宝网APP进行实验比对分析并进行优化。实验结果表明:LDA-GA算法面对大量用户和产品数据时移动目录适应度更高、协作性更强,客户受众面大,推介效果更好。 展开更多
关键词 移动目录 潜在狄利克雷分配 主题建模 遗传算法
在线阅读 下载PDF
基于LDA主题分析模型的突发重大传染病事件医院抗逆力建设分析——以上海市为例 被引量:3
18
作者 陈汝婕 王毅欣 +1 位作者 刘晶晶 桂莉 《军事护理》 CSCD 北大核心 2023年第4期60-62,74,共4页
目的了解医院应对突发重大传染病事件的抗逆力建设,为今后提高其应对能力提供指导。方法设计聚焦网络爬虫获取国家卫健委、中国新闻网、今日头条和搜狗微信网站内有关上海市医院在2020年1月1日至2022年3月1日间的文本数据,编写python程... 目的了解医院应对突发重大传染病事件的抗逆力建设,为今后提高其应对能力提供指导。方法设计聚焦网络爬虫获取国家卫健委、中国新闻网、今日头条和搜狗微信网站内有关上海市医院在2020年1月1日至2022年3月1日间的文本数据,编写python程序对纳排后的179条数据进行隐含狄利克雷分布(latent Dirichlet allocation,LDA)主题分析。结果确定LDA主题分析的最佳主题个数为12个,并根据各主题的前10位主题词为主题命名。结论医院需加强科技、科研以及管理等方面的建设,来提升自身对疫情防控能力,对各类资源的应急准备能力,从而确保医疗服务的稳定提供。 展开更多
关键词 突发重大传染病事件 医院 抗逆力 网络数据 lda主题分析
在线阅读 下载PDF
LDA特征扩展的多类SVM短文本分类方法研究 被引量:5
19
作者 郑腾 吴雨川 《武汉纺织大学学报》 2019年第2期72-76,共5页
针对短文本信息量少、特征稀疏的特点,提出一种基于LDA主题扩展的多类SVM短文本分类方法。在短文本基础上,利用LDA主题模得到文档的主题分布,将主题中的词扩充到原短文本的特征中,在特征空间上使用基于经典权重计算方法的多类SVM分类器... 针对短文本信息量少、特征稀疏的特点,提出一种基于LDA主题扩展的多类SVM短文本分类方法。在短文本基础上,利用LDA主题模得到文档的主题分布,将主题中的词扩充到原短文本的特征中,在特征空间上使用基于经典权重计算方法的多类SVM分类器进行分类。实验结果表明,在各个类别上的查准率、查全率和F1值都有所提高,验证了该方法的可行性。 展开更多
关键词 短文本分类 特征扩展 SVM lda
在线阅读 下载PDF
基于LDA主题模型的杭州市公园季节性公共服务价值
20
作者 侯力丹 卢群 林帅君 《中国城市林业》 2023年第3期109-116,132,共9页
季节对公园的公共服务价值具有显著影响,明确游客对于公园季节性公共服务价值的关注度及态度有助于提高公园的服务质量。文章以“大众点评”上游客对杭州市公园的评价文本为研究对象,基于LDA主题模型对公园季节性公共服务价值属性及游... 季节对公园的公共服务价值具有显著影响,明确游客对于公园季节性公共服务价值的关注度及态度有助于提高公园的服务质量。文章以“大众点评”上游客对杭州市公园的评价文本为研究对象,基于LDA主题模型对公园季节性公共服务价值属性及游客的关注度进行研究,并利用SnowNLP对评价文本中游客的情感变化进行分析。结果表明:春季和秋季游客主要关注以自然风光为主的游赏价值,夏季游客对公园的功能服务价值具有最高的关注度,冬季公园的休闲娱乐价值是游客最在意的方面,此外,游客对于不同季节的公园的公共服务价值普遍给予较为积极的评价,其中游赏价值、功能服务价值和休闲娱乐价值对游客的情感具有显著的影响。因此,公园的建设与发展应充分考虑公共服务价值随季节的变化,并根据游客诉求进行灵活调整。 展开更多
关键词 潜在狄利克雷分布主题模型 网络文本 简体中文文本处理 季节性公共服务价值 杭州市公园
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部