期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
121
篇文章
<
1
2
…
7
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于LDA模型和意象图式的产品隐喻设计方法研究
被引量:
1
1
作者
侯士江
卫建君
+3 位作者
孙宇辰
鲁莹
王佳棋
廉博杰
《包装工程》
CAS
北大核心
2024年第16期138-149,170,共13页
目的为实现隐喻设计方法的喻体选择和隐喻转译,结合LDA模型和意象图式提出一种新型产品隐喻设计方法。方法应用LDA聚类分析始源域中事件的情绪体验,获取用户在始源域中的主题喻体。基于深度访谈和图式表征分析提取意象图式,并通过AHP评...
目的为实现隐喻设计方法的喻体选择和隐喻转译,结合LDA模型和意象图式提出一种新型产品隐喻设计方法。方法应用LDA聚类分析始源域中事件的情绪体验,获取用户在始源域中的主题喻体。基于深度访谈和图式表征分析提取意象图式,并通过AHP评价排序获取重要图式转译因子。将图式因子进行组合表述,联想产品相应功能特征,完成意象喻体到产品主体的转译。结果以减压产品为例进行设计实践,通过LDA聚类获取了感官放松、情感满足、体验良性发展、探索未知、无意识本能、体能释放六大主题与相应模态,以及与主题对应的图示因子,并以可视化桌面蓝牙音箱为设计载体,从视觉、听觉和触觉模态介入,结合图式联想完成了音乐播放、探索互动、自动休眠和情绪释放4个功能隐喻设计。利用加权算法对设计方案进行测试评估,验证了设计方法的合理性。结论从隐喻设计现状出发,探索了基于LDA模型和意象图式的产品隐喻设计方法并加以实践,验证理论与方法的可行性与有效性,为产品隐喻设计乃至其他情感价值类产品的设计研究提供了优质案例与借鉴。
展开更多
关键词
产品设计
隐喻设计
lda
模型
意象图式
在线阅读
下载PDF
职称材料
基于LDA主题模型的在途驾驶风格识别方法
2
作者
汪娇
刘锴
+2 位作者
栗慧哲
曹鹏
王秋玲
《中国安全科学学报》
CAS
CSCD
北大核心
2024年第10期197-204,共8页
为增强人机共驾条件下智能系统对个体驾驶行为的理解,提出一种基于潜在狄利克雷分配(LDA)主题模型的在途驾驶风格识别方法,从多维度挖掘车辆轨迹信息,快速提取和识别驾驶员潜在驾驶风格特征。首先,建立驾驶行为语义理解规则,从驾驶作业...
为增强人机共驾条件下智能系统对个体驾驶行为的理解,提出一种基于潜在狄利克雷分配(LDA)主题模型的在途驾驶风格识别方法,从多维度挖掘车辆轨迹信息,快速提取和识别驾驶员潜在驾驶风格特征。首先,建立驾驶行为语义理解规则,从驾驶作业的场景感知层、模式层、操作层以及车辆状态层出发,将连续的轨迹时序数据阐述为驾驶行为语义理解词汇;其次,根据主题困惑度和主题一致性指标定义4类习惯性驾驶风格:稳定型、保守型、适中型以及激进型;最后,将每位驾驶员的在途驾驶风格识别为上述驾驶风格的概率组合。结果表明:所提出的在途驾驶风格识别方法考虑驾驶员在驾驶过程中的异质性和不一致性,能够解释同一驾驶员在不同驾驶环境下表现出差异化驾驶风格的现象,同时,有助于提高驾驶风格在途识别的全面性以及可理解性。
展开更多
关键词
潜在狄利克雷分配(
lda
)主题模型
在途驾驶风格
轨迹数据
语义理解
驾驶行为
在线阅读
下载PDF
职称材料
基于文本挖掘的连环追尾事故影响因素及严重程度
3
作者
王玲
李义丹
+3 位作者
王子坚
张龙
邢莹莹
马万经
《同济大学学报(自然科学版)》
北大核心
2025年第7期1074-1083,共10页
基于爬取的近8年微博数据,通过隐含狄利克雷分布(latent Dirichlet allocation,LDA)主题模型和社会网络分析,识别了连环追尾事故的8个主题,揭示了事故的主要特征和发生机理。研究发现高速公路是最主要的事故场景;雨雪天气引发事故频率...
基于爬取的近8年微博数据,通过隐含狄利克雷分布(latent Dirichlet allocation,LDA)主题模型和社会网络分析,识别了连环追尾事故的8个主题,揭示了事故的主要特征和发生机理。研究发现高速公路是最主要的事故场景;雨雪天气引发事故频率高于雾天;未保持安全车距和超速行为显著增加事故风险。利用LDA对每篇文档进行主题分配,结合正则表达式提取的严重程度信息,构建了有序Logit回归模型,分析了不同主题对事故严重程度的影响。结果表明,连环追尾事故的平均受伤人数和死亡人数分别是机动车交通事故平均值的2.12倍和1.85倍。在高速公路上的连环追尾事故严重程度高于交叉口,其优势比(odd ratio,OR)值是交叉口的3.3倍;雾天事故的OR值是雨雪天气的9.4倍;货车行驶事故的OR值是轿车的4.6倍,是客车的2.2倍。
展开更多
关键词
交通安全
连环追尾
严重程度
文本挖掘
隐含狄利克雷分布
有序LOGIT模型
在线阅读
下载PDF
职称材料
民航管制运行风险主题发现及演化趋势
4
作者
张洪海
戴一鸣
+2 位作者
刘文泉
石宗北
李一可
《科学技术与工程》
北大核心
2025年第17期7417-7429,共13页
空中交通管制运行安全正面临多元风险致因导致潜在危害的问题。为解决多元风险引发的管制不安全运行问题,基于对管制不安全运行事件报告的全面分析,对管制运行安全风险信息和潜在规则进行挖掘;通过对隐含狄利克雷分布(latent Dirichlet ...
空中交通管制运行安全正面临多元风险致因导致潜在危害的问题。为解决多元风险引发的管制不安全运行问题,基于对管制不安全运行事件报告的全面分析,对管制运行安全风险信息和潜在规则进行挖掘;通过对隐含狄利克雷分布(latent Dirichlet allocation,LDA)风险主题发现模型挖掘的风险主题和关键词进行分析,明确管制运行风险主题及不同风险主题间相互演化规律;针对风险主题关键词,构建了民航管制运行领域的基于BERT(bidirectional encoder representation from Transformers)模型的语义网络,分析风险主题相互关联的风险特征,得出风险主题间潜在关系,可为关键词间关联度的量化提供一定理论依据;促进民航管制运行安全风险的数字化呈现的发展,挖掘管制不安全信息,为准确感知管制运行风险奠定基础。
展开更多
关键词
空中交通管理
管制运行安全
风险管理
lda
主题模型
语义网络
在线阅读
下载PDF
职称材料
基于语义约束LDA的商品特征和情感词提取
被引量:
54
5
作者
彭云
万常选
+3 位作者
江腾蛟
刘德喜
刘喜平
廖国琼
《软件学报》
EI
CSCD
北大核心
2017年第3期676-693,共18页
随着网络购物的发展,Web上产生了大量的商品评论文本数据,其中蕴含着丰富的评价知识.如何从这些海量评论文本中有效地提取商品特征和情感词,进而获取特征级别的情感倾向,是进行商品评论细粒度情感分析的关键.根据中文商品评论文本的特点...
随着网络购物的发展,Web上产生了大量的商品评论文本数据,其中蕴含着丰富的评价知识.如何从这些海量评论文本中有效地提取商品特征和情感词,进而获取特征级别的情感倾向,是进行商品评论细粒度情感分析的关键.根据中文商品评论文本的特点,从句法分析、词义理解和语境相关等多角度获取词语间的语义关系,然后将其作为约束知识嵌入到主题模型,提出语义关系约束的主题模型SRC-LDA(semantic relation constrained LDA),用来实现语义指导下LDA的细粒度主题词提取.由于SRC-LDA改善了标准LDA对于主题词的语义理解和识别能力,从而提高了相同主题下主题词分配的关联度和不同主题下主题词分配的区分度,可以更多地发现细粒度特征词、情感词及其之间的语义关联性.实验结果表明,SRC-LDA对于细粒度特征和情感词的发现和提取具有较好的效果.
展开更多
关键词
lda
模型
语义约束
商品特征
情感词
在线阅读
下载PDF
职称材料
一种改进的LDA主题模型
被引量:
47
6
作者
张小平
周雪忠
+3 位作者
黄厚宽
冯奇
陈世波
焦宏官
《北京交通大学学报》
CAS
CSCD
北大核心
2010年第2期111-114,共4页
由于文档中的词符合幂律分布,使得LDA模型的主题分布向高频词倾斜,导致能够代表主题的多数词被少量的高频词淹没使得主题表达能力降低.通过一种高斯函数对特征词加权,改进LDA主题模型的主题分布.实验显示加权LDA模型获得的主题间的相关...
由于文档中的词符合幂律分布,使得LDA模型的主题分布向高频词倾斜,导致能够代表主题的多数词被少量的高频词淹没使得主题表达能力降低.通过一种高斯函数对特征词加权,改进LDA主题模型的主题分布.实验显示加权LDA模型获得的主题间的相关性以及复杂度(Perplexity)值都降低,说明改进模型在主题表达和预测性能方面都有所提高.
展开更多
关键词
lda
Dirichlet分布
加权主题模型
在线阅读
下载PDF
职称材料
融合显著信息的LDA极光图像分类
被引量:
20
7
作者
韩冰
杨辰
高新波
《软件学报》
EI
CSCD
北大核心
2013年第11期2758-2766,共9页
美丽的极光形态各异,不同形态的极光蕴含不同的物理意义,所以研究极光图像的分类具有重要的科学价值.在LDA(latent Dirichlet allocation)模型基础上提出了一种融合显著信息的LDA方法(LDA with saliency information,简称SI-LDA),利用...
美丽的极光形态各异,不同形态的极光蕴含不同的物理意义,所以研究极光图像的分类具有重要的科学价值.在LDA(latent Dirichlet allocation)模型基础上提出了一种融合显著信息的LDA方法(LDA with saliency information,简称SI-LDA),利用极光图像的谱残差(spectral residual,简称SR)显著信息生成视觉字典,加强极光图像的语义信息,并将其用于极光图像的特征表示.最后,利用SVM分类器对极光图像进行分类.实验结果表明,所提出的算法获得了良好的分类结果.
展开更多
关键词
极光图像
词袋模型
潜在狄利克雷分配
谱残差
显著信息
在线阅读
下载PDF
职称材料
基于LDA模型的文本分割
被引量:
55
8
作者
石晶
胡明
+1 位作者
石鑫
戴国忠
《计算机学报》
EI
CSCD
北大核心
2008年第10期1865-1873,共9页
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用.基于LDA模型的文本分割以LDA为语料库及文本建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,获取词汇的概率分布,使隐藏于片段内的不同主题...
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用.基于LDA模型的文本分割以LDA为语料库及文本建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,获取词汇的概率分布,使隐藏于片段内的不同主题与文本表面的字词建立联系.实验以汉语的整句作为基本块,尝试多种相似性度量手段及边界估计策略,其最佳结果表明二者的恰当结合可以使片段边界的识别错误率远远低于其它同类算法.
展开更多
关键词
文本分割
lda
模型
相似性度量
边界识别
在线阅读
下载PDF
职称材料
基于Labeled-LDA模型的文本分类新算法
被引量:
103
9
作者
李文波
孙乐
张大鲲
《计算机学报》
EI
CSCD
北大核心
2008年第4期620-627,共8页
LDA(Latent Dirichlet Allocation)模型是近年来提出的一种能够提取文本隐含主题的非监督学习模型.通过在传统LDA模型中融入文本类别信息,文中提出了一种附加类别标签的LDA模型(Labeled-LDA).基于该模型可以在各类别上协同计算隐含主题...
LDA(Latent Dirichlet Allocation)模型是近年来提出的一种能够提取文本隐含主题的非监督学习模型.通过在传统LDA模型中融入文本类别信息,文中提出了一种附加类别标签的LDA模型(Labeled-LDA).基于该模型可以在各类别上协同计算隐含主题的分配量,从而克服了传统LDA模型用于分类时强制分配隐含主题的缺陷.与传统LDA模型的实验对比表明:基于Labeled-LDA模型的文本分类新算法可以有效改进文本分类的性能,在复旦大学中文语料库上micro-F1提高约5.7%,在英文语料库20newsgroup的comp子集上micro-F1提高约3%.
展开更多
关键词
文本分类
图模型
隐含狄利克雷分配
变分推断
在线阅读
下载PDF
职称材料
基于LDA主题模型的文本相似度计算
被引量:
102
10
作者
王振振
何明
杜永萍
《计算机科学》
CSCD
北大核心
2013年第12期229-232,共4页
LDA(Latent Dirichlet Allocation)模型是近年来提出的一种具有文本表示能力的非监督学习模型。提出了一种基于LDA主题模型的文本相似度计算方法,该方法利用LDA为语料库建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,挖掘隐藏...
LDA(Latent Dirichlet Allocation)模型是近年来提出的一种具有文本表示能力的非监督学习模型。提出了一种基于LDA主题模型的文本相似度计算方法,该方法利用LDA为语料库建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,挖掘隐藏在文本内的不同主题与词之间的关系,得到文本的主题分布,并以此分布来计算文本之间的相似度,最后对文本相似度矩阵进行聚类实验来评估聚类效果。实验结果表明,该方法能够明显提高文本相似度计算的准确率和文本聚类效果。
展开更多
关键词
主题模型
lda
文本相似度
GIBBS抽样
在线阅读
下载PDF
职称材料
基于LDA模型的音乐推荐算法
被引量:
16
11
作者
李博
陈志刚
+1 位作者
黄瑞
郑祥云
《计算机工程》
CAS
CSCD
北大核心
2016年第6期175-179,184,共6页
互联网的普及以及音乐资源的电子化使得人们可以更方便地获得音乐资源。但随着音乐库变得越来越大、资源越来越丰富,人们已经很难准确及时地找到自己喜欢的音乐。因此,对于音乐网站而言,需要一个合适的音乐推荐算法向用户推荐音乐。根...
互联网的普及以及音乐资源的电子化使得人们可以更方便地获得音乐资源。但随着音乐库变得越来越大、资源越来越丰富,人们已经很难准确及时地找到自己喜欢的音乐。因此,对于音乐网站而言,需要一个合适的音乐推荐算法向用户推荐音乐。根据已有的基于音频信息的音乐推荐以及协同过滤方法,分析用户的音乐试听数据以及下载数据,并结合Latent Dirichlet分配(LDA)主题挖掘模型,提出一种音乐推荐算法。实验结果表明,与基于用户的协同过滤算法以及基于项目的协同过滤算法相比,该算法可以更加高效地向用户推荐感兴趣的音乐。
展开更多
关键词
协同过滤
音乐推荐
主题挖掘
latent
Dirichlet分配模型
吉布斯抽样
基于
lda
模型的音乐推荐
在线阅读
下载PDF
职称材料
一种并行LDA主题模型建立方法研究
被引量:
12
12
作者
王旭仁
姚叶鹏
+1 位作者
冉春风
何发镁
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2013年第6期590-593,共4页
针对潜在狄利克雷分析(LDA)模型分析大规模文档集或语料库中潜藏的主题信息计算时间较长问题,提出基于MapReduce架构的并行LDA主题模型建立方法.利用分布式编程模型研究了LDA主题模型建立方法的并行化实现.通过Hadoop并行计算平台进行...
针对潜在狄利克雷分析(LDA)模型分析大规模文档集或语料库中潜藏的主题信息计算时间较长问题,提出基于MapReduce架构的并行LDA主题模型建立方法.利用分布式编程模型研究了LDA主题模型建立方法的并行化实现.通过Hadoop并行计算平台进行实验的结果表明,该方法在处理大规模文本时,能获得接近线性的加速比,对主题模型的建立效果也有提高.
展开更多
关键词
MapReduce架构
并行计算
潜在狄利克雷分布模型
主题建模
在线阅读
下载PDF
职称材料
一种词聚类LDA的商品特征提取算法
被引量:
12
13
作者
彭云
万常选
+2 位作者
江腾蛟
刘德喜
刘喜平
《小型微型计算机系统》
CSCD
北大核心
2015年第7期1458-1463,共6页
商品评论中经常会使用一些词义近似或上下文相关的中低频词来描述商品特征,如何有效辨识这些中低频词是商品特征抽取的一个难点.由于缺乏先验知识,主题模型难以发现并抽取中低频特征词.提出基于词义相似度和上下文相关度相结合的词聚类...
商品评论中经常会使用一些词义近似或上下文相关的中低频词来描述商品特征,如何有效辨识这些中低频词是商品特征抽取的一个难点.由于缺乏先验知识,主题模型难以发现并抽取中低频特征词.提出基于词义相似度和上下文相关度相结合的词聚类度量算法,在此基础上构建了一种基于词聚类先验知识的潜在狄利克雷分配的商品主题特征提取模型.首先对词项按词义相似度、上下文相关度进行聚类;然后在商品主题特征抽取中引入词聚类因素作为权重影响因子,使得同一个聚类簇中的词项属于同一主题的概率增加.相关实验结果表明,本文提出的词聚类和特征提取算法具有较好的效果.
展开更多
关键词
词聚类
上下文相关
lda
模型
特征提取
在线阅读
下载PDF
职称材料
基于LDA与新兴主题特征分析的新兴主题探测研究
被引量:
65
14
作者
范云满
马建霞
《情报学报》
CSSCI
北大核心
2014年第7期698-711,共14页
本文尝试基于LDA主题模型探测文档集中的新兴主题.本文采用主题的新颖度、发文量指标,并引入被引量,得到新兴主题的特征指标,在此基础上对主题在进入成熟阶段前各个时期的特征进行了分析.并提出了针对上述新兴主题探测指标,基于LDA主题...
本文尝试基于LDA主题模型探测文档集中的新兴主题.本文采用主题的新颖度、发文量指标,并引入被引量,得到新兴主题的特征指标,在此基础上对主题在进入成熟阶段前各个时期的特征进行了分析.并提出了针对上述新兴主题探测指标,基于LDA主题模型抽取文档的语义主题词,利用文档-主题矩阵建立主题和文档的映射,得到主题的新颖度指标和发文量指标、被引量指标,并形成新兴主题探测表格和探测曲线VDP,从而探测出新兴主题,并对新兴主题VDP与基线VDP距离的发展趋势进行预测,根据拟合的曲线对其进行分析,得到最值得关注的新兴主题.
展开更多
关键词
隐狄利克雷分布
主题模型
新兴主题
主题特征
新颖度指标
发文量指标
被引量指标
生命周期
在线阅读
下载PDF
职称材料
基于LDA模型的主题分析
被引量:
36
15
作者
石晶
范猛
李万龙
《自动化学报》
EI
CSCD
北大核心
2009年第12期1586-1592,共7页
在文本分割的基础上,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来,主题以词串的形式表示.为了分析准确,利用LDA(Latent dirichlet allocation)为语料库及文本建模,以Clarity度量块间相似性,并通过局部最小值识别片...
在文本分割的基础上,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来,主题以词串的形式表示.为了分析准确,利用LDA(Latent dirichlet allocation)为语料库及文本建模,以Clarity度量块间相似性,并通过局部最小值识别片段边界.依据词汇的香农信息提取片段主题词,采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘隐藏于字词表面之下的文本内涵.实验表明,文本分析的结果明显好于其他方法,可以为下一步文本推理的工作提供有价值的预处理.
展开更多
关键词
主题分析
lda
模型
文本分割
GIBBS抽样
在线阅读
下载PDF
职称材料
基于LDA主题特征的自动文摘方法
被引量:
24
16
作者
张明慧
王红玲
周国栋
《计算机应用与软件》
CSCD
2011年第10期20-22,46,共4页
近年来概率主题模型受到了研究者的广泛关注,LDA(Latent Dirichlet Allocation)模型是主题模型中具有代表性的概率生成模型之一,它能够检测文本的隐含主题。提出一个基于LDA模型的主题特征,该特征计算文档的主题分布与句子主题分布的距...
近年来概率主题模型受到了研究者的广泛关注,LDA(Latent Dirichlet Allocation)模型是主题模型中具有代表性的概率生成模型之一,它能够检测文本的隐含主题。提出一个基于LDA模型的主题特征,该特征计算文档的主题分布与句子主题分布的距离。结合传统多文档自动文摘中的常用特征,计算句子权重,最终根据句子的分值抽取句子形成摘要。实验结果证明,加入LDA模型的主题特征后,自动文摘的性能得到了显著的提高。
展开更多
关键词
自动文摘
lda
主题模型
多文档
在线阅读
下载PDF
职称材料
基于LDA模型的专利信息聚类技术
被引量:
22
17
作者
范宇
符红光
文奕
《计算机应用》
CSCD
北大核心
2013年第A01期87-89,93,共4页
针对传统专利情报采集的方式不能适应专利信息快速增加的问题,通过研究适用于专利信息聚类的主题模型和聚类算法,提出了将潜在狄利克雷分配(LDA)主题模型和OPTICS算法相结合的解决方案。该方案采用LDA主题模型将专利信息在词汇空间的高...
针对传统专利情报采集的方式不能适应专利信息快速增加的问题,通过研究适用于专利信息聚类的主题模型和聚类算法,提出了将潜在狄利克雷分配(LDA)主题模型和OPTICS算法相结合的解决方案。该方案采用LDA主题模型将专利信息在词汇空间的高维表达转换到在主题空间的低维表达,高效地实现了对专利信息的降维,进而采用OPTICS算法及k近邻准则对专利信息进行聚类分析,达到收集感兴趣的专利情报信息的目的。理论分析和实验验证表明,提出的解决方案不仅能通过降维,提高专利聚类效率,而且能对专利信息分析提供帮助。
展开更多
关键词
潜在狄利克雷分配主题模型
聚类分析
OPTICS算法
专利信息聚类
专利分析
在线阅读
下载PDF
职称材料
基于LDA模型的主题词抽取方法
被引量:
49
18
作者
石晶
李万龙
《计算机工程》
CAS
CSCD
北大核心
2010年第19期81-83,共3页
以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的...
以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的速度约比传统Gibbs算法高5倍,准确率和抽取效率均较高。
展开更多
关键词
lda
模型
GIBBS抽样
主题词抽取
在线阅读
下载PDF
职称材料
一种基于LDA模型的主题句抽取方法
被引量:
10
19
作者
王力
李培峰
朱巧明
《计算机工程与应用》
CSCD
2013年第2期160-164,257,共6页
在基于Web的主题关键词查询扩展,获取候选主题句的基础上,提出一种基于LDA模型的主题句抽取方法,以抽取粒度较细的主题信息,并增加主题信息的置信度。该方法通过多个侧面对目标主题的衬托,采用LDA模型对主题信息进行建模,利用各个主题...
在基于Web的主题关键词查询扩展,获取候选主题句的基础上,提出一种基于LDA模型的主题句抽取方法,以抽取粒度较细的主题信息,并增加主题信息的置信度。该方法通过多个侧面对目标主题的衬托,采用LDA模型对主题信息进行建模,利用各个主题概率分布的平滑度进行候选句的可信度计算来抽取主题句。在面向Web的主题句抽取的具体应用中,取得了较好的效果。
展开更多
关键词
隐含狄利克雷分配(
lda
)
主题模型
主题句抽取
信息融合
在线阅读
下载PDF
职称材料
基于LDA模型的餐馆评论排序
被引量:
8
20
作者
吕韶华
杨亮
林鸿飞
《计算机工程》
CAS
CSCD
北大核心
2011年第19期62-64,67,共4页
在餐馆评论中,存在评论文本未明确指出评价等级及评论文本不一致等问题。为此,提出一种基于LDA模型的餐馆评论排序方法。利用LDA模型对评论文本进行主题抽取,过滤掉不相关评论,基于过滤后的用户评论和用户给出的评论等级计算餐馆评论若...
在餐馆评论中,存在评论文本未明确指出评价等级及评论文本不一致等问题。为此,提出一种基于LDA模型的餐馆评论排序方法。利用LDA模型对评论文本进行主题抽取,过滤掉不相关评论,基于过滤后的用户评论和用户给出的评论等级计算餐馆评论若干方面的得分,在该得分的基础上,利用逻辑回归进行训练,得到餐馆评论排序模型。实验结果表明,该方法的排序效果较优。
展开更多
关键词
lda
模型
餐馆评论
排序
观点挖掘
逻辑回归
在线阅读
下载PDF
职称材料
题名
基于LDA模型和意象图式的产品隐喻设计方法研究
被引量:
1
1
作者
侯士江
卫建君
孙宇辰
鲁莹
王佳棋
廉博杰
机构
燕山大学
出处
《包装工程》
CAS
北大核心
2024年第16期138-149,170,共13页
基金
河北省社会科学发展研究课题(20220202454)。
文摘
目的为实现隐喻设计方法的喻体选择和隐喻转译,结合LDA模型和意象图式提出一种新型产品隐喻设计方法。方法应用LDA聚类分析始源域中事件的情绪体验,获取用户在始源域中的主题喻体。基于深度访谈和图式表征分析提取意象图式,并通过AHP评价排序获取重要图式转译因子。将图式因子进行组合表述,联想产品相应功能特征,完成意象喻体到产品主体的转译。结果以减压产品为例进行设计实践,通过LDA聚类获取了感官放松、情感满足、体验良性发展、探索未知、无意识本能、体能释放六大主题与相应模态,以及与主题对应的图示因子,并以可视化桌面蓝牙音箱为设计载体,从视觉、听觉和触觉模态介入,结合图式联想完成了音乐播放、探索互动、自动休眠和情绪释放4个功能隐喻设计。利用加权算法对设计方案进行测试评估,验证了设计方法的合理性。结论从隐喻设计现状出发,探索了基于LDA模型和意象图式的产品隐喻设计方法并加以实践,验证理论与方法的可行性与有效性,为产品隐喻设计乃至其他情感价值类产品的设计研究提供了优质案例与借鉴。
关键词
产品设计
隐喻设计
lda
模型
意象图式
Keywords
product design
metaphor design
latent
Dirichlet
allocation
(
lda
)
model
image schema
分类号
TB482 [一般工业技术—包装工程]
在线阅读
下载PDF
职称材料
题名
基于LDA主题模型的在途驾驶风格识别方法
2
作者
汪娇
刘锴
栗慧哲
曹鹏
王秋玲
机构
大连理工大学交通运输学院
大连理工大学经济管理学院
西南交通大学交通运输与物流学院
长安大学运输工程学院
出处
《中国安全科学学报》
CAS
CSCD
北大核心
2024年第10期197-204,共8页
基金
国家自然科学基金资助(61903313,52202396)
四川省自然科学基金资助(2022NSFSC0476)
宁夏自治区揭榜挂帅重点项目(2023BBF01004)。
文摘
为增强人机共驾条件下智能系统对个体驾驶行为的理解,提出一种基于潜在狄利克雷分配(LDA)主题模型的在途驾驶风格识别方法,从多维度挖掘车辆轨迹信息,快速提取和识别驾驶员潜在驾驶风格特征。首先,建立驾驶行为语义理解规则,从驾驶作业的场景感知层、模式层、操作层以及车辆状态层出发,将连续的轨迹时序数据阐述为驾驶行为语义理解词汇;其次,根据主题困惑度和主题一致性指标定义4类习惯性驾驶风格:稳定型、保守型、适中型以及激进型;最后,将每位驾驶员的在途驾驶风格识别为上述驾驶风格的概率组合。结果表明:所提出的在途驾驶风格识别方法考虑驾驶员在驾驶过程中的异质性和不一致性,能够解释同一驾驶员在不同驾驶环境下表现出差异化驾驶风格的现象,同时,有助于提高驾驶风格在途识别的全面性以及可理解性。
关键词
潜在狄利克雷分配(
lda
)主题模型
在途驾驶风格
轨迹数据
语义理解
驾驶行为
Keywords
latent
Dirichlet
allocation
(
lda
)topic
model
en-route driving style
trajectory data
semantic understanding
driving behaviour
分类号
X951 [环境科学与工程—安全科学]
U463.6 [机械工程—车辆工程]
在线阅读
下载PDF
职称材料
题名
基于文本挖掘的连环追尾事故影响因素及严重程度
3
作者
王玲
李义丹
王子坚
张龙
邢莹莹
马万经
机构
同济大学道路与交通工程教育部重点实验室
青岛市即墨区交通运输局
出处
《同济大学学报(自然科学版)》
北大核心
2025年第7期1074-1083,共10页
基金
国家自然科学基金(52325210,52372333,52272336)
中央高校基本科研业务费专项资金(2023-4-YB-05,22120250322)。
文摘
基于爬取的近8年微博数据,通过隐含狄利克雷分布(latent Dirichlet allocation,LDA)主题模型和社会网络分析,识别了连环追尾事故的8个主题,揭示了事故的主要特征和发生机理。研究发现高速公路是最主要的事故场景;雨雪天气引发事故频率高于雾天;未保持安全车距和超速行为显著增加事故风险。利用LDA对每篇文档进行主题分配,结合正则表达式提取的严重程度信息,构建了有序Logit回归模型,分析了不同主题对事故严重程度的影响。结果表明,连环追尾事故的平均受伤人数和死亡人数分别是机动车交通事故平均值的2.12倍和1.85倍。在高速公路上的连环追尾事故严重程度高于交叉口,其优势比(odd ratio,OR)值是交叉口的3.3倍;雾天事故的OR值是雨雪天气的9.4倍;货车行驶事故的OR值是轿车的4.6倍,是客车的2.2倍。
关键词
交通安全
连环追尾
严重程度
文本挖掘
隐含狄利克雷分布
有序LOGIT模型
Keywords
traffic safety
chain rear-end collision
severity
text mining
latent
Dirichlet
allocation
(
lda
)
ordered Logit
model
分类号
U491.31 [交通运输工程—交通运输规划与管理]
在线阅读
下载PDF
职称材料
题名
民航管制运行风险主题发现及演化趋势
4
作者
张洪海
戴一鸣
刘文泉
石宗北
李一可
机构
南京航空航天大学民航学院
出处
《科学技术与工程》
北大核心
2025年第17期7417-7429,共13页
基金
国家自然科学基金民航联合基金(U2133207)
国家自然科学基金(52202404)
中国工业和信息化部民用飞机专项科研(MJZ1-7N22)。
文摘
空中交通管制运行安全正面临多元风险致因导致潜在危害的问题。为解决多元风险引发的管制不安全运行问题,基于对管制不安全运行事件报告的全面分析,对管制运行安全风险信息和潜在规则进行挖掘;通过对隐含狄利克雷分布(latent Dirichlet allocation,LDA)风险主题发现模型挖掘的风险主题和关键词进行分析,明确管制运行风险主题及不同风险主题间相互演化规律;针对风险主题关键词,构建了民航管制运行领域的基于BERT(bidirectional encoder representation from Transformers)模型的语义网络,分析风险主题相互关联的风险特征,得出风险主题间潜在关系,可为关键词间关联度的量化提供一定理论依据;促进民航管制运行安全风险的数字化呈现的发展,挖掘管制不安全信息,为准确感知管制运行风险奠定基础。
关键词
空中交通管理
管制运行安全
风险管理
lda
主题模型
语义网络
Keywords
air traffic management(ATM)
air traffic control operational safety
risk management
latent
Dirichlet
allocation
(
lda
)topics
model
semantic network
分类号
V355.1 [航空宇航科学与技术—人机与环境工程]
在线阅读
下载PDF
职称材料
题名
基于语义约束LDA的商品特征和情感词提取
被引量:
54
5
作者
彭云
万常选
江腾蛟
刘德喜
刘喜平
廖国琼
机构
江西财经大学信息管理学院
江西师范大学计算机信息工程学院
数据与知识工程江西省高校重点实验室(江西财经大学)
出处
《软件学报》
EI
CSCD
北大核心
2017年第3期676-693,共18页
基金
国家自然科学基金(61562032
61662032
+8 种基金
61662027
61173146
61363039
61363010
61462037
61562031)
江西省自然科学基金重大项目(20152ACB20003)
江西省高等学校科技落地计划(KJLD12022
KJLD14035)~~
文摘
随着网络购物的发展,Web上产生了大量的商品评论文本数据,其中蕴含着丰富的评价知识.如何从这些海量评论文本中有效地提取商品特征和情感词,进而获取特征级别的情感倾向,是进行商品评论细粒度情感分析的关键.根据中文商品评论文本的特点,从句法分析、词义理解和语境相关等多角度获取词语间的语义关系,然后将其作为约束知识嵌入到主题模型,提出语义关系约束的主题模型SRC-LDA(semantic relation constrained LDA),用来实现语义指导下LDA的细粒度主题词提取.由于SRC-LDA改善了标准LDA对于主题词的语义理解和识别能力,从而提高了相同主题下主题词分配的关联度和不同主题下主题词分配的区分度,可以更多地发现细粒度特征词、情感词及其之间的语义关联性.实验结果表明,SRC-LDA对于细粒度特征和情感词的发现和提取具有较好的效果.
关键词
lda
模型
语义约束
商品特征
情感词
Keywords
latent
diriehlet
allocation
model
semantic constraint
product aspect
opinion word
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
一种改进的LDA主题模型
被引量:
47
6
作者
张小平
周雪忠
黄厚宽
冯奇
陈世波
焦宏官
机构
北京交通大学计算机与信息技术学院
中国中医科学院广安门医院
中国中医科学院中医药信息研究所
出处
《北京交通大学学报》
CAS
CSCD
北大核心
2010年第2期111-114,共4页
基金
国家"973"计划项目资助(2006CB504601)
国家科技支撑计划项目资助(2007BA110B06-01)
+2 种基金
国家自然科学基金资助项目(90709006)
北京市科委科研攻关项目资助(D08050703020804)
北京交通大学科技基金资助(2007RC072)
文摘
由于文档中的词符合幂律分布,使得LDA模型的主题分布向高频词倾斜,导致能够代表主题的多数词被少量的高频词淹没使得主题表达能力降低.通过一种高斯函数对特征词加权,改进LDA主题模型的主题分布.实验显示加权LDA模型获得的主题间的相关性以及复杂度(Perplexity)值都降低,说明改进模型在主题表达和预测性能方面都有所提高.
关键词
lda
Dirichlet分布
加权主题模型
Keywords
latent
dirichlet
allocation
(lda
)
dirichlet distribution
weighting topic
model
分类号
TP391.43 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
融合显著信息的LDA极光图像分类
被引量:
20
7
作者
韩冰
杨辰
高新波
机构
西安电子科技大学电子工程学院
出处
《软件学报》
EI
CSCD
北大核心
2013年第11期2758-2766,共9页
基金
国家自然科学基金(41031064
60902082)
+4 种基金
教育部留学回国人员科研启动基金
2010年海洋公益性行业科研专项经费(201005017)
陕西省自然科学基础研究计划(2011JQ8019)
中央高校基本科研业务费专项资金(K5051302008
K5051202048)
文摘
美丽的极光形态各异,不同形态的极光蕴含不同的物理意义,所以研究极光图像的分类具有重要的科学价值.在LDA(latent Dirichlet allocation)模型基础上提出了一种融合显著信息的LDA方法(LDA with saliency information,简称SI-LDA),利用极光图像的谱残差(spectral residual,简称SR)显著信息生成视觉字典,加强极光图像的语义信息,并将其用于极光图像的特征表示.最后,利用SVM分类器对极光图像进行分类.实验结果表明,所提出的算法获得了良好的分类结果.
关键词
极光图像
词袋模型
潜在狄利克雷分配
谱残差
显著信息
Keywords
aurora image
bag of words
model
latent
diriehlet
allocation
(lda
)
spectral residual
saliency information
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于LDA模型的文本分割
被引量:
55
8
作者
石晶
胡明
石鑫
戴国忠
机构
长春工业大学计算机科学与工程学院
辽宁师范大学功能材料化学研究所
中国科学院软件研究所人机交互技术与智能信息处理实验室
出处
《计算机学报》
EI
CSCD
北大核心
2008年第10期1865-1873,共9页
基金
国家“九七三”重点基础研究发展规划项目基金(2002CB312103)
国家自然科学基金(60503054)
中国科学院软件研究所创新工程重大项目资助~~
文摘
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用.基于LDA模型的文本分割以LDA为语料库及文本建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,获取词汇的概率分布,使隐藏于片段内的不同主题与文本表面的字词建立联系.实验以汉语的整句作为基本块,尝试多种相似性度量手段及边界估计策略,其最佳结果表明二者的恰当结合可以使片段边界的识别错误率远远低于其它同类算法.
关键词
文本分割
lda
模型
相似性度量
边界识别
Keywords
text segmentation
model
latent
Dirichlet
allocation
(lda
)
similarity metric
boundaries discovering
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于Labeled-LDA模型的文本分类新算法
被引量:
103
9
作者
李文波
孙乐
张大鲲
机构
中国科学院软件研究所
出处
《计算机学报》
EI
CSCD
北大核心
2008年第4期620-627,共8页
基金
国家自然科学基金项目(60773027)
国家自然科学基金重点项目(60736044)
国家“八六三”高技术研究发展计划重点项目基金(2006AA010108)资助~~
文摘
LDA(Latent Dirichlet Allocation)模型是近年来提出的一种能够提取文本隐含主题的非监督学习模型.通过在传统LDA模型中融入文本类别信息,文中提出了一种附加类别标签的LDA模型(Labeled-LDA).基于该模型可以在各类别上协同计算隐含主题的分配量,从而克服了传统LDA模型用于分类时强制分配隐含主题的缺陷.与传统LDA模型的实验对比表明:基于Labeled-LDA模型的文本分类新算法可以有效改进文本分类的性能,在复旦大学中文语料库上micro-F1提高约5.7%,在英文语料库20newsgroup的comp子集上micro-F1提高约3%.
关键词
文本分类
图模型
隐含狄利克雷分配
变分推断
Keywords
text classification
graphical
model
latent
Dirichlet
allocation
(lda
)
variationalinference
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于LDA主题模型的文本相似度计算
被引量:
102
10
作者
王振振
何明
杜永萍
机构
北京工业大学计算机学院
出处
《计算机科学》
CSCD
北大核心
2013年第12期229-232,共4页
基金
国家自然科学基金(60803086)
北京市自然科学基金(4123091)
+1 种基金
北京市教委科研计划(KM20110005013
KM200910005009)资助
文摘
LDA(Latent Dirichlet Allocation)模型是近年来提出的一种具有文本表示能力的非监督学习模型。提出了一种基于LDA主题模型的文本相似度计算方法,该方法利用LDA为语料库建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,挖掘隐藏在文本内的不同主题与词之间的关系,得到文本的主题分布,并以此分布来计算文本之间的相似度,最后对文本相似度矩阵进行聚类实验来评估聚类效果。实验结果表明,该方法能够明显提高文本相似度计算的准确率和文本聚类效果。
关键词
主题模型
lda
文本相似度
GIBBS抽样
Keywords
Topic
model
,
latent
Dirichlet
allocation
(lda
), Text similarity, Gibbs sampling
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于LDA模型的音乐推荐算法
被引量:
16
11
作者
李博
陈志刚
黄瑞
郑祥云
机构
中南大学软件学院
移动医疗教育部-中国移动联合实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第6期175-179,184,共6页
基金
国家自然科学基金资助项目(61379057)
中南大学中央高校基本科研业务费专项基金资助项目(2015zzts228)
文摘
互联网的普及以及音乐资源的电子化使得人们可以更方便地获得音乐资源。但随着音乐库变得越来越大、资源越来越丰富,人们已经很难准确及时地找到自己喜欢的音乐。因此,对于音乐网站而言,需要一个合适的音乐推荐算法向用户推荐音乐。根据已有的基于音频信息的音乐推荐以及协同过滤方法,分析用户的音乐试听数据以及下载数据,并结合Latent Dirichlet分配(LDA)主题挖掘模型,提出一种音乐推荐算法。实验结果表明,与基于用户的协同过滤算法以及基于项目的协同过滤算法相比,该算法可以更加高效地向用户推荐感兴趣的音乐。
关键词
协同过滤
音乐推荐
主题挖掘
latent
Dirichlet分配模型
吉布斯抽样
基于
lda
模型的音乐推荐
Keywords
collaborative filtering
music recommendation
theme mining
latent
Dirichlet
allocation
(lda
)
model
Gibbs sampling
Music Recommendation based on
lda
model
(MR_
lda)
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
一种并行LDA主题模型建立方法研究
被引量:
12
12
作者
王旭仁
姚叶鹏
冉春风
何发镁
机构
首都师范大学信息工程学院
北京理工大学图书馆
出处
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2013年第6期590-593,共4页
基金
国家自然科学基金资助项目(61272446)
北京市属高等学校人才强教深化计划"中青年骨干人才"资助项目(PHR201008083)
文摘
针对潜在狄利克雷分析(LDA)模型分析大规模文档集或语料库中潜藏的主题信息计算时间较长问题,提出基于MapReduce架构的并行LDA主题模型建立方法.利用分布式编程模型研究了LDA主题模型建立方法的并行化实现.通过Hadoop并行计算平台进行实验的结果表明,该方法在处理大规模文本时,能获得接近线性的加速比,对主题模型的建立效果也有提高.
关键词
MapReduce架构
并行计算
潜在狄利克雷分布模型
主题建模
Keywords
MapReduce architecture
parallel computing
latent
Dirichlet
allocation
(lda
)
model
topic
model
ing
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
一种词聚类LDA的商品特征提取算法
被引量:
12
13
作者
彭云
万常选
江腾蛟
刘德喜
刘喜平
机构
江西财经大学信息管理学院
江西财经大学数据与知识工程江西省高校重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2015年第7期1458-1463,共6页
基金
国家自然科学基金项目(61173146
61363010
+4 种基金
61363039)资助
国家社会科学基金项目(12CTQ042)资助
江西省高等学校科技落地计划(产学研合作)项目(KJLD12022)资助
江西省自然科学基金重大项目(20152ACB20003)
江西省研究生创新专项项目(YC2013-B047)资助
文摘
商品评论中经常会使用一些词义近似或上下文相关的中低频词来描述商品特征,如何有效辨识这些中低频词是商品特征抽取的一个难点.由于缺乏先验知识,主题模型难以发现并抽取中低频特征词.提出基于词义相似度和上下文相关度相结合的词聚类度量算法,在此基础上构建了一种基于词聚类先验知识的潜在狄利克雷分配的商品主题特征提取模型.首先对词项按词义相似度、上下文相关度进行聚类;然后在商品主题特征抽取中引入词聚类因素作为权重影响因子,使得同一个聚类簇中的词项属于同一主题的概率增加.相关实验结果表明,本文提出的词聚类和特征提取算法具有较好的效果.
关键词
词聚类
上下文相关
lda
模型
特征提取
Keywords
word clustering
contextual relevance
latent
Dirichlet
allocation
(lda
)
model
aspect extraction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于LDA与新兴主题特征分析的新兴主题探测研究
被引量:
65
14
作者
范云满
马建霞
机构
中国科学院兰州文献情报中心
中国医学科学院医学信息研究所
出处
《情报学报》
CSSCI
北大核心
2014年第7期698-711,共14页
基金
中国科学院西部之光联合学者项目“基于计算情报方法的甘肃省战略新兴产业技术创新竞争与发展研究”
国家自然科学基金项目(项目编号:71373260)的研究成果之一
文摘
本文尝试基于LDA主题模型探测文档集中的新兴主题.本文采用主题的新颖度、发文量指标,并引入被引量,得到新兴主题的特征指标,在此基础上对主题在进入成熟阶段前各个时期的特征进行了分析.并提出了针对上述新兴主题探测指标,基于LDA主题模型抽取文档的语义主题词,利用文档-主题矩阵建立主题和文档的映射,得到主题的新颖度指标和发文量指标、被引量指标,并形成新兴主题探测表格和探测曲线VDP,从而探测出新兴主题,并对新兴主题VDP与基线VDP距离的发展趋势进行预测,根据拟合的曲线对其进行分析,得到最值得关注的新兴主题.
关键词
隐狄利克雷分布
主题模型
新兴主题
主题特征
新颖度指标
发文量指标
被引量指标
生命周期
Keywords
lda
(
latent
diriehlet
allocation
) , topic
model
, emerging topic, topic feature, novelty index, published volume index, citation volume index, life cycle
分类号
G353.1 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
基于LDA模型的主题分析
被引量:
36
15
作者
石晶
范猛
李万龙
机构
长春工业大学计算机科学与工程学院
长春工业大学科研处
吉林大学计算机科学与技术学院
出处
《自动化学报》
EI
CSCD
北大核心
2009年第12期1586-1592,共7页
基金
长春工业大学博士基金(2008A02)资助~~
文摘
在文本分割的基础上,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来,主题以词串的形式表示.为了分析准确,利用LDA(Latent dirichlet allocation)为语料库及文本建模,以Clarity度量块间相似性,并通过局部最小值识别片段边界.依据词汇的香农信息提取片段主题词,采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘隐藏于字词表面之下的文本内涵.实验表明,文本分析的结果明显好于其他方法,可以为下一步文本推理的工作提供有价值的预处理.
关键词
主题分析
lda
模型
文本分割
GIBBS抽样
Keywords
Topic analysis,
latent
dirichlet
allocation
(lda
)
model
, text segmentation, Gibbs sampling
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于LDA主题特征的自动文摘方法
被引量:
24
16
作者
张明慧
王红玲
周国栋
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
出处
《计算机应用与软件》
CSCD
2011年第10期20-22,46,共4页
基金
国家自然科学基金(60673041
60873150)
江苏省高校自然科学重大基础研究项目(08KJA520002)
文摘
近年来概率主题模型受到了研究者的广泛关注,LDA(Latent Dirichlet Allocation)模型是主题模型中具有代表性的概率生成模型之一,它能够检测文本的隐含主题。提出一个基于LDA模型的主题特征,该特征计算文档的主题分布与句子主题分布的距离。结合传统多文档自动文摘中的常用特征,计算句子权重,最终根据句子的分值抽取句子形成摘要。实验结果证明,加入LDA模型的主题特征后,自动文摘的性能得到了显著的提高。
关键词
自动文摘
lda
主题模型
多文档
Keywords
Automatic document summarization
latent
dirichlet
allocation
(lda
) Topic
model
Multi-document
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于LDA模型的专利信息聚类技术
被引量:
22
17
作者
范宇
符红光
文奕
机构
中国科学院成都计算机应用研究所
中国科学院大学
中国科学院成都文献情报中心
出处
《计算机应用》
CSCD
北大核心
2013年第A01期87-89,93,共4页
文摘
针对传统专利情报采集的方式不能适应专利信息快速增加的问题,通过研究适用于专利信息聚类的主题模型和聚类算法,提出了将潜在狄利克雷分配(LDA)主题模型和OPTICS算法相结合的解决方案。该方案采用LDA主题模型将专利信息在词汇空间的高维表达转换到在主题空间的低维表达,高效地实现了对专利信息的降维,进而采用OPTICS算法及k近邻准则对专利信息进行聚类分析,达到收集感兴趣的专利情报信息的目的。理论分析和实验验证表明,提出的解决方案不仅能通过降维,提高专利聚类效率,而且能对专利信息分析提供帮助。
关键词
潜在狄利克雷分配主题模型
聚类分析
OPTICS算法
专利信息聚类
专利分析
Keywords
latent
Dirichlet
allocation
(lda
) topic
model
clustering analysis
OPTICS algorithm
patent information clustering
patent analysis
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于LDA模型的主题词抽取方法
被引量:
49
18
作者
石晶
李万龙
机构
长春工业大学计算机科学与工程学院
吉林大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第19期81-83,共3页
基金
长春工业大学博士基金资助项目(2008A02)
文摘
以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的速度约比传统Gibbs算法高5倍,准确率和抽取效率均较高。
关键词
lda
模型
GIBBS抽样
主题词抽取
Keywords
latent
Dirichlet
allocation
(lda
)
model
Gibbs sampling
extraction of topic words
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
一种基于LDA模型的主题句抽取方法
被引量:
10
19
作者
王力
李培峰
朱巧明
机构
苏州大学计算机科学和技术学院
江苏省计算机信息处理技术重点实验室
出处
《计算机工程与应用》
CSCD
2013年第2期160-164,257,共6页
基金
国家自然科学基金(No.90920004
No.60970056
+2 种基金
No.61070123
No.61003153)
江苏省高校自然科学重大基础研究项目(No.08KJA520002)
文摘
在基于Web的主题关键词查询扩展,获取候选主题句的基础上,提出一种基于LDA模型的主题句抽取方法,以抽取粒度较细的主题信息,并增加主题信息的置信度。该方法通过多个侧面对目标主题的衬托,采用LDA模型对主题信息进行建模,利用各个主题概率分布的平滑度进行候选句的可信度计算来抽取主题句。在面向Web的主题句抽取的具体应用中,取得了较好的效果。
关键词
隐含狄利克雷分配(
lda
)
主题模型
主题句抽取
信息融合
Keywords
latent
Dirichlet
allocation
(lda
)
topic
model
topical sentence extraction
information fusion
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于LDA模型的餐馆评论排序
被引量:
8
20
作者
吕韶华
杨亮
林鸿飞
机构
大连理工大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第19期62-64,67,共4页
基金
国家自然科学基金资助项目(60673039
60973068)
+1 种基金
国家"863"计划基金资助项目(2006AA01Z151)
教育部博士点基金资助项目(20090041110002)
文摘
在餐馆评论中,存在评论文本未明确指出评价等级及评论文本不一致等问题。为此,提出一种基于LDA模型的餐馆评论排序方法。利用LDA模型对评论文本进行主题抽取,过滤掉不相关评论,基于过滤后的用户评论和用户给出的评论等级计算餐馆评论若干方面的得分,在该得分的基础上,利用逻辑回归进行训练,得到餐馆评论排序模型。实验结果表明,该方法的排序效果较优。
关键词
lda
模型
餐馆评论
排序
观点挖掘
逻辑回归
Keywords
latent
Dirichlet
allocation
(lda
)
model
restaurant reviews
rank
opinion mining
logistic regression
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于LDA模型和意象图式的产品隐喻设计方法研究
侯士江
卫建君
孙宇辰
鲁莹
王佳棋
廉博杰
《包装工程》
CAS
北大核心
2024
1
在线阅读
下载PDF
职称材料
2
基于LDA主题模型的在途驾驶风格识别方法
汪娇
刘锴
栗慧哲
曹鹏
王秋玲
《中国安全科学学报》
CAS
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
3
基于文本挖掘的连环追尾事故影响因素及严重程度
王玲
李义丹
王子坚
张龙
邢莹莹
马万经
《同济大学学报(自然科学版)》
北大核心
2025
0
在线阅读
下载PDF
职称材料
4
民航管制运行风险主题发现及演化趋势
张洪海
戴一鸣
刘文泉
石宗北
李一可
《科学技术与工程》
北大核心
2025
0
在线阅读
下载PDF
职称材料
5
基于语义约束LDA的商品特征和情感词提取
彭云
万常选
江腾蛟
刘德喜
刘喜平
廖国琼
《软件学报》
EI
CSCD
北大核心
2017
54
在线阅读
下载PDF
职称材料
6
一种改进的LDA主题模型
张小平
周雪忠
黄厚宽
冯奇
陈世波
焦宏官
《北京交通大学学报》
CAS
CSCD
北大核心
2010
47
在线阅读
下载PDF
职称材料
7
融合显著信息的LDA极光图像分类
韩冰
杨辰
高新波
《软件学报》
EI
CSCD
北大核心
2013
20
在线阅读
下载PDF
职称材料
8
基于LDA模型的文本分割
石晶
胡明
石鑫
戴国忠
《计算机学报》
EI
CSCD
北大核心
2008
55
在线阅读
下载PDF
职称材料
9
基于Labeled-LDA模型的文本分类新算法
李文波
孙乐
张大鲲
《计算机学报》
EI
CSCD
北大核心
2008
103
在线阅读
下载PDF
职称材料
10
基于LDA主题模型的文本相似度计算
王振振
何明
杜永萍
《计算机科学》
CSCD
北大核心
2013
102
在线阅读
下载PDF
职称材料
11
基于LDA模型的音乐推荐算法
李博
陈志刚
黄瑞
郑祥云
《计算机工程》
CAS
CSCD
北大核心
2016
16
在线阅读
下载PDF
职称材料
12
一种并行LDA主题模型建立方法研究
王旭仁
姚叶鹏
冉春风
何发镁
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2013
12
在线阅读
下载PDF
职称材料
13
一种词聚类LDA的商品特征提取算法
彭云
万常选
江腾蛟
刘德喜
刘喜平
《小型微型计算机系统》
CSCD
北大核心
2015
12
在线阅读
下载PDF
职称材料
14
基于LDA与新兴主题特征分析的新兴主题探测研究
范云满
马建霞
《情报学报》
CSSCI
北大核心
2014
65
在线阅读
下载PDF
职称材料
15
基于LDA模型的主题分析
石晶
范猛
李万龙
《自动化学报》
EI
CSCD
北大核心
2009
36
在线阅读
下载PDF
职称材料
16
基于LDA主题特征的自动文摘方法
张明慧
王红玲
周国栋
《计算机应用与软件》
CSCD
2011
24
在线阅读
下载PDF
职称材料
17
基于LDA模型的专利信息聚类技术
范宇
符红光
文奕
《计算机应用》
CSCD
北大核心
2013
22
在线阅读
下载PDF
职称材料
18
基于LDA模型的主题词抽取方法
石晶
李万龙
《计算机工程》
CAS
CSCD
北大核心
2010
49
在线阅读
下载PDF
职称材料
19
一种基于LDA模型的主题句抽取方法
王力
李培峰
朱巧明
《计算机工程与应用》
CSCD
2013
10
在线阅读
下载PDF
职称材料
20
基于LDA模型的餐馆评论排序
吕韶华
杨亮
林鸿飞
《计算机工程》
CAS
CSCD
北大核心
2011
8
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
7
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部