期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于DTS-ILDA模型和关联过滤的新闻话题演化分析 被引量:4
1
作者 郭晓利 周自岚 +2 位作者 刘耀伟 独健鸿 黄岩 《应用科学学报》 CSCD 北大核心 2017年第5期634-646,共13页
在话题演化跟踪领域,主题模型中时间片大小和主题数K值固定导致无法发掘重要时间转折点,为此提出一种动态时序分割无限潜在狄利克雷分配(dynamic temporal segmentation-infinite latent Dirichlet allocation,DTS-ILDA)模型.对于演化... 在话题演化跟踪领域,主题模型中时间片大小和主题数K值固定导致无法发掘重要时间转折点,为此提出一种动态时序分割无限潜在狄利克雷分配(dynamic temporal segmentation-infinite latent Dirichlet allocation,DTS-ILDA)模型.对于演化分析中容易产生错误话题关联的问题,提出一种关联过滤机制.首先运用DTS-ILDA模型提取主题,将改进动态时间分割算法与无限潜在狄利克雷分配(infinite latent Dirichlet allocation,ILDA)模型进行融合.动态时间分割算法按时间顺序遍历数据集,根据列联表分析前后时间片主题分布情况以衡量分割效果,从而找到合适的时间片分割点;ILDA模型可在各时间片内提取不同数量话题并对提取出的主题进行演化关联分析,然后用关键过滤方法滤除关联性不强的关联关系,最后按照时间顺序关系为剩余的关联建立子话题的5种演化关系图.实验表明:该方法能有效找到主题内容发生重要变化的时间点,防止产生无意义话题,同时减少错误话题关联干扰,挖掘出准确的话题深层次关系. 展开更多
关键词 主题模型 主题演化 时间分割 无限潜在狄利克雷分配模型 过滤
在线阅读 下载PDF
考虑城市与群体异质的新能源车激励策略有效性研究
2
作者 翁剑成 周慧缘 +1 位作者 张梦媛 于江波 《交通运输系统工程与信息》 北大核心 2025年第1期2-14,共13页
制定针对城市低碳发展阶段和居民特征的差异化政策,是优化激励策略和促进居民转向绿色出行的重要途径。本文综合考虑空气质量、新能源汽车渗透率和充电设施成熟度等因素,选取4种类别典型城市的异质性居民人群,量化评估新能源车激励策略... 制定针对城市低碳发展阶段和居民特征的差异化政策,是优化激励策略和促进居民转向绿色出行的重要途径。本文综合考虑空气质量、新能源汽车渗透率和充电设施成熟度等因素,选取4种类别典型城市的异质性居民人群,量化评估新能源车激励策略的有效性;利用隐含狄利克雷分布(LDA)模型分析社交媒体热点数据,设计用户调查问卷;构建潜在类别有序Logit模型(LCOL)定量分析不同城市类别下潜在类别人群对车辆电动化激励策略的偏好程度,辨识不同策略的核心作用群体。结果表明,即时效应激励,例如,限行豁免和大额财政补贴,更能有效提升新能源车接受度较低居民的购车意愿,接受度较高的居民对常态化低额补贴更为敏感。在城市类别维度上,相较新能源车渗透率高的大城市(60%),渗透率较低的中小城市居民在政策激励下,购买新能源车概率为65%,更具提升潜力;充电设施欠缺的城市,优化充电设施可显著提升居民购车意愿,减少1 min寻电时间,概率提高1%,但在充电桩覆盖率高的城市,效果有限;机动车限号的大城市,实施新能源车限行豁免政策时,居民购车概率提高3.5%。定量化的研究结论可为不同城市新能源车推广策略的制定提供决策依据和科学度量参考。 展开更多
关键词 城市交通 低碳激励政策 潜在类别有序Logit模型 隐含狄利克雷分布模型 群体异质性 城市类别
在线阅读 下载PDF
多特征融合文本聚类的新闻话题发现模型 被引量:10
3
作者 车蕾 杨小平 《国防科技大学学报》 EI CAS CSCD 北大核心 2017年第3期85-90,共6页
融合新闻命名实体、新闻标题、新闻重要段落、文本语义等多特征影响,提出基于多特征融合文本聚类的新闻话题发现模型。模型根据新闻的多特征影响,提出一种多特征融合文本聚类方法。该方法针对新闻标题、新闻重要段落等特征因素构建向量... 融合新闻命名实体、新闻标题、新闻重要段落、文本语义等多特征影响,提出基于多特征融合文本聚类的新闻话题发现模型。模型根据新闻的多特征影响,提出一种多特征融合文本聚类方法。该方法针对新闻标题、新闻重要段落等特征因素构建向量空间模型及相似度算法,基于潜在狄利克雷分配模型构建主题空间模型及相似度算法,针对命名实体构建命名实体模型及相似度算法,并将三种相似度算法形成最优融合。基于多特征融合文本聚类方法,模型改进了用于新闻话题发现的Single-Pass算法。实验是在真实新闻数据集上开展的,实验结果表明:该模型有效地提高了新闻话题发现的准确率、召回率和综合评价指标,并具有一定的自适应能力。 展开更多
关键词 新闻话题 多特征融合 在狄利克雷分配 向量空间模型 主题空间模型
在线阅读 下载PDF
非监督式层次话题情感模型在网络评论主题发现中的应用
4
作者 陈永恒 姚桂杰 林耀进 《东北石油大学学报》 CAS 北大核心 2015年第1期112-117,8,共6页
自动发现话题的隐含结构、情感的极性及其关系,可以方便用户从海量网络评论集中快速获得他们关注的主要观点.提出一种基于非监督式的层次话题的情感(Unsupervised Level Aspect-Sentiment,ULAS)模型,利用贝叶斯非参数性模型作为先验知识... 自动发现话题的隐含结构、情感的极性及其关系,可以方便用户从海量网络评论集中快速获得他们关注的主要观点.提出一种基于非监督式的层次话题的情感(Unsupervised Level Aspect-Sentiment,ULAS)模型,利用贝叶斯非参数性模型作为先验知识,实现非监督式发现未标记评论文本集话题的层次结构,分析层次话题的情感极性.实验结果表明,相比传统的JST和ASUM模型,ULAS模型具备较高的分类精确度和较强的模型泛化能力,能够解决传统话题情感模型只能在单一粒度话题层进行情感分析的问题,实现多粒度话题层的情感分析,满足用户对于评论对象不同粒度话题的情感信息需求. 展开更多
关键词 非监督式层次话题情感模型 隐藏狄利克雷分配 文本分析 网络评论 主题发现 主题模型 非参贝叶斯模型
在线阅读 下载PDF
基于文献计量学和机器学习的小麦生物育种文献分析
5
作者 郑倩 《浙江农林大学学报》 北大核心 2025年第1期210-217,共8页
【目的】分析全球小麦Triticum aestivum生物育种研究进展,揭示其研究主题、核心知识元素和前沿热点,为小麦育种的理论研究和学科发展提供参考。【方法】从Web of Science核心合集数据库检索2013—2024年全球小麦生物育种研究领域发表... 【目的】分析全球小麦Triticum aestivum生物育种研究进展,揭示其研究主题、核心知识元素和前沿热点,为小麦育种的理论研究和学科发展提供参考。【方法】从Web of Science核心合集数据库检索2013—2024年全球小麦生物育种研究领域发表的文献,利用文献计量学方法分析该领域的发文量、学术影响力、发文主体等,利用VOSviewer生成国家合作网络和关键词共现网络,利用机器学习算法潜在狄利克雷分配(LDA)分析文献摘要,建立语言模型,识别研究主题。【结果】2013年以来全球小麦生物育种研究的科研产出大幅增加,共发表文献16 151篇。中国是全球在该领域发文最多的国家,其次是美国。关键词共现图谱显示,产量、数量性状位点、全基因组关联分析、干旱胁迫、基因表达、单核苷酸多态性是小麦生物育种研究的热点,而规律间隔成簇短回文重复序列(CRISPR)、基因组编辑、高通量表型分析、无人机、机器学习等是近年来兴起的研究领域。LDA分析结果显示:小麦生物育种可大致分为5个研究领域,包括遗传定位、基因组和育种、生物逆境、非生物逆境和产量形成。其中,小麦锈病、数量性状位点定位、面粉品质、干旱、基因组等是高度关注的研究主题。【结论】未来小麦生物育种需要充分利用包括组学、自动表型、人工智能、基因编辑、基因组育种等现代生物技术和信息技术,发掘和利用重要基因,开展智慧育种。 展开更多
关键词 小麦 生物育种 文献计量分析 VOSviewer 在狄利克雷分配(LDA) 机器学习
在线阅读 下载PDF
基于近义词分配的铁路扣件状态检测 被引量:4
6
作者 李爽 李柏林 《铁道标准设计》 北大核心 2018年第6期30-33,共4页
针对传统"视觉词包模型"在进行底层特征编码时存在较大的量化误差的问题,提出一种基于近义词分配的铁路扣件状态检测模型。首先,利用潜在狄利克雷分布模型分析得到语义主题在某一视觉单词上的概率分布,并引入相对熵衡量视觉... 针对传统"视觉词包模型"在进行底层特征编码时存在较大的量化误差的问题,提出一种基于近义词分配的铁路扣件状态检测模型。首先,利用潜在狄利克雷分布模型分析得到语义主题在某一视觉单词上的概率分布,并引入相对熵衡量视觉单词间的语义距离,从而获取语义相关的近义词;然后,在"视觉词包模型"的基础上,结合柔性分配策略将底层特征映射至若干近义词上;最后,利用支持向量机实现扣件检测。对4类扣件图像的分类实验证明该模型能够有效提高扣件分类精确度。 展开更多
关键词 铁路扣件 检测 词包模型 相对熵 在狄利克雷分布 近义词 视觉单词
在线阅读 下载PDF
基于hLDA主题模型的多文档摘要句子打分算法研究 被引量:1
7
作者 于佳 《河南科技》 2013年第11X期273-274,共2页
多文档摘要技术在自然语言处理领域得到越来越广泛的关注,层次潜在狄利克雷分配(以下简称hLDA)在层次主题建模中的良好效果已经得到验证,本文以hLDA模型结构中的节点作为重点研究对象,研究基于hLDA主题模型的句子打分方法,为多文档摘要... 多文档摘要技术在自然语言处理领域得到越来越广泛的关注,层次潜在狄利克雷分配(以下简称hLDA)在层次主题建模中的良好效果已经得到验证,本文以hLDA模型结构中的节点作为重点研究对象,研究基于hLDA主题模型的句子打分方法,为多文档摘要的句子抽取提供有力依据。 展开更多
关键词 多文档摘要 句子打分 hLDA(层次在狄利克雷分配) 节点
在线阅读 下载PDF
基于LDA模型的聚类检索应用 被引量:1
8
作者 宿青 《中国新通信》 2017年第5期39-40,共2页
搜索算法可以将文档主题模型具体化成信息检索。举个例子,自60年代以来,基于集群的检索研究最近在语言模型框架方面有了较好的研究成果。一种潜在狄利克雷分配(LDA)基于正式的文件生成模型的建立问题模型的方法,在机器学习的文献中被大... 搜索算法可以将文档主题模型具体化成信息检索。举个例子,自60年代以来,基于集群的检索研究最近在语言模型框架方面有了较好的研究成果。一种潜在狄利克雷分配(LDA)基于正式的文件生成模型的建立问题模型的方法,在机器学习的文献中被大量引用,但在信息检索中的可行性和有效性仍是未知的。在本文中,我们研究如何有效地使用LDA提高特设检索。我们提出的语言模型框架,一个基于LDA的文档模型,并评估它在几个TREC集合。吉布斯抽样法进行近似推理和计算复杂度的分析。我们发现,改进使用基于集群的模型检索,可以得到合理的效率。 展开更多
关键词 信息检索 语言模型 在狄利克雷分配(LDA) 话题模型 文档模型
在线阅读 下载PDF
基于LDA主题模型的杭州市公园季节性公共服务价值
9
作者 侯力丹 卢群 林帅君 《中国城市林业》 2023年第3期109-116,132,共9页
季节对公园的公共服务价值具有显著影响,明确游客对于公园季节性公共服务价值的关注度及态度有助于提高公园的服务质量。文章以“大众点评”上游客对杭州市公园的评价文本为研究对象,基于LDA主题模型对公园季节性公共服务价值属性及游... 季节对公园的公共服务价值具有显著影响,明确游客对于公园季节性公共服务价值的关注度及态度有助于提高公园的服务质量。文章以“大众点评”上游客对杭州市公园的评价文本为研究对象,基于LDA主题模型对公园季节性公共服务价值属性及游客的关注度进行研究,并利用SnowNLP对评价文本中游客的情感变化进行分析。结果表明:春季和秋季游客主要关注以自然风光为主的游赏价值,夏季游客对公园的功能服务价值具有最高的关注度,冬季公园的休闲娱乐价值是游客最在意的方面,此外,游客对于不同季节的公园的公共服务价值普遍给予较为积极的评价,其中游赏价值、功能服务价值和休闲娱乐价值对游客的情感具有显著的影响。因此,公园的建设与发展应充分考虑公共服务价值随季节的变化,并根据游客诉求进行灵活调整。 展开更多
关键词 在狄利克雷分布主题模型 网络文本 简体中文文本处理 季节性公共服务价值 杭州市公园
在线阅读 下载PDF
基于改进LDA算法的电力用户咨询文本分类算法
10
作者 李竹青 侯本忠 +2 位作者 曹培祥 王一蓉 李向阳 《太赫兹科学与电子信息学报》 2024年第12期1400-1406,共7页
针对目前情感极性分析中电力咨询短文本的准确性较低的问题,提出一种基于改进潜在狄利克雷分配(LDA)算法的电力用户咨询文本分类算法。在分析电力咨询短文本与情感的关联关系基础上,定义了基于情感词共现袋、主题特殊词以及主题关系词... 针对目前情感极性分析中电力咨询短文本的准确性较低的问题,提出一种基于改进潜在狄利克雷分配(LDA)算法的电力用户咨询文本分类算法。在分析电力咨询短文本与情感的关联关系基础上,定义了基于情感词共现袋、主题特殊词以及主题关系词的概念;为提高语义分析的质量,设计了改进LDA算法的电力用户咨询文本分类算法执行流程。实验表明,所提模型表现出优异性能,平均精确度和平均召回率为90.91%和85.03%。所提模型可充分发挥多模型集成优势,有效提升模型性能。 展开更多
关键词 电力咨询 文本分类 主题分析 卷积神经网络 在狄利克雷分配
在线阅读 下载PDF
LDA单词图像表示的蒙古文古籍图像关键词检索方法 被引量:7
11
作者 白淑霞 鲍玉来 《现代情报》 CSSCI 北大核心 2017年第7期51-54,88,共5页
[目的 ]为了克服传统视觉词袋方法(Bag-of-Visual-Words)中忽略视觉单词间的空间关系和语义信息等问题。[方法 ]本文提出一种与视觉语言模型相结合的基于LDA主题模型,并采用查询似然模型实现检索。[结果 ]实验数据表明,本文所提出的基于... [目的 ]为了克服传统视觉词袋方法(Bag-of-Visual-Words)中忽略视觉单词间的空间关系和语义信息等问题。[方法 ]本文提出一种与视觉语言模型相结合的基于LDA主题模型,并采用查询似然模型实现检索。[结果 ]实验数据表明,本文所提出的基于LDA的表示方法可以高效、准确地解决蒙古文古籍的关键词检索问题。[结论 ]同时,该方法的性能比Bo VW方法有显著提高。 展开更多
关键词 隐含狄利克雷分配(LDA) 主题模型 视觉语言模型 蒙古文古籍 关键词检索 查询似然模型
在线阅读 下载PDF
基于LDA-GA算法的移动目录优化研究
12
作者 梁潘 《西安航空学院学报》 2017年第1期77-82,共6页
针对移动设备向用户推荐产品时受限于尺寸的问题,目前普遍采用个性化协作推荐算法来实现开发面向移动目录(MOC),但是传统的方法存在大数据环境下适应度不高、协作能力差等不足。为解决此问题,首先将主题建模算法与遗传算法相结合开发出L... 针对移动设备向用户推荐产品时受限于尺寸的问题,目前普遍采用个性化协作推荐算法来实现开发面向移动目录(MOC),但是传统的方法存在大数据环境下适应度不高、协作能力差等不足。为解决此问题,首先将主题建模算法与遗传算法相结合开发出LDA-GA算法,然后设计富有吸引力和协作性的产品推荐目录,最后将MOC应用在亚马逊APP和淘宝网APP进行实验比对分析并进行优化。实验结果表明:LDA-GA算法面对大量用户和产品数据时移动目录适应度更高、协作性更强,客户受众面大,推介效果更好。 展开更多
关键词 移动目录 在狄利克雷分配 主题建模 遗传算法
在线阅读 下载PDF
一种面向隐含主题的上下文树核
13
作者 徐超 周一民 沈磊 《电子与信息学报》 EI CSCD 北大核心 2010年第11期2695-2700,共6页
该文针对上下文树核用于文本表示时缺乏语义信息的问题,提出了一种面向隐含主题的上下文树核构造方法。首先采用隐含狄利克雷分配将文本中的词语映射到隐含主题空间,然后以隐含主题为单位建立上下文树模型,最后利用模型间的互信息构造... 该文针对上下文树核用于文本表示时缺乏语义信息的问题,提出了一种面向隐含主题的上下文树核构造方法。首先采用隐含狄利克雷分配将文本中的词语映射到隐含主题空间,然后以隐含主题为单位建立上下文树模型,最后利用模型间的互信息构造上下文树核。该方法以词的语义类别来定义文本的生成模型,解决了基于词的文本建模时所遇到的统计数据的稀疏性问题。在文本数据集上的聚类实验结果表明,文中提出的上下文树核能够更好地度量文本间主题的相似性,提高了文本聚类的性能。 展开更多
关键词 文本聚类 上下文树核 统计语言模型 隐含狄利克雷分配(LDA)
在线阅读 下载PDF
面向新浪微博的情感社区检测算法 被引量:2
14
作者 韩东红 张宏亮 +1 位作者 朱帅伟 齐孝龙 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第1期21-30,36,共11页
面向社交网络的情感社区检测,可应用于公共健康、舆情监测等领域.以新浪微博为平台建立一种情感社区检测框架,首先融合微博情感表情特征和情感词典,提出基于朴素贝叶斯算法的半词典半表情(naive Bayes based semi-lexicon and semi-emoj... 面向社交网络的情感社区检测,可应用于公共健康、舆情监测等领域.以新浪微博为平台建立一种情感社区检测框架,首先融合微博情感表情特征和情感词典,提出基于朴素贝叶斯算法的半词典半表情(naive Bayes based semi-lexicon and semi-emoji,SL-SE-NB)分类模型以实现对文本的情感极性预测;提出一种基于潜在狄利克雷分配(latent Dirichlet allocation,LDA)话题模型的用户-超话题-关键词(user-topic-keywords,UTK)模型抽取用户话题;基于标签传播算法(label propagation algorithm,LPA)并加入话题概念,提出基于种子集与最小边介数的标签传播情感社区发现算法(label propagation algorithm based seeds and min-edge betweenness,SMB-LPA).最后通过实验验证了所提出算法的有效性和高效性. 展开更多
关键词 社交网络 情感社区检测 情感分析 话题模型 在狄利克雷分配
在线阅读 下载PDF
基于内容与效率二维视角的创新主体识别研究 被引量:1
15
作者 周磊 方芳 《创新科技》 2021年第10期18-27,共10页
精准匹配产业创新供需端有助于优化创新要素配置,提升产业创新效率。基于内容匹配、效率筛选二维视角建立产业创新主体识别机制:首先,利用隐狄利克雷分配模型(LDA)挖掘需求主题;其次,利用文献计量法分析潜在创新供给主体的专长,并与需... 精准匹配产业创新供需端有助于优化创新要素配置,提升产业创新效率。基于内容匹配、效率筛选二维视角建立产业创新主体识别机制:首先,利用隐狄利克雷分配模型(LDA)挖掘需求主题;其次,利用文献计量法分析潜在创新供给主体的专长,并与需求内容进行匹配;最后,基于数据包络分析(DEA)筛选出创新资源配置有效的最终供给者。以国防科工产业预研环节为例进行实证研究,发现材料学、信息通信与智能分析、飞行器与船舶、电子元件、软科学五大类创新需求。作为潜在创新主体的61家上市企业中,有33家满足前四类创新内容要求;但仅有6家企业同时满足创新效率要求。通过分析这6家创新主体的创新供给机制,总结出聚焦化、多元化两类创新供给模式;并发现企业间可以通过社会网络建立创新供给的合作渠道。 展开更多
关键词 需求挖掘 创新主体识别 狄利克雷分配模型 数据包络分析 国防科技工业
在线阅读 下载PDF
基于分布式LDA-Spark的微博用户兴趣挖掘
16
作者 赵星雷 肖诗斌 《北京信息科技大学学报(自然科学版)》 2017年第3期70-74,共5页
为了挖掘海量微博数据中潜在的语意信息,通过Gibbs采样方式,并结合Spark分布式计算框架,实现了一种LDA主题模型并行化的算法。该算法针对微博数据的特点,将3层贝叶斯概率模型改为用户-主题-词模型;为了满足LDA的并行化处理需求,采用了... 为了挖掘海量微博数据中潜在的语意信息,通过Gibbs采样方式,并结合Spark分布式计算框架,实现了一种LDA主题模型并行化的算法。该算法针对微博数据的特点,将3层贝叶斯概率模型改为用户-主题-词模型;为了满足LDA的并行化处理需求,采用了一种无冲突的数据分割方法将数据集分成了P×P个数据块,将分割好的数据块重新排序整合成P个子集,保证每个子集中均包含P个数据块,对每个子集进行并行采样。从困惑度、收敛速度及加速比3个方面对改进算法与标准LDA算法进行了对比实验,困惑度2种算法的结果接近;在收敛速度方面,改进算法较标准LDA慢,但在实际应用中对效率没有太大影响;加速比实验中,总词数为100万、work节点为8时,改进算法所用时间是标准LDA的16.78%。实验结果表明,改进算法能得到较为精确的模型,并在大数据环境下可以取得良好的加速效果。 展开更多
关键词 SPARK 分布式框架 在狄利克雷分布 微博 主题模型
在线阅读 下载PDF
基于LDA和SVM的图像场景分类 被引量:1
17
作者 曾康林 刘汉文 《中国新通信》 2018年第10期125-127,共3页
针对传统的SVM做图像场景识别的词袋模型识别率低的缺点,本文引入了自然语言领域的潜在狄利克雷分配(latent Dirichilet allocation,LDA)来进行图像场景分类。相比于在普通的词袋模型,再得到了视觉词典,后直接利用SVM支持向量机进行分类... 针对传统的SVM做图像场景识别的词袋模型识别率低的缺点,本文引入了自然语言领域的潜在狄利克雷分配(latent Dirichilet allocation,LDA)来进行图像场景分类。相比于在普通的词袋模型,再得到了视觉词典,后直接利用SVM支持向量机进行分类。LDA模型则是利用LDA得到图片的主题表示再进行SVM的分类。仿真实验结果表明,相比于普通的词袋模型,利用LDA得到的主题表示可有效提高场景分类的正确率。 展开更多
关键词 在狄利克雷分配(LDA) 支持向量机(SVM) 图像场景分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部