期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
基于LDA主题模型的智慧健康养老服务与管理人才岗位需求分析 被引量:1
1
作者 达朝锦 吴臣 +4 位作者 蔡婷婷 吉珍颖 陈佳琳 苗晓琦 袁长蓉 《护士进修杂志》 2024年第6期664-669,共6页
目的应用潜在狄利克雷分配(LDA)主题模型挖掘养老服务与管理人才的岗位需求,为相关人才培养提供依据。方法采用Python程序软件抓取前程无忧、智联招聘、猎聘网、养老网、丁香人才网等网站上与养老服务与管理人才相关的招聘信息,并进行... 目的应用潜在狄利克雷分配(LDA)主题模型挖掘养老服务与管理人才的岗位需求,为相关人才培养提供依据。方法采用Python程序软件抓取前程无忧、智联招聘、猎聘网、养老网、丁香人才网等网站上与养老服务与管理人才相关的招聘信息,并进行数据清洗,借助LDA主题模型对数据进行主题识别,分析岗位需求。结果共采集招聘信息3684条。数据清洗后获得2120条有效数据,包含健康照护类1161条,经营与管理类959条。招聘信息主要分布在华东、华北和华南地区。2类岗位各自析出8个岗位需求主题,按照主题强度,健康照护岗位析出的需求主题依次为:性格品质、生活及心理照料能力、疾病照料能力、职业礼仪和态度、急救与安全照料能力、职业通用能力、活动组织及服务管理能力、信息技术和老年政策法规知识;经营与管理岗位析出的需求主题依次为:机构运营管理能力、性格品质、市场开发与定位能力、客户维护与产品销售能力、职业礼仪和态度、职业通用能力、活动组织和策划能力、信息技术和老年政策法规知识。结论健康照护和经营与管理岗位知识和技能需求存在差异,但两者均重视养老服务与管理人才的人文素养和信息化应用能力,上述需求特征可为相关人才培养提供一定参考。 展开更多
关键词 lda主题模型 养老服务与管理 网络招聘 岗位需求
在线阅读 下载PDF
一种改进的LDA主题模型 被引量:47
2
作者 张小平 周雪忠 +3 位作者 黄厚宽 冯奇 陈世波 焦宏官 《北京交通大学学报》 CAS CSCD 北大核心 2010年第2期111-114,共4页
由于文档中的词符合幂律分布,使得LDA模型的主题分布向高频词倾斜,导致能够代表主题的多数词被少量的高频词淹没使得主题表达能力降低.通过一种高斯函数对特征词加权,改进LDA主题模型的主题分布.实验显示加权LDA模型获得的主题间的相关... 由于文档中的词符合幂律分布,使得LDA模型的主题分布向高频词倾斜,导致能够代表主题的多数词被少量的高频词淹没使得主题表达能力降低.通过一种高斯函数对特征词加权,改进LDA主题模型的主题分布.实验显示加权LDA模型获得的主题间的相关性以及复杂度(Perplexity)值都降低,说明改进模型在主题表达和预测性能方面都有所提高. 展开更多
关键词 lda dirichlet分布 加权主题模型
在线阅读 下载PDF
融合TF-IDF和LDA的中文FastText短文本分类方法 被引量:32
3
作者 冯勇 屈渤浩 +2 位作者 徐红艳 王嵘冰 张永刚 《应用科学学报》 CAS CSCD 北大核心 2019年第3期378-388,共11页
FastText文本分类模型具有快速高效的优势,但直接将其用于中文短文本分类则存在精确率不高的问题.为此提出一种融合词频-逆文本频率(term frequency-inverse document frequency, TF-IDF)和隐含狄利克雷分布(latent Dirichlet allocatio... FastText文本分类模型具有快速高效的优势,但直接将其用于中文短文本分类则存在精确率不高的问题.为此提出一种融合词频-逆文本频率(term frequency-inverse document frequency, TF-IDF)和隐含狄利克雷分布(latent Dirichlet allocation, LDA)的中文FastText短文本分类方法.该方法在FastText文本分类模型的输入阶段对n元语法模型处理后的词典进行TF-IDF筛选,使用LDA模型进行语料库主题分析,依据所得结果对特征词典进行补充,从而在计算输入词序列向量均值时偏向高区分度的词条,使其更适用于中文短文本分类环境.对比实验结果可知,所提方法在中文短文本分类方面具有更高的精确率. 展开更多
关键词 中文短文本分类 FastText 词频-逆文本频率 词向量 隐含狄利克雷分布
在线阅读 下载PDF
有监督主题模型的SLDA-TC文本分类新方法 被引量:11
4
作者 唐焕玲 窦全胜 +2 位作者 于立萍 宋英杰 鲁明羽 《电子学报》 EI CAS CSCD 北大核心 2019年第6期1300-1308,共9页
本文提出了一种有监督主题模型的SLDA-TC(Super vised LDA-Text Categorization)文本分类方法,引入主题-类别概率分布参数,识别主题-类别的语义信息;提出SLDA-TC-Gibbs主题采样新方法,对每个词的隐含主题采样,只从该词所在文档的同类其... 本文提出了一种有监督主题模型的SLDA-TC(Super vised LDA-Text Categorization)文本分类方法,引入主题-类别概率分布参数,识别主题-类别的语义信息;提出SLDA-TC-Gibbs主题采样新方法,对每个词的隐含主题采样,只从该词所在文档的同类其它文档中采样,并给出了理论推导;另外,其主题数只需略大于类别数.实验表明,对比LDA-TC(LDA-Text Categorization)和SVM算法,本方法能提高分类精度和时间性能. 展开更多
关键词 文本分类 主题模型 隐含dirichlet分布 吉布斯采样
在线阅读 下载PDF
基于SIFT,K-Means和LDA的图像检索算法 被引量:12
5
作者 汪宇雷 毕树生 +1 位作者 孙明磊 蔡月日 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2014年第9期1317-1322,共6页
图像检索一直是信息检索领域的难题.提出了一种基于尺度不变特征变换(SIFT,Scale Invariant Feature Transform),K-Means和潜在狄利克雷分布(LDA,Latent Dirichlet Allocation)的图像检索算法.算法主要分为两个阶段.预备工作得到分类完... 图像检索一直是信息检索领域的难题.提出了一种基于尺度不变特征变换(SIFT,Scale Invariant Feature Transform),K-Means和潜在狄利克雷分布(LDA,Latent Dirichlet Allocation)的图像检索算法.算法主要分为两个阶段.预备工作得到分类完成的图库、概率分配参数表和基本词库;实现检索是在预备工作的基础上归类测试图片,然后在该类下搜索最相似图片.对比传统的基于文本或内容的检索方法,该算法在检索之前将图片库中所有图片按其本身特征进行自动分类,取代人工标注图像信息的过程,同时由于整个算法完全基于图像特征,故此方法不会引入人工因素的干扰.实验结果表明,该算法能够较为准确地将要检索的图片归为图片库对应的类别中,有效地提高图像检索效率. 展开更多
关键词 尺度不变特征变换(SIFT) K-MEANS 潜在狄利克雷分布(lda) 基于内容的图像检索 图像匹配
在线阅读 下载PDF
基于LDA话题关联的话题演化 被引量:20
6
作者 楚克明 李芳 《上海交通大学学报》 EI CAS CSCD 北大核心 2010年第11期1496-1500,共5页
话题演化可以帮助人们快速获取信息和了解趋势.提出了一种挖掘话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化.对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意2个话题的分布距... 话题演化可以帮助人们快速获取信息和了解趋势.提出了一种挖掘话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化.对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意2个话题的分布距离和话题的特征向量相似度实现话题的关联.实验结果证明,该方法不但可以描述同一个话题随时间的强度变化,还可以描述新话题的产生,旧话题的消失以及话题内容随时间的演化. 展开更多
关键词 话题探测 话题关联 话题演化 潜在狄里特里分配
在线阅读 下载PDF
基于LDA模型的在线网络信息内容安全事件分类 被引量:4
7
作者 葛琳 季新生 +1 位作者 卫红权 江涛 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2014年第3期70-79,共10页
针对在线网络信息内容安全事件的分类问题,利用网络用户通信信息中含有的时间、关系和内容特征均可基于文本描述的特点,引入LDA模型,提出了一种实时多维信息联合(RMIA-LDA)的在线信息内容安全事件分类模型及算法。以网络通信中的时间特... 针对在线网络信息内容安全事件的分类问题,利用网络用户通信信息中含有的时间、关系和内容特征均可基于文本描述的特点,引入LDA模型,提出了一种实时多维信息联合(RMIA-LDA)的在线信息内容安全事件分类模型及算法。以网络通信中的时间特征为轴,对由此划分出的各个时间片段中的通信关系、通信内容特征采用LDA模型进行建模分类,对分类结果的相似性进行度量后,再与增量更新数据部分的分类结果归纳合并,从而得到当前实时在线数据中的事件分类。仿真实验结果表明,该模型和算法可以有效实现网络中信息内容安全事件的在线分类,较现有算法具有优越的性能。 展开更多
关键词 事件分类 信息内容安全事件 隐含狄利克雷分布 相似性度量 GIBBS抽样
在线阅读 下载PDF
LDA单词图像表示的蒙古文古籍图像关键词检索方法 被引量:7
8
作者 白淑霞 鲍玉来 《现代情报》 CSSCI 北大核心 2017年第7期51-54,88,共5页
[目的 ]为了克服传统视觉词袋方法(Bag-of-Visual-Words)中忽略视觉单词间的空间关系和语义信息等问题。[方法 ]本文提出一种与视觉语言模型相结合的基于LDA主题模型,并采用查询似然模型实现检索。[结果 ]实验数据表明,本文所提出的基于... [目的 ]为了克服传统视觉词袋方法(Bag-of-Visual-Words)中忽略视觉单词间的空间关系和语义信息等问题。[方法 ]本文提出一种与视觉语言模型相结合的基于LDA主题模型,并采用查询似然模型实现检索。[结果 ]实验数据表明,本文所提出的基于LDA的表示方法可以高效、准确地解决蒙古文古籍的关键词检索问题。[结论 ]同时,该方法的性能比Bo VW方法有显著提高。 展开更多
关键词 隐含狄利克雷分配(lda) 主题模型 视觉语言模型 蒙古文古籍 关键词检索 查询似然模型
在线阅读 下载PDF
基于LDA主题模型的网络问答社区妊娠合并糖尿病孕产妇健康信息需求分析 被引量:12
9
作者 马誉萁 侯小妮 +4 位作者 段红梅 徐杨 陈延亭 李博文 金宁宁 《护理学杂志》 CSCD 北大核心 2023年第7期86-89,124,共5页
目的 应用LDA主题模型挖掘妊娠合并糖尿病孕产妇信息需求,为医护人员开展有效信息服务提供参考。方法 采用网络爬虫程序获取网络问答社区妊娠合并糖尿病板块的用户问答数据,采用LDA主题模型对数据进行主题识别,分析信息需求。结果 通过... 目的 应用LDA主题模型挖掘妊娠合并糖尿病孕产妇信息需求,为医护人员开展有效信息服务提供参考。方法 采用网络爬虫程序获取网络问答社区妊娠合并糖尿病板块的用户问答数据,采用LDA主题模型对数据进行主题识别,分析信息需求。结果 通过对126 616条数据的LDA主题分析,妊娠合并糖尿病孕产妇的信息需求包括8类:母儿危害与检查,母儿自我监护,营养体质量控制与胎儿生长发育,筛查与产检,病友经验分享与情感支持,细分食物类别的选择与升糖效应,分娩及产后母婴健康管理,血糖调控与餐食、胰岛素用药。结论 妊娠合并糖尿病孕产妇的信息需求多元、专业、精细化,包括认知、生理、情感等多个维度,医护人员应发挥医患共同信息服务主体作用,针对妊娠合并糖尿病孕产妇提供专业、精细、全面的信息服务。 展开更多
关键词 妊娠合并糖尿病 健康信息需求 网络问答社区 lda主题模型 孕期保健 围生期护理
在线阅读 下载PDF
基于LDA-GA算法的移动目录优化研究
10
作者 梁潘 《西安航空学院学报》 2017年第1期77-82,共6页
针对移动设备向用户推荐产品时受限于尺寸的问题,目前普遍采用个性化协作推荐算法来实现开发面向移动目录(MOC),但是传统的方法存在大数据环境下适应度不高、协作能力差等不足。为解决此问题,首先将主题建模算法与遗传算法相结合开发出L... 针对移动设备向用户推荐产品时受限于尺寸的问题,目前普遍采用个性化协作推荐算法来实现开发面向移动目录(MOC),但是传统的方法存在大数据环境下适应度不高、协作能力差等不足。为解决此问题,首先将主题建模算法与遗传算法相结合开发出LDA-GA算法,然后设计富有吸引力和协作性的产品推荐目录,最后将MOC应用在亚马逊APP和淘宝网APP进行实验比对分析并进行优化。实验结果表明:LDA-GA算法面对大量用户和产品数据时移动目录适应度更高、协作性更强,客户受众面大,推介效果更好。 展开更多
关键词 移动目录 潜在狄利克雷分配 主题建模 遗传算法
在线阅读 下载PDF
基于LDA的地铁施工安全隐患排查要点挖掘与可视化研究 被引量:4
11
作者 潘杏 钟波涛 +1 位作者 黑永健 骆汉宾 《土木建筑工程信息技术》 2021年第2期7-14,共8页
随着地铁的快速建设和隐患排查系统的建立,系统中积累了大量隐患排查记录,但是隐患排查记录信息冗杂,相关工作严重依赖导则与专家经验,需要投入大量人力成本。为提高隐患排查工作效率和安全管理决策,同时促进排查工作实现全程自动化,本... 随着地铁的快速建设和隐患排查系统的建立,系统中积累了大量隐患排查记录,但是隐患排查记录信息冗杂,相关工作严重依赖导则与专家经验,需要投入大量人力成本。为提高隐患排查工作效率和安全管理决策,同时促进排查工作实现全程自动化,本文提出了一种基于文本挖掘与可视化技术的自动化分析隐患排查文本框架,该框架主要包括以下四个步骤:第一,基于Term Frequency-Inverse Document Frequency(TF-IDF)算法,对隐患描述下的关键词有一个整体的概括;第二,基于TF-IDF筛出特征值较高的关键词,借助吉布斯抽样的Latent Dirichlet Allocation(LDA)模型识别出大规模隐患描述语料库中潜藏的主题信息和隐患排查要点;第三,结合时间维度,通过Word Cloud(WC)技术对隐患描述进行可视化分析,绘制隐患词云演化图;第四,借助Word Co-occurrence Network(WCN)模型,挖掘隐患共现关系。该框架在分析武汉地铁2016-2018年施工安全隐患排查记录中得到了应用和验证。实验结果表明,该框架有效挖掘出34类隐患所对应的隐患排查要点和可视化信息。 展开更多
关键词 安全管理 地铁施工安全 隐患排查要点 文本挖掘 latent dirichlet allocation模型 数据可视化
在线阅读 下载PDF
Self-Adaptive Topic Model: A Solution to the Problem of "Rich Topics Get Richer" 被引量:1
12
作者 FANG Ying 《China Communications》 SCIE CSCD 2014年第12期35-43,共9页
The problem of "rich topics get richer"(RTGR) is popular to the topic models,which will bring the wrong topic distribution if the distributing process has not been intervened.In standard LDA(Latent Dirichlet... The problem of "rich topics get richer"(RTGR) is popular to the topic models,which will bring the wrong topic distribution if the distributing process has not been intervened.In standard LDA(Latent Dirichlet Allocation) model,each word in all the documents has the same statistical ability.In fact,the words have different impact towards different topics.Under the guidance of this thought,we extend ILDA(Infinite LDA) by considering the bias role of words to divide the topics.We propose a self-adaptive topic model to overcome the RTGR problem specifically.The model proposed in this paper is adapted to three questions:(1) the topic number is changeable with the collection of the documents,which is suitable for the dynamic data;(2) the words have discriminating attributes to topic distribution;(3) a selfadaptive method is used to realize the automatic re-sampling.To verify our model,we design a topic evolution analysis system which can realize the following functions:the topic classification in each cycle,the topic correlation in the adjacent cycles and the strength calculation of the sub topics in the order.The experiment both on NIPS corpus and our self-built news collections showed that the system could meet the given demand,the result was feasible. 展开更多
关键词 topic model infinite latent dirichlet allocation dirichlet process topic evolution
在线阅读 下载PDF
基于LDA主题模型的杭州市公园季节性公共服务价值
13
作者 侯力丹 卢群 林帅君 《中国城市林业》 2023年第3期109-116,132,共9页
季节对公园的公共服务价值具有显著影响,明确游客对于公园季节性公共服务价值的关注度及态度有助于提高公园的服务质量。文章以“大众点评”上游客对杭州市公园的评价文本为研究对象,基于LDA主题模型对公园季节性公共服务价值属性及游... 季节对公园的公共服务价值具有显著影响,明确游客对于公园季节性公共服务价值的关注度及态度有助于提高公园的服务质量。文章以“大众点评”上游客对杭州市公园的评价文本为研究对象,基于LDA主题模型对公园季节性公共服务价值属性及游客的关注度进行研究,并利用SnowNLP对评价文本中游客的情感变化进行分析。结果表明:春季和秋季游客主要关注以自然风光为主的游赏价值,夏季游客对公园的功能服务价值具有最高的关注度,冬季公园的休闲娱乐价值是游客最在意的方面,此外,游客对于不同季节的公园的公共服务价值普遍给予较为积极的评价,其中游赏价值、功能服务价值和休闲娱乐价值对游客的情感具有显著的影响。因此,公园的建设与发展应充分考虑公共服务价值随季节的变化,并根据游客诉求进行灵活调整。 展开更多
关键词 潜在狄利克雷分布主题模型 网络文本 简体中文文本处理 季节性公共服务价值 杭州市公园
在线阅读 下载PDF
国内医疗健康领域人工智能研究热点及趋势分析
14
作者 刘洋 孙旭 王涟 《中国医药导报》 CAS 2024年第25期191-196,共6页
目的 探讨国内医疗健康领域下人工智能研究热点及发展趋势。方法 选取中国知网、万方数据知识服务平台、维普网作为检索数据库,以2014年1月至2023年12月人工智能在医疗健康领域期刊论文的摘要作为研究数据,应用隐含狄利克雷分布主题模... 目的 探讨国内医疗健康领域下人工智能研究热点及发展趋势。方法 选取中国知网、万方数据知识服务平台、维普网作为检索数据库,以2014年1月至2023年12月人工智能在医疗健康领域期刊论文的摘要作为研究数据,应用隐含狄利克雷分布主题模型并进行主题挖掘与演化分析,对热点研究主题进行研判。结果 共纳入3 275篇文献,医疗健康领域下人工智能相关研究发文量于2018年开始明显增长。提取到8个研究主题,其中4个被归为热点主题,分别为医疗影像处理、智能医疗服务平台、医学图像算法、临床决策辅助系统。结论 本研究为我国该领域融合创新发展提供相关思路和方法参考。未来应持续关注该领域实际需求背后的技术问题,并加强对基础关键技术的研究和创新。 展开更多
关键词 人工智能 医疗健康 隐含狄利克雷分布模型 主题演化 发展趋势
在线阅读 下载PDF
基于TSCM模型的网络短文本情感挖掘 被引量:12
15
作者 黄发良 李超雄 +2 位作者 元昌安 汪焱 姚志强 《电子学报》 EI CAS CSCD 北大核心 2016年第8期1887-1891,共5页
针对网络短文本情感挖掘问题,提出一种新的基于LDA和互联网短评行为理论的主题情感混合模型TSCM,TSCM模型中的整篇评论中每个句子的主题分布是不同的,TSCM产生词的流程是先确定词的情感极性,再确定词的主题,TSCM考虑了词与词之间的联系... 针对网络短文本情感挖掘问题,提出一种新的基于LDA和互联网短评行为理论的主题情感混合模型TSCM,TSCM模型中的整篇评论中每个句子的主题分布是不同的,TSCM产生词的流程是先确定词的情感极性,再确定词的主题,TSCM考虑了词与词之间的联系.真实数据集Movie与Amazon上的大量实验表明,与代表性算法JST、SLDA、D-PLDA和SAS相比较,TSCM模型能对用户真实情感与讨论主题进行更加有效的分析建模. 展开更多
关键词 情感分析 主题情感混合模型 lda
在线阅读 下载PDF
支持联机分析处理的推特用户兴趣维层次提取方法 被引量:3
16
作者 俞东进 倪智勇 孙景超 《电子与信息学报》 EI CSCD 北大核心 2017年第9期2081-2088,共8页
从海量推特数据中探索用户兴趣的分布规律和相关性有利于实现精确的个性化推荐。联机分析处理(OnLine Analytical Processing,OLAP)提供了一种适合人们探究数据的直观形式。将OLAP技术应用于推特数据的关键是如何挖掘和构建推特用户的... 从海量推特数据中探索用户兴趣的分布规律和相关性有利于实现精确的个性化推荐。联机分析处理(OnLine Analytical Processing,OLAP)提供了一种适合人们探究数据的直观形式。将OLAP技术应用于推特数据的关键是如何挖掘和构建推特用户的兴趣维层次。针对现有方法只能提取单一层次兴趣的不足,该文提出一种支持联机分析处理的推特用户兴趣维层次提取方法。该方法首先通过Rest API获取推特数据,然后通过改进的LDA(Latent Dirichlet Allocation)模型挖掘用户的兴趣和子兴趣,最后在此基础上构建兴趣维层次结构。实验评估了该方法的模型效果和可扩展性,并证实与LDA和h LDA相比可以更有效地提取出推特用户的兴趣维层次并应用于联机分析处理。 展开更多
关键词 联机分析处理 推特 维层次 兴趣 lda(latent dirichlet allocation)模型
在线阅读 下载PDF
基于特征项分布的信息熵及特征动态加权概念漂移检测模型 被引量:6
17
作者 孙雪 李昆仑 +1 位作者 韩蕾 白晓亮 《电子学报》 EI CAS CSCD 北大核心 2015年第7期1356-1361,共6页
现有的概念漂移算法大多建立在数据流的分类模型上,忽略了特征空间与样本空间的分布特点,以及特征选择和加权的重要性.针对此问题提出了一种基于特征项分布的信息熵及特征动态加权算法,从概念漂移的动态演化性出发,根据样本和特征空间... 现有的概念漂移算法大多建立在数据流的分类模型上,忽略了特征空间与样本空间的分布特点,以及特征选择和加权的重要性.针对此问题提出了一种基于特征项分布的信息熵及特征动态加权算法,从概念漂移的动态演化性出发,根据样本和特征空间的拟合程度,运用特征信息熵理论对数据流中的概念漂移现象进行捕捉,以实现新旧概念的过渡.利用改进的隐含Dirichlet模型特征动态加权算法,以解决当前特征与历史特征的权重确定和无效特征的裁剪问题.在公开的语料库CCERT和Trec06上的测试实验证明了所提出算法的有效性. 展开更多
关键词 概念漂移 lda模型 特征项分布 信息熵
在线阅读 下载PDF
基于改进主题分布特征的神经网络语言模型 被引量:10
18
作者 刘畅 张一珂 +1 位作者 张鹏远 颜永红 《电子与信息学报》 EI CSCD 北大核心 2018年第1期219-225,共7页
在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档中各主题的概率分布通常差别很大,该文提出一种使用文档主题概率改进当前词主题特征的方法,并将改进后... 在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档中各主题的概率分布通常差别很大,该文提出一种使用文档主题概率改进当前词主题特征的方法,并将改进后的特征应用于基于长短时记忆(LSTM)单元的递归神经网络语言模型中。实验表明,在PTB数据集上该文提出的方法使语言模型的困惑度相对于基线系统下降11.8%。在SWBD数据集多候选重估实验中,该文提出的特征使LSTM模型相对于基线模型词错误率(WER)相对下降6.0%;在WSJ数据集上的实验中,该特征使LSTM模型相对于基线模型词错误率(WER)相对下降6.8%,并且在eval92测试集上,改进隐含狄利克雷分布(LDA)特征使RNN效果与LSTM相当。 展开更多
关键词 语音识别 语言模型 隐含狄利克雷分布 长短时记忆
在线阅读 下载PDF
货车驾驶人驾驶行为与行车安全研究进展 被引量:10
19
作者 覃文文 李欢 +2 位作者 李武 谷金晶 戢晓峰 《交通运输系统工程与信息》 EI CSCD 北大核心 2022年第5期55-74,共20页
驾驶行为是影响交通安全最活跃的因素,在“人-车-路”复杂环境中扮演着关键角色。为了深入理解货车驾驶人驾驶行为规律和行为风险性,本文聚焦货车驾驶人驾驶行为对行车安全的影响,对货车驾驶人的驾驶行为风格、行为风险性及其与行车安... 驾驶行为是影响交通安全最活跃的因素,在“人-车-路”复杂环境中扮演着关键角色。为了深入理解货车驾驶人驾驶行为规律和行为风险性,本文聚焦货车驾驶人驾驶行为对行车安全的影响,对货车驾驶人的驾驶行为风格、行为风险性及其与行车安全的关系等相关研究成果进行系统地梳理和分析。首先,利用构建的文献检索策略,筛选出38篇相关文献,并结合LDA(Latent Dirichlet Allocation)模型,对生成的4个研究主题,即货车驾驶人驾驶行为辨识,危险驾驶行为与行车安全,货车碰撞事故致因分析及驾驶安全风险评估进行总结;其次,针对数据源、特征工程及建模方法等分析要素,构建了适用于任意研究主题的通用研究路径,并重点归纳了目前研究主题在数据源、变量选择方法、研究地点及建模方法等关键要素的研究进展;最后,分析和探讨了货车驾驶人驾驶行为与行车安全领域面临的主要问题,从描述、解释、关联及应用的角度提炼该领域研究的未来发展趋势。研究认为:有必要将驾驶状态特性、车辆运行状态及道路交通状况等多维特征变量进行多源信息融合,开展基于大数据和人工智能双驱动的驾驶行为研究;需加强研究山区公路环境下货车与其他类型车辆之间的交互作用机制,从“人-车-路”视角分析货车碰撞事故致因;需进一步完善智能网联和自动驾驶等高新智能自动化环境下的货车驾驶人驾驶行为与行车安全关系研究;拓展面向驾驶安全的货车驾驶人驾驶风险评估的理论方法和应用框架。研究成果将为货车事故治理、公路货运平台监控及道路线形设计等应用场景提供重要依据,并有助于相对全面地理解货车驾驶人驾驶行为与道路行车安全的交互作用机理。 展开更多
关键词 交通工程 驾驶行为 lda模型 货车驾驶人 行车安全 风险评估
在线阅读 下载PDF
多特征融合文本聚类的新闻话题发现模型 被引量:10
20
作者 车蕾 杨小平 《国防科技大学学报》 EI CAS CSCD 北大核心 2017年第3期85-90,共6页
融合新闻命名实体、新闻标题、新闻重要段落、文本语义等多特征影响,提出基于多特征融合文本聚类的新闻话题发现模型。模型根据新闻的多特征影响,提出一种多特征融合文本聚类方法。该方法针对新闻标题、新闻重要段落等特征因素构建向量... 融合新闻命名实体、新闻标题、新闻重要段落、文本语义等多特征影响,提出基于多特征融合文本聚类的新闻话题发现模型。模型根据新闻的多特征影响,提出一种多特征融合文本聚类方法。该方法针对新闻标题、新闻重要段落等特征因素构建向量空间模型及相似度算法,基于潜在狄利克雷分配模型构建主题空间模型及相似度算法,针对命名实体构建命名实体模型及相似度算法,并将三种相似度算法形成最优融合。基于多特征融合文本聚类方法,模型改进了用于新闻话题发现的Single-Pass算法。实验是在真实新闻数据集上开展的,实验结果表明:该模型有效地提高了新闻话题发现的准确率、召回率和综合评价指标,并具有一定的自适应能力。 展开更多
关键词 新闻话题 多特征融合 潜在狄利克雷分配 向量空间模型 主题空间模型
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部