检索结果-维普期刊中文期刊服务平台

基于词频均值波动和概率语言模型的短文本热点主题探测研究被引量：6: 1; 作者徐敏李广建《情报杂志》 CSSCI 北大核心 2019年第6期152-158,共7页; [目的/意义]针对短文本词语特征向量稀疏的问题,提出利用突然爆发现象和词语共现概率现象进行热点主题探测研究的新视角。[方法/过程]以此为目标建立了一个分析框架,以词频均值波动模型发现短文本中的热点词,以概率语言模型发现主题词,... 展开更多; 关键词短文本热点主题探测词频均值波动模型概率语言模型; 在线阅读下载PDF 职称材料

基于跨语言语料的汉泰词分布表示被引量：2: 2; 作者张金鹏周兰江 +2 位作者线岩团余正涛何思兰《计算机工程与科学》 CSCD 北大核心 2015年第12期2358-2365,共8页; 词汇的表示问题是自然语言处理的基础研究内容。目前单语词汇分布表示已经在一些自然语言处理问题上取得很好的应用效果,然而在跨语言词汇的分布表示上国内外研究很少,针对这个问题,利用两种语言名词、动词分布的相似性,通过弱监督学习... 展开更多; 关键词弱监督学习扩展跨语言语料跨语言词汇分布表示神经概率语言模型; 在线阅读下载PDF 职称材料

专家搜索中关系证据的重要性研究被引量：1: 3; 作者杨柳张文生《计算机应用研究》 CSCD 北大核心 2010年第11期4040-4043,4047,共5页; 系统地研究了查询词与候选人在文档中的距离和顺序关系对专家搜索算法准确率的影响。首先在概率语言模型的框架下提出了顺序核函数来建模顺序关系证据;然后进一步提出两种对不同关系证据进行统一建模的概率框架,并通过在TREC标准数据集... 展开更多; 关键词概率语言模型专家搜索关系证据核函数统一建模; 在线阅读下载PDF 职称材料

基于查询词邻近度的专家搜索算法被引量：1: 4; 作者杨柳张文生《计算机工程》 CAS CSCD 北大核心 2011年第6期7-8,11,共3页; 提出一种基于查询词邻近度的专家搜索算法。根据查询词在窗口中的共现关系构建概率语言模型的查询词邻近度,利用经典概率模型作为背景平滑,通过对多个查询词在文档中的距离关系建模,结合候选人与查询词之间的距离对候选专家排序。实验... 展开更多; 关键词专家搜索查询词邻近度概率语言模型; 在线阅读下载PDF 职称材料

题名基于词频均值波动和概率语言模型的短文本热点主题探测研究被引量：6: 1; 作者徐敏李广建; 机构北京大学信息管理系; 出处《情报杂志》 CSSCI 北大核心 2019年第6期152-158,共7页; 基金国家社会科学基金重点项目“大数据环境下的计算型情报分析方法与技术研究”(编号:14ATQ005)研究成果之一国家社会科学基金重大项目“大数据时代知识融合的体系架构、实现模式及实证研究”(编号:15ZDB129)的阶段性成果之一; 文摘 [目的/意义]针对短文本词语特征向量稀疏的问题,提出利用突然爆发现象和词语共现概率现象进行热点主题探测研究的新视角。[方法/过程]以此为目标建立了一个分析框架,以词频均值波动模型发现短文本中的热点词,以概率语言模型发现主题词,再对二者结果集合进行相似度计算实现热点主题的探测与展示。[结果/结论]通过对较高热度噪声词的过滤以及热点事件词的发现实现热点主题的探测。通过对比谷歌趋势的结果,准确率达到82.67%,证明模型有效。本研究对短文本热点主题探测的理论和实践研究具有一定参考价值。; 关键词短文本热点主题探测词频均值波动模型概率语言模型; Keywords short texts hot topics detection word frequency mean fluctuation model probabilistic language model; 分类号 G356.8 [文化科学—情报学]; 在线阅读下载PDF 职称材料

题名基于跨语言语料的汉泰词分布表示被引量：2: 2; 作者张金鹏周兰江线岩团余正涛何思兰; 机构昆明理工大学信息工程与自动化学院昆明理工大学智能信息处理重点实验室昆明理工大学理学院; 出处《计算机工程与科学》 CSCD 北大核心 2015年第12期2358-2365,共8页; 基金国家自然科学基金资助项目(61363044); 文摘词汇的表示问题是自然语言处理的基础研究内容。目前单语词汇分布表示已经在一些自然语言处理问题上取得很好的应用效果,然而在跨语言词汇的分布表示上国内外研究很少,针对这个问题,利用两种语言名词、动词分布的相似性,通过弱监督学习扩展等方式在中文语料中嵌入泰语的互译词、同类词、上义词等,学习出泰语词在汉泰跨语言环境下的分布。实验基于学习到的跨语言词汇分布表示应用于双语文本相似度计算和汉泰混合语料集文本分类,均取得较好效果。; 关键词弱监督学习扩展跨语言语料跨语言词汇分布表示神经概率语言模型; Keywords weakly supervised learning extension cross-lingual corpus cross-lingual word distribution representations neural probabilistic language model; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名专家搜索中关系证据的重要性研究被引量：1: 3; 作者杨柳张文生; 机构中国科学院自动化研究所复杂系统与智能科学重点实验室; 出处《计算机应用研究》 CSCD 北大核心 2010年第11期4040-4043,4047,共5页; 基金国家自然科学基金资助项目(90924026) 国家"863"高技术研究发展计划项目(2008AA01Z121 2007AA01Z338); 文摘系统地研究了查询词与候选人在文档中的距离和顺序关系对专家搜索算法准确率的影响。首先在概率语言模型的框架下提出了顺序核函数来建模顺序关系证据;然后进一步提出两种对不同关系证据进行统一建模的概率框架,并通过在TREC标准数据集上的对比实验,探索了结合两种关系证据进行专家搜索的可行性。实验结果表明,距离和顺序关系证据对专家搜索系统的准确率提高能力相近,而对它们的适当结合可以获得比单独利用其中任何一种更好的效果。; 关键词概率语言模型专家搜索关系证据核函数统一建模; Keywords probability language model expert search relationship evidence kernel function unified framework; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于查询词邻近度的专家搜索算法被引量：1: 4; 作者杨柳张文生; 机构中国科学院自动化研究所复杂系统与智能科学重点实验室; 出处《计算机工程》 CAS CSCD 北大核心 2011年第6期7-8,11,共3页; 基金国家自然科学基金资助项目(90924026) 国家"863"计划基金资助项目(2008AA01Z121 2007AA01Z338); 文摘提出一种基于查询词邻近度的专家搜索算法。根据查询词在窗口中的共现关系构建概率语言模型的查询词邻近度,利用经典概率模型作为背景平滑,通过对多个查询词在文档中的距离关系建模,结合候选人与查询词之间的距离对候选专家排序。实验结果表明,在该算法中引入查询词邻近度可以提高搜索准确率,应用候选人与查询词2种邻近度可以取得更好的专家搜索效果。; 关键词专家搜索查询词邻近度概率语言模型; Keywords expert search query word proximity probability language model; 分类号 TP393 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于词频均值波动和概率语言模型的短文本热点主题探测研究	徐敏李广建	《情报杂志》 CSSCI 北大核心	2019	6	在线阅读下载PDF 职称材料
2	基于跨语言语料的汉泰词分布表示	张金鹏周兰江线岩团余正涛何思兰	《计算机工程与科学》 CSCD 北大核心	2015	2	在线阅读下载PDF 职称材料
3	专家搜索中关系证据的重要性研究	杨柳张文生	《计算机应用研究》 CSCD 北大核心	2010	1	在线阅读下载PDF 职称材料
4	基于查询词邻近度的专家搜索算法	杨柳张文生	《计算机工程》 CAS CSCD 北大核心	2011	1	在线阅读下载PDF 职称材料