期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于词频均值波动和概率语言模型的短文本热点主题探测研究 被引量:6
1
作者 徐敏 李广建 《情报杂志》 CSSCI 北大核心 2019年第6期152-158,共7页
[目的/意义]针对短文本词语特征向量稀疏的问题,提出利用突然爆发现象和词语共现概率现象进行热点主题探测研究的新视角。[方法/过程]以此为目标建立了一个分析框架,以词频均值波动模型发现短文本中的热点词,以概率语言模型发现主题词,... [目的/意义]针对短文本词语特征向量稀疏的问题,提出利用突然爆发现象和词语共现概率现象进行热点主题探测研究的新视角。[方法/过程]以此为目标建立了一个分析框架,以词频均值波动模型发现短文本中的热点词,以概率语言模型发现主题词,再对二者结果集合进行相似度计算实现热点主题的探测与展示。[结果/结论]通过对较高热度噪声词的过滤以及热点事件词的发现实现热点主题的探测。通过对比谷歌趋势的结果,准确率达到82.67%,证明模型有效。本研究对短文本热点主题探测的理论和实践研究具有一定参考价值。 展开更多
关键词 短文本 热点主题探测 词频均值波动模型 概率语言模型
在线阅读 下载PDF
基于跨语言语料的汉泰词分布表示 被引量:2
2
作者 张金鹏 周兰江 +2 位作者 线岩团 余正涛 何思兰 《计算机工程与科学》 CSCD 北大核心 2015年第12期2358-2365,共8页
词汇的表示问题是自然语言处理的基础研究内容。目前单语词汇分布表示已经在一些自然语言处理问题上取得很好的应用效果,然而在跨语言词汇的分布表示上国内外研究很少,针对这个问题,利用两种语言名词、动词分布的相似性,通过弱监督学习... 词汇的表示问题是自然语言处理的基础研究内容。目前单语词汇分布表示已经在一些自然语言处理问题上取得很好的应用效果,然而在跨语言词汇的分布表示上国内外研究很少,针对这个问题,利用两种语言名词、动词分布的相似性,通过弱监督学习扩展等方式在中文语料中嵌入泰语的互译词、同类词、上义词等,学习出泰语词在汉泰跨语言环境下的分布。实验基于学习到的跨语言词汇分布表示应用于双语文本相似度计算和汉泰混合语料集文本分类,均取得较好效果。 展开更多
关键词 弱监督学习扩展 语言语料 语言词汇分布表示 神经概率语言模型
在线阅读 下载PDF
专家搜索中关系证据的重要性研究 被引量:1
3
作者 杨柳 张文生 《计算机应用研究》 CSCD 北大核心 2010年第11期4040-4043,4047,共5页
系统地研究了查询词与候选人在文档中的距离和顺序关系对专家搜索算法准确率的影响。首先在概率语言模型的框架下提出了顺序核函数来建模顺序关系证据;然后进一步提出两种对不同关系证据进行统一建模的概率框架,并通过在TREC标准数据集... 系统地研究了查询词与候选人在文档中的距离和顺序关系对专家搜索算法准确率的影响。首先在概率语言模型的框架下提出了顺序核函数来建模顺序关系证据;然后进一步提出两种对不同关系证据进行统一建模的概率框架,并通过在TREC标准数据集上的对比实验,探索了结合两种关系证据进行专家搜索的可行性。实验结果表明,距离和顺序关系证据对专家搜索系统的准确率提高能力相近,而对它们的适当结合可以获得比单独利用其中任何一种更好的效果。 展开更多
关键词 概率语言模型 专家搜索 关系证据 核函数 统一建模
在线阅读 下载PDF
基于查询词邻近度的专家搜索算法 被引量:1
4
作者 杨柳 张文生 《计算机工程》 CAS CSCD 北大核心 2011年第6期7-8,11,共3页
提出一种基于查询词邻近度的专家搜索算法。根据查询词在窗口中的共现关系构建概率语言模型的查询词邻近度,利用经典概率模型作为背景平滑,通过对多个查询词在文档中的距离关系建模,结合候选人与查询词之间的距离对候选专家排序。实验... 提出一种基于查询词邻近度的专家搜索算法。根据查询词在窗口中的共现关系构建概率语言模型的查询词邻近度,利用经典概率模型作为背景平滑,通过对多个查询词在文档中的距离关系建模,结合候选人与查询词之间的距离对候选专家排序。实验结果表明,在该算法中引入查询词邻近度可以提高搜索准确率,应用候选人与查询词2种邻近度可以取得更好的专家搜索效果。 展开更多
关键词 专家搜索 查询词邻近度 概率语言模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部