期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于词频均值波动和概率语言模型的短文本热点主题探测研究
被引量:
6
1
作者
徐敏
李广建
《情报杂志》
CSSCI
北大核心
2019年第6期152-158,共7页
[目的/意义]针对短文本词语特征向量稀疏的问题,提出利用突然爆发现象和词语共现概率现象进行热点主题探测研究的新视角。[方法/过程]以此为目标建立了一个分析框架,以词频均值波动模型发现短文本中的热点词,以概率语言模型发现主题词,...
[目的/意义]针对短文本词语特征向量稀疏的问题,提出利用突然爆发现象和词语共现概率现象进行热点主题探测研究的新视角。[方法/过程]以此为目标建立了一个分析框架,以词频均值波动模型发现短文本中的热点词,以概率语言模型发现主题词,再对二者结果集合进行相似度计算实现热点主题的探测与展示。[结果/结论]通过对较高热度噪声词的过滤以及热点事件词的发现实现热点主题的探测。通过对比谷歌趋势的结果,准确率达到82.67%,证明模型有效。本研究对短文本热点主题探测的理论和实践研究具有一定参考价值。
展开更多
关键词
短文本
热点主题探测
词频均值波动
模型
概率语言模型
在线阅读
下载PDF
职称材料
基于跨语言语料的汉泰词分布表示
被引量:
2
2
作者
张金鹏
周兰江
+2 位作者
线岩团
余正涛
何思兰
《计算机工程与科学》
CSCD
北大核心
2015年第12期2358-2365,共8页
词汇的表示问题是自然语言处理的基础研究内容。目前单语词汇分布表示已经在一些自然语言处理问题上取得很好的应用效果,然而在跨语言词汇的分布表示上国内外研究很少,针对这个问题,利用两种语言名词、动词分布的相似性,通过弱监督学习...
词汇的表示问题是自然语言处理的基础研究内容。目前单语词汇分布表示已经在一些自然语言处理问题上取得很好的应用效果,然而在跨语言词汇的分布表示上国内外研究很少,针对这个问题,利用两种语言名词、动词分布的相似性,通过弱监督学习扩展等方式在中文语料中嵌入泰语的互译词、同类词、上义词等,学习出泰语词在汉泰跨语言环境下的分布。实验基于学习到的跨语言词汇分布表示应用于双语文本相似度计算和汉泰混合语料集文本分类,均取得较好效果。
展开更多
关键词
弱监督学习扩展
跨
语言
语料
跨
语言
词汇分布表示
神经
概率语言模型
在线阅读
下载PDF
职称材料
专家搜索中关系证据的重要性研究
被引量:
1
3
作者
杨柳
张文生
《计算机应用研究》
CSCD
北大核心
2010年第11期4040-4043,4047,共5页
系统地研究了查询词与候选人在文档中的距离和顺序关系对专家搜索算法准确率的影响。首先在概率语言模型的框架下提出了顺序核函数来建模顺序关系证据;然后进一步提出两种对不同关系证据进行统一建模的概率框架,并通过在TREC标准数据集...
系统地研究了查询词与候选人在文档中的距离和顺序关系对专家搜索算法准确率的影响。首先在概率语言模型的框架下提出了顺序核函数来建模顺序关系证据;然后进一步提出两种对不同关系证据进行统一建模的概率框架,并通过在TREC标准数据集上的对比实验,探索了结合两种关系证据进行专家搜索的可行性。实验结果表明,距离和顺序关系证据对专家搜索系统的准确率提高能力相近,而对它们的适当结合可以获得比单独利用其中任何一种更好的效果。
展开更多
关键词
概率语言模型
专家搜索
关系证据
核函数
统一建模
在线阅读
下载PDF
职称材料
基于查询词邻近度的专家搜索算法
被引量:
1
4
作者
杨柳
张文生
《计算机工程》
CAS
CSCD
北大核心
2011年第6期7-8,11,共3页
提出一种基于查询词邻近度的专家搜索算法。根据查询词在窗口中的共现关系构建概率语言模型的查询词邻近度,利用经典概率模型作为背景平滑,通过对多个查询词在文档中的距离关系建模,结合候选人与查询词之间的距离对候选专家排序。实验...
提出一种基于查询词邻近度的专家搜索算法。根据查询词在窗口中的共现关系构建概率语言模型的查询词邻近度,利用经典概率模型作为背景平滑,通过对多个查询词在文档中的距离关系建模,结合候选人与查询词之间的距离对候选专家排序。实验结果表明,在该算法中引入查询词邻近度可以提高搜索准确率,应用候选人与查询词2种邻近度可以取得更好的专家搜索效果。
展开更多
关键词
专家搜索
查询词邻近度
概率语言模型
在线阅读
下载PDF
职称材料
题名
基于词频均值波动和概率语言模型的短文本热点主题探测研究
被引量:
6
1
作者
徐敏
李广建
机构
北京大学信息管理系
出处
《情报杂志》
CSSCI
北大核心
2019年第6期152-158,共7页
基金
国家社会科学基金重点项目“大数据环境下的计算型情报分析方法与技术研究”(编号:14ATQ005)研究成果之一
国家社会科学基金重大项目“大数据时代知识融合的体系架构、实现模式及实证研究”(编号:15ZDB129)的阶段性成果之一
文摘
[目的/意义]针对短文本词语特征向量稀疏的问题,提出利用突然爆发现象和词语共现概率现象进行热点主题探测研究的新视角。[方法/过程]以此为目标建立了一个分析框架,以词频均值波动模型发现短文本中的热点词,以概率语言模型发现主题词,再对二者结果集合进行相似度计算实现热点主题的探测与展示。[结果/结论]通过对较高热度噪声词的过滤以及热点事件词的发现实现热点主题的探测。通过对比谷歌趋势的结果,准确率达到82.67%,证明模型有效。本研究对短文本热点主题探测的理论和实践研究具有一定参考价值。
关键词
短文本
热点主题探测
词频均值波动
模型
概率语言模型
Keywords
short texts
hot topics detection
word frequency mean fluctuation model
probabilistic language model
分类号
G356.8 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
基于跨语言语料的汉泰词分布表示
被引量:
2
2
作者
张金鹏
周兰江
线岩团
余正涛
何思兰
机构
昆明理工大学信息工程与自动化学院
昆明理工大学智能信息处理重点实验室
昆明理工大学理学院
出处
《计算机工程与科学》
CSCD
北大核心
2015年第12期2358-2365,共8页
基金
国家自然科学基金资助项目(61363044)
文摘
词汇的表示问题是自然语言处理的基础研究内容。目前单语词汇分布表示已经在一些自然语言处理问题上取得很好的应用效果,然而在跨语言词汇的分布表示上国内外研究很少,针对这个问题,利用两种语言名词、动词分布的相似性,通过弱监督学习扩展等方式在中文语料中嵌入泰语的互译词、同类词、上义词等,学习出泰语词在汉泰跨语言环境下的分布。实验基于学习到的跨语言词汇分布表示应用于双语文本相似度计算和汉泰混合语料集文本分类,均取得较好效果。
关键词
弱监督学习扩展
跨
语言
语料
跨
语言
词汇分布表示
神经
概率语言模型
Keywords
weakly supervised learning extension
cross-lingual corpus
cross-lingual word distribution representations
neural probabilistic language model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
专家搜索中关系证据的重要性研究
被引量:
1
3
作者
杨柳
张文生
机构
中国科学院自动化研究所复杂系统与智能科学重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2010年第11期4040-4043,4047,共5页
基金
国家自然科学基金资助项目(90924026)
国家"863"高技术研究发展计划项目(2008AA01Z121
2007AA01Z338)
文摘
系统地研究了查询词与候选人在文档中的距离和顺序关系对专家搜索算法准确率的影响。首先在概率语言模型的框架下提出了顺序核函数来建模顺序关系证据;然后进一步提出两种对不同关系证据进行统一建模的概率框架,并通过在TREC标准数据集上的对比实验,探索了结合两种关系证据进行专家搜索的可行性。实验结果表明,距离和顺序关系证据对专家搜索系统的准确率提高能力相近,而对它们的适当结合可以获得比单独利用其中任何一种更好的效果。
关键词
概率语言模型
专家搜索
关系证据
核函数
统一建模
Keywords
probability language model
expert search
relationship evidence
kernel function
unified framework
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于查询词邻近度的专家搜索算法
被引量:
1
4
作者
杨柳
张文生
机构
中国科学院自动化研究所复杂系统与智能科学重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第6期7-8,11,共3页
基金
国家自然科学基金资助项目(90924026)
国家"863"计划基金资助项目(2008AA01Z121
2007AA01Z338)
文摘
提出一种基于查询词邻近度的专家搜索算法。根据查询词在窗口中的共现关系构建概率语言模型的查询词邻近度,利用经典概率模型作为背景平滑,通过对多个查询词在文档中的距离关系建模,结合候选人与查询词之间的距离对候选专家排序。实验结果表明,在该算法中引入查询词邻近度可以提高搜索准确率,应用候选人与查询词2种邻近度可以取得更好的专家搜索效果。
关键词
专家搜索
查询词邻近度
概率语言模型
Keywords
expert search
query word proximity
probability language model
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于词频均值波动和概率语言模型的短文本热点主题探测研究
徐敏
李广建
《情报杂志》
CSSCI
北大核心
2019
6
在线阅读
下载PDF
职称材料
2
基于跨语言语料的汉泰词分布表示
张金鹏
周兰江
线岩团
余正涛
何思兰
《计算机工程与科学》
CSCD
北大核心
2015
2
在线阅读
下载PDF
职称材料
3
专家搜索中关系证据的重要性研究
杨柳
张文生
《计算机应用研究》
CSCD
北大核心
2010
1
在线阅读
下载PDF
职称材料
4
基于查询词邻近度的专家搜索算法
杨柳
张文生
《计算机工程》
CAS
CSCD
北大核心
2011
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部