期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于双词语义扩展的Biterm主题模型 被引量:4
1
作者 李思宇 谢珺 +2 位作者 邹雪君 续欣莹 冀小平 《计算机工程》 CAS CSCD 北大核心 2019年第1期210-216,共7页
针对Biterm主题模型短文本文档的双词产生过程中词对之间缺乏语义联系的情况,提出一种融入词对语义扩展的Biterm主题模型。考虑双词的语义关系,引入词向量模型。通过训练词向量模型,判断词与词之间的语义距离,并根据语义距离对Biterm主... 针对Biterm主题模型短文本文档的双词产生过程中词对之间缺乏语义联系的情况,提出一种融入词对语义扩展的Biterm主题模型。考虑双词的语义关系,引入词向量模型。通过训练词向量模型,判断词与词之间的语义距离,并根据语义距离对Biterm主题模型进行双词语义扩展。实验结果表明,与现有Biterm主题模型相比,该模型不仅具有较好的短文本主题分类效果,而且双词间的语义关联性能及主题词义聚类性能也得到明显提升。 展开更多
关键词 Biterm主题模型 双词 词向量 双词语义 吉布斯采样
在线阅读 下载PDF
基于多标签双词主题模型的短文本谣言分析研究 被引量:8
2
作者 武庆圆 何凌南 《情报杂志》 CSSCI 北大核心 2017年第3期92-97,共6页
[目的/意义]面对互联网与智能移动设备的兴起,谣言尤其是短文本类型的谣言发展速度十分迅猛。短文本谣言具有词语稀疏、语义提取困难等特点,这为精准识别谣言带来了挑战和困难。如何能够有效地鉴别进而控制谣言的传播是目前迫在眉睫的... [目的/意义]面对互联网与智能移动设备的兴起,谣言尤其是短文本类型的谣言发展速度十分迅猛。短文本谣言具有词语稀疏、语义提取困难等特点,这为精准识别谣言带来了挑战和困难。如何能够有效地鉴别进而控制谣言的传播是目前迫在眉睫的问题。[方法/过程]提出一个在文本与标签之间引入语义层的多标签双词主题模型,用于发现及探究网民发表在公共媒体平台上的短文本属于谣言或欺诈的倾向。该研究专门针对微信等短文本数据,并通过真实数据集对双词主题的提取和建模进行验证。[结果/结论]结果表明:上述模型可以有效鉴别谣言,帮助媒体加强和改进监管机制,遏制网络谣言、欺诈等现象。 展开更多
关键词 多标签 双词 短文本 谣言 主题模型 微信 语义分析
在线阅读 下载PDF
基于双词主题模型的半监督实体消歧方法研究 被引量:6
3
作者 张雄 陈福才 黄瑞阳 《电子学报》 EI CAS CSCD 北大核心 2018年第3期607-613,共7页
针对实体上下文信息主题漂移的问题,提出一种基于双词主题模型的实体消歧方法.方法考虑到实体在一定语义环境下具有不同的主题,且在同一文档中同时出现的其他实体在一定程度上能够帮助待消歧实体确定所指代内容,利用命名实体构建双词的... 针对实体上下文信息主题漂移的问题,提出一种基于双词主题模型的实体消歧方法.方法考虑到实体在一定语义环境下具有不同的主题,且在同一文档中同时出现的其他实体在一定程度上能够帮助待消歧实体确定所指代内容,利用命名实体构建双词的思想,将协同实体关系融合到主题模型中,并在此基础上利用维基百科知识库,进行半监督消歧.本文最后在网络文本数据上进行了相关的实验,验证了所提算法的有效性.实验表明该方法有效的提高了实体消歧精度. 展开更多
关键词 实体消歧 维基百科 双词主题模型
在线阅读 下载PDF
连续汉语音识别有双词文法约束的大型HMM
4
作者 张英林 贾骏 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 1999年第1期77-80,共4页
提出针对汉语连续语音识别中的大型HMM进行修正.在模型中加入双词文法约束,然后给出文法约束下的新的识别算法,新识别算法基于Viterbi算法和分层构筑思想之上.经实验测试,识别率有较大提高.
关键词 连续语音识别 双词文法 汉语 语音识别 HMM
在线阅读 下载PDF
一种基于双词关联的文本特征选择模型
5
作者 高茂庭 王正欧 《计算机工程与应用》 CSCD 北大核心 2007年第10期183-185,共3页
向量空间模型(VSM)是一种常用的文本特征表示方法,它是基于特征独立性假设建立起来的,将文本看成是由一个个独立的词所构成,这些词之间互不关联,这种方法丢失了文本中词间的一些重要的关联特征信息。基于双词关联的文本特征选择模型是在... 向量空间模型(VSM)是一种常用的文本特征表示方法,它是基于特征独立性假设建立起来的,将文本看成是由一个个独立的词所构成,这些词之间互不关联,这种方法丢失了文本中词间的一些重要的关联特征信息。基于双词关联的文本特征选择模型是在VSM的基础上,选择文本中相邻的单词之间的关联信息也作为文本特征,从而能更加充分地表达文本的特征信息。实验表明,这是一种更加有效的文本特征选择方法。 展开更多
关键词 文本挖掘 特征选择 双词关联 聚类分析
在线阅读 下载PDF
融合词向量特征的双词主题模型 被引量:7
6
作者 刘良选 黄梦醒 《计算机应用研究》 CSCD 北大核心 2017年第7期2055-2058,共4页
针对短文本中固有的文本内容稀疏和上下文信息匮乏等问题,在双词主题模型(BTM)的基础上提出一种融合词向量特征的双词主题模型LF-BTM。该模型引入潜在特征模型以利用丰富的词向量信息弥补内容稀疏,在改进的生成过程中每个双词的词汇的... 针对短文本中固有的文本内容稀疏和上下文信息匮乏等问题,在双词主题模型(BTM)的基础上提出一种融合词向量特征的双词主题模型LF-BTM。该模型引入潜在特征模型以利用丰富的词向量信息弥补内容稀疏,在改进的生成过程中每个双词的词汇的生成受到主题—词汇多项分布和潜在特征模型的共同影响。模型中的参数通过吉布斯采样算法进行估计。在真实的短文本数据集上的实验结果表明,该模型能结合外部通用的大规模语料库上已训练好的词向量挖掘出语义一致性显著提升的主题。 展开更多
关键词 主题模型 潜在狄利克雷分配 短文本 双词主题模型 词向量 吉布斯采样
在线阅读 下载PDF
影响英语双词动词宾语位置的决定性因素 被引量:2
7
作者 孙承荣 孙丽华 《山东外语教学》 北大核心 1995年第2期21-24,共4页
影响英语双词动词宾语位置的决定性因素孙承荣,孙丽华英语语言学家及学者对双词动词的概念及范围有诸多不同的见解。我们所谈的双词动词是指那些形式上由两部分组成--动词和小品词;作用上,在语义、句法、语调3方面形成一个不可分... 影响英语双词动词宾语位置的决定性因素孙承荣,孙丽华英语语言学家及学者对双词动词的概念及范围有诸多不同的见解。我们所谈的双词动词是指那些形式上由两部分组成--动词和小品词;作用上,在语义、句法、语调3方面形成一个不可分割的语言单位--短语动词。例如:S... 展开更多
关键词 英语 双词动词 宾语位置 影响因素 决定性因素 短语动词 句法特性
在线阅读 下载PDF
基于统计方法的中文姓名识别 被引量:34
8
作者 黄德根 杨元生 +2 位作者 王省 张艳丽 钟万勰 《中文信息学报》 CSCD 北大核心 2001年第2期31-37,44,共8页
专有名词的识别对自动分词有重要意义。本文针对如何识别中文姓名做了有益的尝试 ,主要采用基于统计方法 ,进行中文姓名识别。本文建立了有监督学习机制 ,提出了句子切分结果可信度等概念 ,并在此基础上建立了较好的统计模型 ,系统闭式... 专有名词的识别对自动分词有重要意义。本文针对如何识别中文姓名做了有益的尝试 ,主要采用基于统计方法 ,进行中文姓名识别。本文建立了有监督学习机制 ,提出了句子切分结果可信度等概念 ,并在此基础上建立了较好的统计模型 ,系统闭式精确率和召回率分别达 95 .97%和 95 .5 2 % ,开式精确率和召回率分别达 92 .37%和 88.6 2 % 展开更多
关键词 双词同现频度 单词频度 学习机制 中文姓名识别 自动分词 统计模型 召回率 可信度
在线阅读 下载PDF
情感极性和影响函数的OBTM弹幕主题演化
9
作者 吴迪 黄竹韵 +2 位作者 生龙 张梦甜 贾耀清 《计算机工程与设计》 北大核心 2021年第10期2956-2961,共6页
针对主题模型不能充分考虑情感极性信息和衰减因子设定单一的问题,提出情感极性和影响函数的OBTM弹幕主题演化方法。提出基于改进负采样的word2vec词向量模型,对弹幕词语的情感极性进行标注;设计影响函数,反映离散时间中文本主题的历史... 针对主题模型不能充分考虑情感极性信息和衰减因子设定单一的问题,提出情感极性和影响函数的OBTM弹幕主题演化方法。提出基于改进负采样的word2vec词向量模型,对弹幕词语的情感极性进行标注;设计影响函数,反映离散时间中文本主题的历史影响程度;利用情感极性特征和影响函数改进OBTM模型,用于弹幕主题演化的分析。实验结果表明,改进的OBTM可以有效优化主题演化效果,能够扩展弹幕在主题情感极性演化方面的应用。 展开更多
关键词 弹幕 主题演化 情感极性 在线双词主题模型 word2vec词向量模型
在线阅读 下载PDF
构式压制下“是+能愿动词双+的”的构式特征及其能产性
10
作者 宋增文 《新疆大学学报(哲学社会科学版)》 CSSCI 2021年第1期144-150,共7页
文章从构式压制角度考察“是+能愿动词双+的”的构式特征及其能产性。该构式性质为表判断的“是”字句,是谓词隐含的结果。谓词隐含受制于构式压制,“能愿动词双”经构式压制被赋予了谓词性功能。该构式的构件特征包含“的”字结构的物... 文章从构式压制角度考察“是+能愿动词双+的”的构式特征及其能产性。该构式性质为表判断的“是”字句,是谓词隐含的结果。谓词隐含受制于构式压制,“能愿动词双”经构式压制被赋予了谓词性功能。该构式的构件特征包含“的”字结构的物性角色和“能愿动词双”的去范畴化,构体特征侧重表达凸显强调和主观评价。由其衍生出的“能愿动词双+的”构式在“可以”“应该”“必须”三个词上具有话语应答标记的功能,这是高频使用后语用泛化的表现。 展开更多
关键词 是+能愿动词双+的 构式性质 构式压制 构式特征 能愿动词双+的
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部