检索结果-维普期刊中文期刊服务平台

融合TF-IDF和LDA的中文FastText短文本分类方法被引量：33: 1; 作者冯勇屈渤浩 +2 位作者徐红艳王嵘冰张永刚《应用科学学报》 CAS CSCD 北大核心 2019年第3期378-388,共11页; FastText文本分类模型具有快速高效的优势,但直接将其用于中文短文本分类则存在精确率不高的问题.为此提出一种融合词频-逆文本频率(term frequency-inverse document frequency, TF-IDF)和隐含狄利克雷分布(latent Dirichlet allocatio... 展开更多; 关键词中文短文本分类 FastText 词频-逆文本频率词向量隐含狄利克雷分布; 在线阅读下载PDF 职称材料

基于Laplacian图谱的短文本聚类算法被引量：2: 2; 作者孟海宁冯锴 +3 位作者朱磊张贝贝童新宇黑新宏《电子学报》 EI CAS CSCD 北大核心 2021年第9期1716-1723,共8页; 提出基于词频处理的Laplacian图谱聚类算法,以解决短文本数据维数高、特征稀疏等问题.首先采用词频-逆文本频率指数TF-IDF(Term Frequency-Inverse Document Frequency)方法,将短文本数据集映射到文本向量空间得到词频权值矩阵;其次利用... 展开更多; 关键词 Laplacian图谱词频-逆文本频率指数短文本聚类向量空间模型数据降维特征权值; 在线阅读下载PDF 职称材料

自然语言语义库构建方法研究被引量：2: 3; 作者杨菊英江兵罗佳《重庆理工大学学报（自然科学）》 CAS 北大核心 2019年第10期103-108,共6页; 自然语言语义语料库构建是智能云计算环境中实现信息交换的关键步骤,对语义语料库构造技术进行了分析,提出了一种基于词频-逆文本频率(term frequency-inverse document frequency,TF-IDF)和字向量距离的新型网页去重复算法,该方法专注... 展开更多; 关键词自然语言语义库词频-逆文本频率字向量距离; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	融合TF-IDF和LDA的中文FastText短文本分类方法	冯勇屈渤浩徐红艳王嵘冰张永刚	《应用科学学报》 CAS CSCD 北大核心	2019	33	在线阅读下载PDF 职称材料
2	基于Laplacian图谱的短文本聚类算法	孟海宁冯锴朱磊张贝贝童新宇黑新宏	《电子学报》 EI CAS CSCD 北大核心	2021	2	在线阅读下载PDF 职称材料
3	自然语言语义库构建方法研究	杨菊英江兵罗佳	《重庆理工大学学报（自然科学）》 CAS 北大核心	2019	2	在线阅读下载PDF 职称材料