期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
手机取证的中文短文本分类方法
1
作者
徐红
刘衍
《科技创新与应用》
2019年第35期134-135,共2页
手机取证是打击利用手机犯罪的重要手段,手机取证面对的主要技术问题之一是中文短文本分类。文章研究手机取证的中文短文本分类,简析文本分类的流程,探讨改进普通文本分类技术以适应中文短文本分类的需求,以及将BP神经网络应用于文本分...
手机取证是打击利用手机犯罪的重要手段,手机取证面对的主要技术问题之一是中文短文本分类。文章研究手机取证的中文短文本分类,简析文本分类的流程,探讨改进普通文本分类技术以适应中文短文本分类的需求,以及将BP神经网络应用于文本分类器的设计方法。
展开更多
关键词
手机取证
中文短文本分类
神经网络
在线阅读
下载PDF
职称材料
融合TF-IDF和LDA的中文FastText短文本分类方法
被引量:
32
2
作者
冯勇
屈渤浩
+2 位作者
徐红艳
王嵘冰
张永刚
《应用科学学报》
CAS
CSCD
北大核心
2019年第3期378-388,共11页
FastText文本分类模型具有快速高效的优势,但直接将其用于中文短文本分类则存在精确率不高的问题.为此提出一种融合词频-逆文本频率(term frequency-inverse document frequency, TF-IDF)和隐含狄利克雷分布(latent Dirichlet allocatio...
FastText文本分类模型具有快速高效的优势,但直接将其用于中文短文本分类则存在精确率不高的问题.为此提出一种融合词频-逆文本频率(term frequency-inverse document frequency, TF-IDF)和隐含狄利克雷分布(latent Dirichlet allocation, LDA)的中文FastText短文本分类方法.该方法在FastText文本分类模型的输入阶段对n元语法模型处理后的词典进行TF-IDF筛选,使用LDA模型进行语料库主题分析,依据所得结果对特征词典进行补充,从而在计算输入词序列向量均值时偏向高区分度的词条,使其更适用于中文短文本分类环境.对比实验结果可知,所提方法在中文短文本分类方面具有更高的精确率.
展开更多
关键词
中文短文本分类
FastText
词频-逆
文本
频率
词向量
隐含狄利克雷分布
在线阅读
下载PDF
职称材料
题名
手机取证的中文短文本分类方法
1
作者
徐红
刘衍
机构
四川警察学院
出处
《科技创新与应用》
2019年第35期134-135,共2页
文摘
手机取证是打击利用手机犯罪的重要手段,手机取证面对的主要技术问题之一是中文短文本分类。文章研究手机取证的中文短文本分类,简析文本分类的流程,探讨改进普通文本分类技术以适应中文短文本分类的需求,以及将BP神经网络应用于文本分类器的设计方法。
关键词
手机取证
中文短文本分类
神经网络
Keywords
mobile phone forensics
Chinese short text classification
neural network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
融合TF-IDF和LDA的中文FastText短文本分类方法
被引量:
32
2
作者
冯勇
屈渤浩
徐红艳
王嵘冰
张永刚
机构
辽宁大学信息学院
吉林大学符号计算与知识工程教育部重点实验室
出处
《应用科学学报》
CAS
CSCD
北大核心
2019年第3期378-388,共11页
基金
国家自然科学基金(No.71771110)
中国博士后科学基金(No.2018M631814)
+1 种基金
辽宁省社会科学规划基金(No.L18AGL007)
符号计算与知识工程教育部重点实验室项目基金(No.93K172018K01)资助
文摘
FastText文本分类模型具有快速高效的优势,但直接将其用于中文短文本分类则存在精确率不高的问题.为此提出一种融合词频-逆文本频率(term frequency-inverse document frequency, TF-IDF)和隐含狄利克雷分布(latent Dirichlet allocation, LDA)的中文FastText短文本分类方法.该方法在FastText文本分类模型的输入阶段对n元语法模型处理后的词典进行TF-IDF筛选,使用LDA模型进行语料库主题分析,依据所得结果对特征词典进行补充,从而在计算输入词序列向量均值时偏向高区分度的词条,使其更适用于中文短文本分类环境.对比实验结果可知,所提方法在中文短文本分类方面具有更高的精确率.
关键词
中文短文本分类
FastText
词频-逆
文本
频率
词向量
隐含狄利克雷分布
Keywords
Chinese short text classification
FastText
term frequency-inverse document frequency(TF-IDF)
word vector
latent Dirichlet allocation(LDA)
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
手机取证的中文短文本分类方法
徐红
刘衍
《科技创新与应用》
2019
0
在线阅读
下载PDF
职称材料
2
融合TF-IDF和LDA的中文FastText短文本分类方法
冯勇
屈渤浩
徐红艳
王嵘冰
张永刚
《应用科学学报》
CAS
CSCD
北大核心
2019
32
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部