期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于fastText算法的行业分类技术
被引量:
6
1
作者
吴震
冉晓燕
+3 位作者
苗权
刘纯艳
张栋
魏娜
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2022年第2期193-198,共6页
随着中国经济的高速发展和技术创新能力的不断提升,高效的组织、分类信息是提供个性化行业管理和跟踪分析的基础。根据行业信息特点和发展规律,提出了一种基于fastText算法的行业分类模型。首先,构建行业分类关键词库,通过特征词库进行...
随着中国经济的高速发展和技术创新能力的不断提升,高效的组织、分类信息是提供个性化行业管理和跟踪分析的基础。根据行业信息特点和发展规律,提出了一种基于fastText算法的行业分类模型。首先,构建行业分类关键词库,通过特征词库进行分词和权重计算。然后,构建分类器模型,实现中文行业的自动分类。最后,实验选取了80000个包含企业经营范围、企业信息、舆论信息的测试文档,结果表明,所提模型结果高于Bayes、决策树、KNN等分类算法,取得了较好的应用效果。
展开更多
关键词
自然语言处理
行业分类
fasttext
算法
关键词
语法模型
在线阅读
下载PDF
职称材料
基于GRW和FastText模型的电信用户投诉文本分类应用
被引量:
3
2
作者
赵进
杨小军
《电信科学》
2021年第6期125-131,共7页
随着神经网络的广泛应用,将神经网络应用到自然语言处理文本分类问题中,成为一种有效的解决方法。电信运营商客户服务中心通过多种渠道收集用户投诉信息,为了对投诉文本信息进行自动分类并将其落实到具体责任部门,提升用户感知,提出了...
随着神经网络的广泛应用,将神经网络应用到自然语言处理文本分类问题中,成为一种有效的解决方法。电信运营商客户服务中心通过多种渠道收集用户投诉信息,为了对投诉文本信息进行自动分类并将其落实到具体责任部门,提升用户感知,提出了一种基于GRW模型和FastText模型的文本分类方法。首先通过GRW模型对投诉文本进行特征选择,提取有效特征词;然后构建基于FastText模型的用户投诉文本分类方法;最后在公开数据集和运营商已标注的投诉文本数据集上进行实验。结果表明,基于GRW和FastText模型的文本分类方法比朴素贝叶斯、双向LSTM和Bert模型在准确率、Kappa系数及汉明损失方面的性能有较大提升。
展开更多
关键词
神经网络
文本分类
GRW模型
fasttext
模型
在线阅读
下载PDF
职称材料
基于NLP的煤矿事故原因分类研究
被引量:
11
3
作者
张江石
李泳暾
+3 位作者
冒香凝
胡馨月
潘雨
王梓伊
《中国安全科学学报》
CAS
CSCD
北大核心
2023年第6期20-26,共7页
为有效提升分析和处理煤矿事故文本的效率,融合自然语言处理(NLP)技术与事故致因模型,构建一个自动化的事故原因分类框架。首先以事故致因“2-4”模型(24Model)为事故分类依据,分析87份煤矿事故调查报告,得到煤矿事故原因分类框架,构建...
为有效提升分析和处理煤矿事故文本的效率,融合自然语言处理(NLP)技术与事故致因模型,构建一个自动化的事故原因分类框架。首先以事故致因“2-4”模型(24Model)为事故分类依据,分析87份煤矿事故调查报告,得到煤矿事故原因分类框架,构建每类事故原因的语料库;然后利用NLP技术分别处理语料库中各类原因文本,将其用于训练fastText模型,自动识别事故原因文本并分类;最后对比分析fastText模型与TextCNN等其他3种经典模型的分类效果。结果表明:共得到21类事故原因和6684条训练语料,训练后的fastText模型对煤矿事故原因分类的识别正确率能够达到98.92%,综合性能优于其他3种分类模型。基于24Model和NLP技术开发的事故文本挖掘系统,能够快速分析处理事故文本信息,进一步细化事故调查报告中的原因,便于进行事故案例学习和统计分析。
展开更多
关键词
自然语言处理(NLP)
事故原因分类
“2-4”模型(24
model
)
fasttext
文本挖掘
在线阅读
下载PDF
职称材料
商品名称短文本快速有效分类的多基模型框架
被引量:
2
4
作者
沈雅婷
左志新
《计算机应用与软件》
北大核心
2021年第2期185-190,共6页
提出一种适用于短文本分类的多基模型框架Bagging_fastText(B_f)。它是一种基于自举汇聚法的快速文本分类算法的框架。以fastText为基模型,运用集成学习思想,设置最优超参数并训练出多个基模型组成多基模型,再通过投票机制获取最终类别...
提出一种适用于短文本分类的多基模型框架Bagging_fastText(B_f)。它是一种基于自举汇聚法的快速文本分类算法的框架。以fastText为基模型,运用集成学习思想,设置最优超参数并训练出多个基模型组成多基模型,再通过投票机制获取最终类别。对商品名称短文本分类的实验结果表明,提出的B_f比fastText、朴素贝叶斯传统文本分类算法、文本卷积神经网络(TextCNN)算法的分类效果更优。
展开更多
关键词
多基模型框架
fasttext
文本分类NLP
在线阅读
下载PDF
职称材料
题名
基于fastText算法的行业分类技术
被引量:
6
1
作者
吴震
冉晓燕
苗权
刘纯艳
张栋
魏娜
机构
国家计算机网络应急技术处理协调中心
国家计算机网络应急技术处理协调中心北京分中心
长城计算机软件与系统有限公司
出处
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2022年第2期193-198,共6页
文摘
随着中国经济的高速发展和技术创新能力的不断提升,高效的组织、分类信息是提供个性化行业管理和跟踪分析的基础。根据行业信息特点和发展规律,提出了一种基于fastText算法的行业分类模型。首先,构建行业分类关键词库,通过特征词库进行分词和权重计算。然后,构建分类器模型,实现中文行业的自动分类。最后,实验选取了80000个包含企业经营范围、企业信息、舆论信息的测试文档,结果表明,所提模型结果高于Bayes、决策树、KNN等分类算法,取得了较好的应用效果。
关键词
自然语言处理
行业分类
fasttext
算法
关键词
语法模型
Keywords
natural language processing
industry classification
fasttext
algorithm
keywords
grammar
model
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于GRW和FastText模型的电信用户投诉文本分类应用
被引量:
3
2
作者
赵进
杨小军
机构
中国电信股份有限公司重庆分公司
出处
《电信科学》
2021年第6期125-131,共7页
文摘
随着神经网络的广泛应用,将神经网络应用到自然语言处理文本分类问题中,成为一种有效的解决方法。电信运营商客户服务中心通过多种渠道收集用户投诉信息,为了对投诉文本信息进行自动分类并将其落实到具体责任部门,提升用户感知,提出了一种基于GRW模型和FastText模型的文本分类方法。首先通过GRW模型对投诉文本进行特征选择,提取有效特征词;然后构建基于FastText模型的用户投诉文本分类方法;最后在公开数据集和运营商已标注的投诉文本数据集上进行实验。结果表明,基于GRW和FastText模型的文本分类方法比朴素贝叶斯、双向LSTM和Bert模型在准确率、Kappa系数及汉明损失方面的性能有较大提升。
关键词
神经网络
文本分类
GRW模型
fasttext
模型
Keywords
neural network
text classification
GRW
model
fasttext model
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于NLP的煤矿事故原因分类研究
被引量:
11
3
作者
张江石
李泳暾
冒香凝
胡馨月
潘雨
王梓伊
机构
中国矿业大学(北京)应急管理与安全工程学院
出处
《中国安全科学学报》
CAS
CSCD
北大核心
2023年第6期20-26,共7页
文摘
为有效提升分析和处理煤矿事故文本的效率,融合自然语言处理(NLP)技术与事故致因模型,构建一个自动化的事故原因分类框架。首先以事故致因“2-4”模型(24Model)为事故分类依据,分析87份煤矿事故调查报告,得到煤矿事故原因分类框架,构建每类事故原因的语料库;然后利用NLP技术分别处理语料库中各类原因文本,将其用于训练fastText模型,自动识别事故原因文本并分类;最后对比分析fastText模型与TextCNN等其他3种经典模型的分类效果。结果表明:共得到21类事故原因和6684条训练语料,训练后的fastText模型对煤矿事故原因分类的识别正确率能够达到98.92%,综合性能优于其他3种分类模型。基于24Model和NLP技术开发的事故文本挖掘系统,能够快速分析处理事故文本信息,进一步细化事故调查报告中的原因,便于进行事故案例学习和统计分析。
关键词
自然语言处理(NLP)
事故原因分类
“2-4”模型(24
model
)
fasttext
文本挖掘
Keywords
natural language processing(NLP)
classification of accidents causes
"2-4″
model
(24
model
)
fasttext
text mining
分类号
X936 [环境科学与工程—安全科学]
在线阅读
下载PDF
职称材料
题名
商品名称短文本快速有效分类的多基模型框架
被引量:
2
4
作者
沈雅婷
左志新
机构
南京理工大学紫金学院
出处
《计算机应用与软件》
北大核心
2021年第2期185-190,共6页
基金
江苏省高校自然科学研究项目(19KJB520039)
南京理工大学紫金学院科学研究项目(2019ZRKX0401008)。
文摘
提出一种适用于短文本分类的多基模型框架Bagging_fastText(B_f)。它是一种基于自举汇聚法的快速文本分类算法的框架。以fastText为基模型,运用集成学习思想,设置最优超参数并训练出多个基模型组成多基模型,再通过投票机制获取最终类别。对商品名称短文本分类的实验结果表明,提出的B_f比fastText、朴素贝叶斯传统文本分类算法、文本卷积神经网络(TextCNN)算法的分类效果更优。
关键词
多基模型框架
fasttext
文本分类NLP
Keywords
Multi-base
model
framework
fasttext
Text classification
NLP
分类号
TP39 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于fastText算法的行业分类技术
吴震
冉晓燕
苗权
刘纯艳
张栋
魏娜
《北京航空航天大学学报》
EI
CAS
CSCD
北大核心
2022
6
在线阅读
下载PDF
职称材料
2
基于GRW和FastText模型的电信用户投诉文本分类应用
赵进
杨小军
《电信科学》
2021
3
在线阅读
下载PDF
职称材料
3
基于NLP的煤矿事故原因分类研究
张江石
李泳暾
冒香凝
胡馨月
潘雨
王梓伊
《中国安全科学学报》
CAS
CSCD
北大核心
2023
11
在线阅读
下载PDF
职称材料
4
商品名称短文本快速有效分类的多基模型框架
沈雅婷
左志新
《计算机应用与软件》
北大核心
2021
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部