基于fastText的地震信息文本分类方法被引量：1

Earthquake Information Text Classification Method Based on fastText

在线阅读下载PDF

导出

摘要针对地震发生后新闻种类繁多,无法准确获取地震相关新闻的问题,该文提出了一种通过互联网获取地震信息并对地震信息进行文本信息识别的方法,可以识别文本信息是否为地震信息。采用Python爬虫技术对结构不同的新闻网站进行数据采集,并基于fastText的文本分类模型对数据进行分类训练,实验结果表明:该方法能够有效地对新闻进行分类,获取所需地震新闻。 In response to the problem that there are many kinds of news after an earthquake and it is impossible to obtain earthquake related news accurately,this paper proposes a method to obtain earthquake information through the internet and perform text information recognition on earthquake information,which can identify whether the text information is earthquake information or not.Python crawler technology is used to collect data from news websites with different structures,and carry out classification training on data based on fastText’text classification model.The experimental results show that the method can effectively classify the news and obtain the required earthquake news.

作者王钟浩崔珂玮张鑫杨振中刘帅 WANG Zhonghao;CUI Kewei;ZHANG Xin;YANG Zhenzhong;LIU Shuai(Institute of Disaster Prevention,Sanhe 065201,China)

机构地区防灾科技学院

出处《现代信息科技》 2021年第3期5-8,共4页 Modern Information Technology

基金防灾科技学院2020大学生创新创业项目(202011775092)。

关键词深度学习文本分类数据采集自然语言处理 deep learning text classification data collection natural language processing

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

作者简介王钟浩(1997—),男,汉族,内蒙古赤峰人,硕士研究生在读,研究方向:自然语言处理;崔珂玮(2000—),男,汉族,山东临沂人,本科在读,研究方向:计算机科学与技术;张鑫(2000—),男,汉族,安徽芜湖人,本科在读,研究方向:计算机科学与技术;杨振中(1999—),男,汉族,河北邯郸人,本科在读,研究方向:计算机科学与技术;通讯作者:刘帅(1983—),男,汉族,河北保定人,讲师,硕士,研究方向:软件工程和大数据分析。

引文网络
相关文献

参考文献5

1陈子豪,谢从华,时敏,唐晓娜.基于fasttext模型的中文专利快速分类[J].常熟理工学院学报,2020,34(5):47-50. 被引量：1
2林国祥,詹先银,薛醒思,林涵,吕宏昱,林培辉,方铭波.基于fastText的股票咨询案例中文短文本分类技术[J].宝鸡文理学院学报（自然科学版）,2020,40(3):48-52. 被引量：3
3曾小芹.基于Python的中文结巴分词技术实现[J].信息与电脑,2019,0(18):38-39. 被引量：55
4王琳,姜立新,杨天青,张维佳.地震应急信息自动分类方法研究[J].震灾防御技术,2019,14(4):907-916. 被引量：9
5崔满丰,张晋辉.基于网站的地震应急信息发布技术[J].地震地磁观测与研究,2020,41(4):232-238. 被引量：5

二级参考文献32

1余丹.关于查全率和查准率的新认识[J].西南民族大学学报（人文社会科学版）,2009,30(2):283-285. 被引量：16
2王细薇,樊兴华,赵军.一种基于特征扩展的中文短文本分类方法[J].计算机应用,2009,29(3):843-845. 被引量：36
3丁月华,文贵华,郭炜强.基于核向量空间模型的专利分类[J].华南理工大学学报（自然科学版）,2005,33(8):58-61. 被引量：12
4刘玉琴,赖院根,雷孝平.基于IPC知识结构的专利自动分类模型[J].小型微型计算机系统,2007,28(12):2295-2298. 被引量：14
5施聪莺,徐朝军,杨晓江.TFIDF算法研究综述[J].计算机应用,2009,29(B06):167-170. 被引量：224
6付继华,王建军,刘晓皙,庾露,吴荣辉.灾情数据自动获取的地震灾情信息系统[J].数据采集与处理,2009,24(B10):310-314. 被引量：7
7白仙富,李永强,陈建华,戴雨芡,曹刻,曹彦波,赵恒,龚强.地震应急现场信息分类初步研究[J].地震研究,2010,33(1):111-118. 被引量：35
8王盛,樊兴华,陈现麟.利用上下位关系的中文短文本分类[J].计算机应用,2010,30(3):603-606. 被引量：38
9林子雨,杨冬青,王腾蛟,张东站.基于关系数据库的关键词查询[J].软件学报,2010,21(10):2454-2476. 被引量：48
10梁凯利,吕金霞,王丽威,马小玲.专业分类表的编制修订初探--以《中国图书馆分类法·地震学专业分类表》为例[J].国家图书馆学刊,2011,20(2):31-33. 被引量：3

共引文献67

1羊勇全,孔德辉,徐瑜清,曹敏.中文文本中SDG交互关系抽取与可视化系统[J].现代测绘,2023,46(4):9-12.
2朱策,徐宏,弥云辉,杨宇,李映娇,杨仕琼.基于自然语言处理的大客户增值服务政策咨询机器人[J].能源与环保,2020,42(3):132-135. 被引量：2
3石凤贵.中文文本分词及其可视化技术研究[J].现代计算机,2020,26(12):131-138. 被引量：16
4韦人予.中文分词技术研究[J].信息与电脑,2020,32(10):26-29. 被引量：13
5孙庆阳,刘磊.探讨基于神经网络的商品评论情感分类[J].科学与信息化,2020(29):32-35.
6周达明,李黎.基于CNN-BiGRU模型的操作票自动化校验方法[J].广东电力,2020,33(9):58-65. 被引量：7
7王彬,司杨涛,付军涛.基于改进的TF-IDF和贝叶斯算法的新闻分类[J].科技风,2020(31):9-10. 被引量：5
8廖祥宇,郑明辉,朱小强.基于Paillier公钥密码体制的低频分词密文索引方案[J].湖北民族大学学报（自然科学版）,2020,38(4):408-410. 被引量：1
9陈旭,张弛,刘千宽,彭业,周达明,甄家林.基于深度语义学习的智能录波器自配置方法[J].电力系统保护与控制,2021,49(2):179-187. 被引量：9
10杨柳,吴彦蓉.基于微信小程序的智能客服回复技术的研究与实现[J].太原师范学院学报（自然科学版）,2021,20(1):65-68. 被引量：2

同被引文献7

1祁小军,兰海翔,卢涵宇,丁蕾锭,薛安琪.贝叶斯、KNN和SVM算法在新闻文本分类中的对比研究[J].电脑知识与技术,2019,15(9):220-222. 被引量：11
2张超超,卢新明.基于FastText的新闻文本多分类研究[J].软件导刊,2020,19(3):44-47. 被引量：5
3王彬,司杨涛,付军涛.基于改进的TF-IDF和贝叶斯算法的新闻分类[J].科技风,2020(31):9-10. 被引量：5
4宋英华,吕龙,刘丹.基于组合深度学习模型的突发事件新闻识别与分类研究[J].情报学报,2021,40(2):145-151. 被引量：16
5付静,龚永罡,廉小亲,顾龙浩.基于BERT-LDA的新闻短文本分类方法[J].信息技术与信息化,2021(2):127-129. 被引量：16
6柳致远,范永胜,张万里,冯骥,李勇,黄靖.常见中文社交平台中网络欺凌语言的检测分析[J].西南师范大学学报（自然科学版）,2021,46(8):86-94. 被引量：3
7李明哲.基于Tor网站文本内容和特征的分类方法[J].网络安全技术与应用,2021(8):36-39. 被引量：4

引证文献1

1徐炜桢.贝叶斯、RidgeClassifier和fastText算法在匿名新闻文本分类中的对比研究[J].软件,2021,42(10):174-177.

1王萍.新媒体时代的地震新闻报道分析[J].视听,2020(2):207-208. 被引量：3
2何晶.娱乐新闻正能量传播的重要性及策略[J].传播力研究,2020,4(26):27-28.
3张小杰.社会新闻与财经新闻需要深度融合[J].青年记者,2020(35):56-57. 被引量：1
4赵萌.基于增量学习的图书文本分类方法[J].情报探索,2021(7):52-56. 被引量：3

现代信息科技

2021年第3期

浏览历史

内容加载中请稍等...

基于fastText的地震信息文本分类方法被引量：1

参考文献5

二级参考文献32

共引文献67

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于fastText的地震信息文本分类方法 被引量：1

参考文献5

二级参考文献32

共引文献67

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于fastText的地震信息文本分类方法被引量：1