摘要
【目的】随着自动撰稿技术的发展和移动终端的普及,媒体新闻数据量呈现爆发式增长,给舆论研究人员和舆情监测工作带来了极大的挑战。针对海量新闻稿件的采集、筛选工作,仅依靠人工处理或简单的语义查询技术,已无法高效应对。【方法】文章利用模糊综合评判模型对新闻数据进行清洗的方法。【结果】得到有效减少数据处理总量和去除数据噪声的结果,进而形成适用于报业集团舆情数据的清洗规则库,并通过评判等级和隶属函数确定具体评级分数。【结论】最终得出有效提升舆情监测和处理效率的清洗方法。
出处
《中国传媒科技》
2022年第11期156-160,共5页
Media Science and Technology of China
作者简介
魏俊杰(1981-),男,广东惠州,高级工程师,研究方向:大数据技术与应用;何翼(1990-),女,湖南汨罗,中级软件设计,研究方向:信息安全;熊黄(1975-),男,湖北武汉,研究方向:云计算与存储;庄辉(1991-),男,广东揭阳,软件设计师,研究方向:软件工程。