期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向新闻文本的汉藏新词抽取及分析
1
作者 庞仙 陈波 赵小兵 《北京大学学报(自然科学版)》 北大核心 2025年第1期45-52,共8页
提出一种有效的面向新闻文本的无监督新词抽取方法。该方法通过结合无监督的TopWORDS算法和分词工具PKUSEG,辅助启发式词语抽取方法,实现从汉文和藏文新闻文本中抽取年度新词,共抽取到2022年度汉文新词606个,藏文新词664个。该方法能够... 提出一种有效的面向新闻文本的无监督新词抽取方法。该方法通过结合无监督的TopWORDS算法和分词工具PKUSEG,辅助启发式词语抽取方法,实现从汉文和藏文新闻文本中抽取年度新词,共抽取到2022年度汉文新词606个,藏文新词664个。该方法能够减少人工筛选工作量,并显著地提高新词抽取的效率。与《中国语言生活状况报告2023》发布的2022年度汉文新词相比,该方法抽取的新词在数量和语种方面优势明显。此外,对汉文和藏文新词进行对齐,并从新词的发展和使用状况角度开展案例分析。 展开更多
关键词 新闻文本 汉文 藏文 新词抽取
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部