期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于词素切分的低资源语言文本分类 被引量:1
1
作者 沙尔旦尔·帕尔哈提 木塔力甫·沙塔尔 +1 位作者 木江·亚森 阿布都热合曼·卡的尔 《计算机工程与设计》 北大核心 2025年第2期530-536,共7页
针对维-哈-柯等派生类低资源语言文本分类中特征空间维数巨增、特征提取效率低等问题,提出一种基于Bi-LSTM_CRF的词素切和基于Bi-LSTM_Attention的文本分类方法。对实验文本进行词素切分及词干提取以有效减少特征空间维数,采用BERT嵌入... 针对维-哈-柯等派生类低资源语言文本分类中特征空间维数巨增、特征提取效率低等问题,提出一种基于Bi-LSTM_CRF的词素切和基于Bi-LSTM_Attention的文本分类方法。对实验文本进行词素切分及词干提取以有效减少特征空间维数,采用BERT嵌入向量表示较好地保留文本语义信息。将Bi-LSTM与Attention机制结合构建文本分类模型,有效提取文本词干之间长距离依赖关系特征,以此提高维-哈-柯语文本分类的效果,分别得到了96.68%、96.72%和96.54%的分类准确率。实验结果表明,高效词素切分和嵌入向量表示方法能够提高维-哈-柯等低资源语言文本分类的效果。 展开更多
关键词 维-哈-柯语 词素切分 词干提取 词干嵌入向量 特征表示 神经网络 文本分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部