期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于松弛平方交叠率的分词词典无监督优选方法
1
作者 王琳 刘伍颖 《南京大学学报(自然科学版)》 北大核心 2025年第2期293-299,共7页
分词是自然语言处理中的一项基础研究.针对词典规模影响分词效果这个科学问题,提出了平方交叠率(SOR)和松弛平方交叠率(RSOR)两种新量度,并验证了其有效性.平方交叠率的数值是词典交叠率和语料交叠率的乘积,而松弛平方交叠率是无监督学... 分词是自然语言处理中的一项基础研究.针对词典规模影响分词效果这个科学问题,提出了平方交叠率(SOR)和松弛平方交叠率(RSOR)两种新量度,并验证了其有效性.平方交叠率的数值是词典交叠率和语料交叠率的乘积,而松弛平方交叠率是无监督学习下平方交叠率的松弛版本.这两种量度都反映了分词词典和待分词语料之间的适合程度.在越南语分词实验中的结果表明,基于松弛平方交叠率的无监督优选方法能在无需人工标注的前提下,选出最适合的越南语分词词典来达到最优的分词效果. 展开更多
关键词 松弛平方交叠率 平方 分词词典 无监督优选 越南语
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部